Найти - Пользователи
Полная версия: Парсинг конкретных строк из json
Начало » Центр помощи » Парсинг конкретных строк из json
1 2
KyleshiK
Добрые вечер.
Есть плейлист 91.92.66.82/trash/ttv-list/ttv.json
нужно вытаскивать конкретные каналы, парсинг на питоне делают через етот файл github.com/pepsik-kiev/HTTPAceProxy/blob/master/plugins/torrenttelik_plugin.py
Буду благодарен если тыкнете пальцем в какой кусок кода мне указать список «name» каналов которые нужны только мне?
py.user.next
Выложи сюда файл в JSON. Напиши, что именно надо оттуда достать.
KyleshiK
Мне нужны строчки с каналами TV 1000, ViP Comedy, Vip Premiere и еще некоторые.
Суть в чем, те кто вылаживают этот файл, меняют “url” раз в сутки, мне надо както брать у них эти строчки уже с новыми url, но мне не нужно все эти каналы.
Есть 2 варианта, лучше б конечно подправить тот питон что выше в сообщении, что б он вытягивал определенные каналы, или наоборот не вытягивал, то что мне не нужно, или вариант второй что б я какимто скриптом вытягивал эти строчки в свой json файл в dropbox уже с нужными ссылками, а дальше я уже буду с него доставать.
FishHook
KyleshiK
вылаживают этот файл
ух ты!!!
KyleshiK
FishHook
мм, я где то не так выразился?) не серчайте)
py.user.next
Находит заданные каналы из списка каналов в файле в JSON-формате и
сохраняет их в отдельный файл в JSON-формате.
KyleshiK
py.user.next
Находит заданные каналы из списка каналов в файле в JSON-формате исохраняет их в отдельный файл в JSON-формате.
Cool, спасибо огромное.
KyleshiK
py.user.next
Находит заданные каналы из списка каналов в файле в JSON-формате исохраняет их в отдельный файл в JSON-формате.
а этот скрипт может брать “in.json” отсюда? http://91.92.66.82/trash/ttv-list/ttv.json
просто менял in.json на http://91.92.66.82/trash/ttv-list/ttv.json не работает…
если нужно переделывать, то не заморачивайтесь, буду вручную качать.
py.user.next
KyleshiK
а этот скрипт может брать “in.json” отсюда?
Ты можешь рядом написать второй скрипт, который только скачивает и сохраняет файл под именем in.json.
Потом просто запускаешь скрипт скачивания и за ним скрипт парсинга.

Почему надо так разделять скрипты? Потому что не всегда тебе нужно распарсить то, что нужно сначала скачать, иногда оно уже у тебя есть скачанное. Иногда нужно этот список просто скачать и не парсить его или парсить другим парсером по другому принципу.
Когда у тебя скрипты разделены, ты можешь иметь несколько разных скачивальщиков и несколько разных парсеров одновременно. И такие парсеры ты можешь применять вообще друг за другом. Кроме парсеров у тебя ещё могут быть отправляльщики или сохраняльщики в базы данных.

Цепочка скриптов может быть, например: скачивальщик -> парсер1 -> парсер2 -> сохраняльщик в базу -> парсер3 -> закачивальщик.

То есть в такой цепочке ты получаешь список, потом парсишь его одним парсером и получаешь результат, который передаёшь на второй парсер и получаешь результат, который сохраняешь в базу и получаешь ответ от базы, который ты парсишь и получаешь результат, который ты отправляешь на сайт.

Это конвейер. И ты его можешь строить по-разному. Ты можешь парсеры менять местами, действия менять местами. Такое возможно только тогда, когда у тебя скрипты разделены на независимые программы, которые не знают, что и откуда приходит и что и куда дальше отправляется.
KyleshiK
тоже верно, спасибо..
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB