Уведомления

Группа в Telegram: @pythonsu
  • Начало
  • » Python для новичков
  • » Как лучше реализовать указанную ниже задачу: путём написания парсера или расширения для браузера? [RSS Feed]

#1 Июль 17, 2016 10:28:51

spacesnake
Зарегистрирован: 2016-07-17
Сообщения: 9
Репутация: +  0  -
Профиль   Отправить e-mail  

Как лучше реализовать указанную ниже задачу: путём написания парсера или расширения для браузера?

Доброго времени суток! Прошу дать совет:
Цель кратко: автоматизировать процесс копирования текста и картинок из уже открытых в Firefox вкладок с новостными статьями нескольких заданных сайтов в ворд-документ (желательно, с возможность выбора нужного места в ворд-документе).
Подробнее:
1. Например, запущен Firefox, в котором открыто 50 вкладок с новостными статьями десяти заданных сайтов.
2. Парсер (или расширение для firefox) берёт первую вкладку, копирует название статьи, автора (если есть), основной текст и картинки (если есть).
3. А потом всё это автоматически вставляет в ворд-документ. Желательно, с возможность выбора нужного места в ворд-документе, куда надо эту новость вставить: например, вылезает менюшка, где на выбор три раздела: финансы, экономика, политика. Щёлкаем по нужному пункту меню, и новость вставляется в ворд-документ в нужном месте.
4. Затем, автоматически закрывает первую вкладку и переходит к следующей… Вторая скопированная новость вставляется в выбранный раздел чуть ниже первой новости.
5. И так далее, пока не закончатся открытые вкладки в браузере.

Собственно вопрос:
1. напишите, как проще это всё реализовать.
2. что для этого нужно знать, если у меня знаний нет, а желание - есть (Надо знать: HTML, CSS, Javascript, python? Что еще?)
3. Если можно - по пунктам: п.1 - изучить то-то; п.2 - изучить это и т.д.

Офлайн

#2 Июль 17, 2016 12:09:13

py.user.next
От:
Зарегистрирован: 2010-04-29
Сообщения: 10010
Репутация: +  857  -
Профиль   Отправить e-mail  

Как лучше реализовать указанную ниже задачу: путём написания парсера или расширения для браузера?

spacesnake
Цель кратко: автоматизировать процесс копирования текста и картинок из уже открытых в Firefox вкладок с новостными статьями нескольких заданных сайтов в ворд-документ (желательно, с возможность выбора нужного места в ворд-документе).
Это всё сложно. Вряд ли напишешь. Пользоваться-то просто и выглядит просто, а чтобы написать - это дофига надо знать.

https://developer.mozilla.org/en-US/Add-ons

Вот, например, вопрос: а что если открыта вкладка с настройками браузера? там этот плагин тоже будет предлагать что-то сохранять? То есть надо определять, что за вкладки, а для этого надо делать критерии, по которым распознавать вкладку, подходящую для сохранения данных из неё. Таких неявных вещей всегда множество и все их надо разрешить, чтобы программа работала надёжно.

Технически не потянешь (надо знать Javascript), алгоритмически не потянешь (надо уметь разрабатывать алгоритмы со всеми неявными ходами), да и просто окажется, что затраченные усилия не стоят самой программы (сменишь браузер и что?).

Сфокусируйся даже не на ворде, а на простом сохранении текста из вкладки в текстовый файл на диске. Наверняка даже с этим не справишься.



Отредактировано py.user.next (Июль 17, 2016 12:12:46)

Офлайн

#3 Июль 17, 2016 13:57:07

doza_and
От:
Зарегистрирован: 2010-08-15
Сообщения: 4138
Репутация: +  253  -
Профиль   Отправить e-mail  

Как лучше реализовать указанную ниже задачу: путём написания парсера или расширения для браузера?

spacesnake
что для этого нужно знать
Как ни странно, главное знать чего хотите. Вроде вы и нормально все описали, но остались непонятки зачем это надо, которые и определят что вам надо изучать.
Если вы хотите увидеть новости, ну так fierfox достаточно, он историю сохранит.
Если вы хотите иметь заранее определенные наборы страниц, тоже в чем проблема?
Указываете в командном файле что грузить в командной строке:
chrome http://ya.ru http://google.com
Если вам надо смотреть это в offline то все уже давно сделано. Например:
http://www.tenmax.com/teleport/pro/home.htm
Пытаться запихать страницы Ворд… Думаю задача неразрешимая. Более ублюдочный формат трудно придумать. Этот вопрос специально исследовал, в конечном итоге от ворда вообще отказался (и это при требованиях заказчика выдачу делать ворде).
py.user.next
Это всё сложно. Вряд ли напишешь.
я не так пессимистичен. получится. Только надо четко представить какую задачу будет решать данный инструмент.



Отредактировано doza_and (Июль 17, 2016 14:05:13)

Офлайн

#4 Июль 26, 2016 19:35:43

spacesnake
Зарегистрирован: 2016-07-17
Сообщения: 9
Репутация: +  0  -
Профиль   Отправить e-mail  

Как лучше реализовать указанную ниже задачу: путём написания парсера или расширения для браузера?

py.user.next:
1. спасибо за надежду
2.

py.user.next
Технически не потянешь (надо знать Javascript)
А что сложного в том, чтобы изучить Javascript? В наше время есть куча онлайн учебников на русском.
Я ведь не просил оценивать мои способности к обучению, а как раз просил указать, что ИЗУЧИТЬ, чтобы реализовать программу.
3.
py.user.next
алгоритмически не потянешь (надо уметь разрабатывать алгоритмы со всеми неявными ходами)
py.user.next
То есть надо определять, что за вкладки, а для этого надо делать критерии
py.user.next
Таких неявных вещей всегда множество и все их надо разрешить, чтобы программа работала надёжно
“Терпенье и труд - всё перетрут” (с)
“Волков боятся - в лес не ходить” (с)

doza_and -
doza_and
Если вы хотите увидеть новости, ну так fierfox достаточно, он историю сохранит.
Мне не нужна история в браузере. Мне нужны эти новости в текстовом формате, вставленные в Ворд.
doza_and
Если вы хотите иметь заранее определенные наборы страниц, тоже в чем проблема?
С этим проблем нет Мне нужны программа, автоматизирующая копирование новостей в Ворд
doza_and
Если вам надо смотреть это в offline то все уже давно сделано
Мне нужно смотреть эти новости оффлайн, но только скопированные в Ворд-файл.
doza_and
Пытаться запихать страницы Ворд… Думаю задача неразрешимая.
Спасибо за надежду
doza_and
Только надо четко представить какую задачу будет решать данный инструмент
я это представляю абсолютно чётко: копирование новостных статей, очистка от лишнего, вставка в Ворд.

Отредактировано spacesnake (Июль 26, 2016 19:53:51)

Офлайн

  • Начало
  • » Python для новичков
  • » Как лучше реализовать указанную ниже задачу: путём написания парсера или расширения для браузера?[RSS Feed]

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version