Найти - Пользователи
Полная версия: Помогите с задачей для Web поиска
Начало » Python для новичков » Помогите с задачей для Web поиска
1
isd2020
Добрый день, такая задача:

Нужно определить встречается ли определенное слово, заданное пользователей на заданной странице (Пусть будет bbc.com).

Если есть - ответ Да и количесво раз, если нет - Нет

Будет здорово если кто-нибудь поделится примером скрипта.

Спасибо.
py.user.next
Надо скачать с сайта текст и в скачанном тексте искать слово. Скачать текст с сайта не всегда просто, потому что бывает, что текст догружается браузером, который загружает скрипты с сайта, которые при выполнении и заполняют окно браузера текстом.

А когда текст есть, можно анализировать его дальше.

Посчитать в нём количество вхождений можно примитивно
  
>>> 'abcdefabcghi'.count('abc')
2
>>>
Слова он не будет обнаруживать как единицы.

Посчитать в нём количество вхождений можно более точно
  
>>> import re
>>> 
>>> re.findall(r'\babc\b', 'abcdef abc ghiabc hij abc jkl')
['abc', 'abc']
>>> len(re.findall(r'\babc\b', 'abcdef abc ghiabc hij abc jkl'))
2
>>>
Тут он определяет именно слова, а не просто вхождения.

Можно и ещё умнее посчитать слова, но для этого надо разложить текст на лексемы с помощью алгоритма.

isd2020
Пусть будет bbc.com
Все сайты разные. Где-то можно напрямую текст скачать, а где-то надо загружать текст оттуда, откуда загружают его скрипты сайта, а где-то и это не поможет и надо ещё больше погружаться в процесс загрузки, эмулировать браузер.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB