Найти - Пользователи
Полная версия: Проверка инфы из MySQL
Начало » Python для новичков » Проверка инфы из MySQL
1
philips2009
Здравствуйте дорогие форумчане!
Создал скрипт для паркинга информации с сайта объявлений с последующей записью в бд MySQL на локальном ПК. Прицип таков:
1. загрузка всех записанных ссылок объявлений из бд MySQL в питоновский список (checked_urls)
2. загрузка всех уникальных ссылок объявлений с сайта в питоновский список (unchecked_urls)
if url not in checked_urls:
unchecked_urls.append(url)
3. сам парсинг инфы с каждой ссылки (объявления) из unchecked_urls и запись в бд.

По ходу создания заметил что есть случаи одна и та же ссылка но информация другая или кое что добавлено или изменено, то есть пользователь не создал новое объявление а изменил старое. Появилась необходимость проверки состава записанного объявления из бд с тем что на сайте. В этом у меня проблема, помогите пожалуйста.
Заранее благодарю.
py.user.next
philips2009
Появилась необходимость проверки состава записанного объявления из бд с тем что на сайте. В этом у меня проблема, помогите пожалуйста.
Нужно сделать хеш содержимого для каждой ссылки. Хеши хранишь в БД. При взятии содержимого с сайта ты делаешь его хеш и сравниваешь с хешем из БД. Если хеши не равны, надо пересохранить содержимое. Почему хеши делать, а не сразу сравнивать - потому что хеши короткие и быстрее читаются с базы. Если содержимое будет равно мегабайту, то его хеш всё равно будет равен нескольким байтам.
philips2009
Благодарю за дельный совет
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB