Уведомления

Группа в Telegram: @pythonsu

#1 Июль 27, 2019 13:42:59

ZiG
Зарегистрирован: 2018-12-16
Сообщения: 47
Репутация: +  0  -
Профиль   Отправить e-mail  

Рационально ли так сделать

Прошу сильно не пинать. Просто интересно мнение местных гуру!
Есть задача интереса, создать примерно 10 домашних ботов, которые ни яндекс, ни гугл не смогут засчитать за одного пользователя.
Решение задачи через VirtualBox… Пока не реализовал, пока думаю и прицениваюсь.
На основном компьютере использовать Python и библиотеку для работы с виртуальной машиной.
На виртуалке установить 10 ОС. В каждой из которых будет питон и скрипт на питоне + Selenium.

Т. е. На основном компе, скрипт на Python загружает вначале первую ОС на виртуалке. Загрузившись виртуалка, запускает автозагрузкой свой скрипт, где прописан смена IP, и заход на определенную страничку.
после выполнения. Основной скрипт, выключает ОС, и загружает вторую ОС, где происходит все так же… И так до конца.

Вопрос, насколько это рационально, и нет ли других способов. А так же есть ли камни об которые я могу споткнуться реализовывая данную задумку… Задумка ради практики.

Офлайн

#2 Июль 27, 2019 13:59:26

py.user.next
От:
Зарегистрирован: 2010-04-29
Сообщения: 10024
Репутация: +  857  -
Профиль   Отправить e-mail  

Рационально ли так сделать

Это получится всё напрасно. Они определяют не по тому, с какого ты компьютера заходишь или адреса. Они смотрят по поведению.
Ну типа как, если один человек каждый день ходит в один и тот же магазин, то, скорее всего, он живёт возле него. При этом не нужно знать его адрес, достаточно посмотреть его заходы и что он покупал. И это никак не поменяешь.



Офлайн

#3 Июль 27, 2019 14:12:32

ZiG
Зарегистрирован: 2018-12-16
Сообщения: 47
Репутация: +  0  -
Профиль   Отправить e-mail  

Рационально ли так сделать

py.user.next
Это получится всё напрасно. Они определяют не по тому, с какого ты компьютера заходишь или адреса. Они смотрят по поведению.
Ну типа как, если один человек каждый день ходит в один и тот же магазин, то, скорее всего, он живёт возле него. При этом не нужно знать его адрес, достаточно посмотреть его заходы и что он покупал. И это никак не поменяешь.
это понятно. но ведь можно добавить в скрипт, зайти на 4 сайта из списка, в котором 20 сайтов. Воспользоваться поисковиком яндек и найти рандомно что-то. Так же с гуглом. И совершать это так же каждый день.

Да и если это так как вы говорите, то по идее задача бы просто упростилась.
Можно было отказаться от виртуальной машины, а просто поустанавливать 10 портативных браузеров.
а потом через Selenium, использовать add_argument(“user-data-dir=Путь к профилю первого портативного браузера”)
в параметрах изменить разрешения экрана на всякий случай. И соответственно воспользоваться прокси.
Погулять по сайтам, а потом выполнить нужную цель. По идее все то же самое, только вместо ОС, у нас портативные версии браузеров. Что соответственно - минус время загрузки ОС на виртуалке. Я не спорю, интересно просто мнение.

Отредактировано ZiG (Июль 27, 2019 14:13:25)

Офлайн

#4 Июль 27, 2019 16:38:54

PEHDOM
Зарегистрирован: 2016-11-28
Сообщения: 2196
Репутация: +  294  -
Профиль   Отправить e-mail  

Рационально ли так сделать

ZiG для начала, я бы на вашем месте подумал , а как гугл или яндекс определяет ботов?
вот небольшая статья для затравки:
https://www.seonews.ru/analytics/kak-poiskovyie-sistemyi-otlichayut-zaprosyi-polzovateley-i-botov/
Это далеко не полная информация, а только малая часть ее. Там на самом деле очень много критериев, например банальная версия браузера, если сейчас актуальна версия браузера firefox 68, то пользователь заходящий с браузера верии 30 с вероятностью 90% бот.
сооотвевенно смотрите , думйте, ищите побликации по теме и только тогд.а делайте.
ЗЫ по поводу виртуалок, это действительно лишнее. Вобщем то можно обойтись даже без использвания портативных версий браузеров.



==============================
Помещайте код в теги:
[code python][/code]
Бериегите свое и чужое время.

Офлайн

#5 Июль 28, 2019 22:04:37

ZiG
Зарегистрирован: 2018-12-16
Сообщения: 47
Репутация: +  0  -
Профиль   Отправить e-mail  

Рационально ли так сделать

PEHDOM
ZiG для начала, я бы на вашем месте подумал , а как гугл или яндекс определяет ботов?вот небольшая статья для затравки:https://www.seonews.ru/analytics/kak-poiskovyie-sistemyi-otlichayut-zaprosyi-polzovateley-i-botov/Это далеко не полная информация, а только малая часть ее. Там на самом деле очень много критериев, например банальная версия браузера, если сейчас актуальна версия браузера firefox 68, то пользователь заходящий с браузера верии 30 с вероятностью 90% бот.сооотвевенно смотрите , думйте, ищите побликации по теме и только тогд.а делайте.ЗЫ по поводу виртуалок, это действительно лишнее. Вобщем то можно обойтись даже без использвания портативных версий браузеров.

На самом деле все оказалось намного проще, чем я думал. Запарился с куками сегодня. С прокси и юзер агентом, быстро справился.

Да и с куками зря запаривался. Пробил их на яндексе, и узнавал что каждое значение означает… Ну может в будущем пригодится. Главное итог, яндекс считает просмотры. И вы были правы, обошелся без использования портативных версий.

Осталось все соединить в единый скрипт, добавить немного рандома.

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version