Уведомления

Группа в Telegram: @pythonsu

#1 Март 27, 2014 15:32:52

ingfa_1981
Зарегистрирован: 2014-01-25
Сообщения: 200
Репутация: +  1  -
Профиль   Адрес электронной почты  

Как вытаскивать инфу из такого кода?

<div class="description_content active" data-prop="1">
<p>
<span>Состав: костюмный "креп стрейч" + шифон принт (ткань Италия).</span>
<span>Съемный пояс. Рост модели на фото 170 см. Длина изделия 95 см. </span>
<span>Размеры: 42-44 (M); 46-48 (L); 50-52 (XL).</span>
</p>
</div>
В одном месте так
В на другой странице по другому.

<div class="description_content active" data-prop="1">
<p>
<span>Состав: "шифон принт" + подкладка микромасло. Декорировано съемным поясом (пояс в комплекте). Длина изделия 95 см рост модели на фото 170 см. Размеры:42-44 (M); 46-48 (L); 50-52 (XL).</span>
</p>
</div>

Офлайн

#2 Март 27, 2014 15:57:52

noob_saibot
Зарегистрирован: 2013-09-11
Сообщения: 495
Репутация: +  20  -
Профиль   Отправить e-mail  

Как вытаскивать инфу из такого кода?

Так же как и тут:

# -*- coding: utf-8 -*-
from grab import Grab
g = Grab()
g.go("http://python.su/forum/topic/23801/")
for mel in g.doc.select("//div/div/div[4]/div/div/div[2]/div/div/pre"):
    print mel.text()
Лучше ссылку на сайт, который парсите, выложите

Офлайн

#3 Март 27, 2014 18:14:26

ingfa_1981
Зарегистрирован: 2014-01-25
Сообщения: 200
Репутация: +  1  -
Профиль   Адрес электронной почты  

Как вытаскивать инфу из такого кода?

Офлайн

#4 Март 27, 2014 18:35:23

noob_saibot
Зарегистрирован: 2013-09-11
Сообщения: 495
Репутация: +  20  -
Профиль   Отправить e-mail  

Как вытаскивать инфу из такого кода?

# -*- coding: utf-8 -*-
from grab import Grab
g = Grab()
g.go("http://medini-original.com/ru/product/plate_samanta_a2.html")
print g.doc.select("//div/div/div/section/div[2]/div[2]/div[2]/div[2]/div[2]/div[2]/div/p").text()
Этим кодом вы выводите весь текст под тегом ….<p> и не важно сколько там <span>.


Ps. Проверил на всех платьях))

Pss. Ну вот, запалил пароль((

Отредактировано noob_saibot (Март 27, 2014 18:44:31)

Офлайн

#5 Март 27, 2014 19:01:28

ingfa_1981
Зарегистрирован: 2014-01-25
Сообщения: 200
Репутация: +  1  -
Профиль   Адрес электронной почты  

Как вытаскивать инфу из такого кода?

Вообще задачу я себе поставил сделать автоматический обход страниц. Сохранение фоток в папки. К каждой фотке в отдельной папке текстовый документ с названием платья, описанием, размерами, ценой в гривнах переведенных в рубли.

Вот это был бы для меня классный пример.



Офлайн

#6 Март 27, 2014 19:24:57

noob_saibot
Зарегистрирован: 2013-09-11
Сообщения: 495
Репутация: +  20  -
Профиль   Отправить e-mail  

Как вытаскивать инфу из такого кода?

Да, это был бы классный пример…)))))

Отредактировано noob_saibot (Март 27, 2014 19:25:09)

Офлайн

#7 Март 27, 2014 19:30:49

ingfa_1981
Зарегистрирован: 2014-01-25
Сообщения: 200
Репутация: +  1  -
Профиль   Адрес электронной почты  

Как вытаскивать инфу из такого кода?

http://habrahabr.ru/post/173509/ по этой ссылке я смогу научиться?

Офлайн

#8 Март 27, 2014 19:44:03

noob_saibot
Зарегистрирован: 2013-09-11
Сообщения: 495
Репутация: +  20  -
Профиль   Отправить e-mail  

Как вытаскивать инфу из такого кода?

Да. Ещё вот такая полезная ссылка. Ну и задавайте вопросы, если уже ничего не помогает))

Офлайн

#9 Март 27, 2014 19:58:49

py.user.next
От:
Зарегистрирован: 2010-04-29
Сообщения: 10016
Репутация: +  857  -
Профиль   Отправить e-mail  

Как вытаскивать инфу из такого кода?

ingfa_1981
Как вытаскивать инфу из такого кода?
сначала определить алгоритм

ingfa_1981
В одном месте так
В на другой странице по другому.
когда не знаешь, как делать, проанализируй, как делаешь сам, вручную
как ты сам определяешь, где там какие части ?
вот это и заложи в алгоритм

когда алгоритм готов, можно его реализовывать каким-нибудь из способов



Офлайн

#10 Март 27, 2014 22:11:33

ingfa_1981
Зарегистрирован: 2014-01-25
Сообщения: 200
Репутация: +  1  -
Профиль   Адрес электронной почты  

Как вытаскивать инфу из такого кода?

div/div/div/section/div/div/div/div/div/div/div/p

а как посчитать все эти div section и p?

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version