Найти - Пользователи
Полная версия: Как вытаскивать инфу из такого кода?
Начало » Python для новичков » Как вытаскивать инфу из такого кода?
1 2
ingfa_1981
<div class="description_content active" data-prop="1">
<p>
<span>Состав: костюмный "креп стрейч" + шифон принт (ткань Италия).</span>
<span>Съемный пояс. Рост модели на фото 170 см. Длина изделия 95 см. </span>
<span>Размеры: 42-44 (M); 46-48 (L); 50-52 (XL).</span>
</p>
</div>
В одном месте так
В на другой странице по другому.

<div class="description_content active" data-prop="1">
<p>
<span>Состав: "шифон принт" + подкладка микромасло. Декорировано съемным поясом (пояс в комплекте). Длина изделия 95 см рост модели на фото 170 см. Размеры:42-44 (M); 46-48 (L); 50-52 (XL).</span>
</p>
</div>
noob_saibot
Так же как и тут:
# -*- coding: utf-8 -*-
from grab import Grab
g = Grab()
g.go("http://python.su/forum/topic/23801/")
for mel in g.doc.select("//div/div/div[4]/div/div/div[2]/div/div/pre"):
    print mel.text()
Лучше ссылку на сайт, который парсите, выложите
ingfa_1981
ссылка вот http://medini-original.com/ru/product/plate_samanta_a3.html
noob_saibot
# -*- coding: utf-8 -*-
from grab import Grab
g = Grab()
g.go("http://medini-original.com/ru/product/plate_samanta_a2.html")
print g.doc.select("//div/div/div/section/div[2]/div[2]/div[2]/div[2]/div[2]/div[2]/div/p").text()
Этим кодом вы выводите весь текст под тегом ….<p> и не важно сколько там <span>.


Ps. Проверил на всех платьях))

Pss. Ну вот, запалил пароль((
ingfa_1981
Вообще задачу я себе поставил сделать автоматический обход страниц. Сохранение фоток в папки. К каждой фотке в отдельной папке текстовый документ с названием платья, описанием, размерами, ценой в гривнах переведенных в рубли.

Вот это был бы для меня классный пример.



noob_saibot
Да, это был бы классный пример…)))))
ingfa_1981
http://habrahabr.ru/post/173509/ по этой ссылке я смогу научиться?
noob_saibot
Да. Ещё вот такая полезная ссылка. Ну и задавайте вопросы, если уже ничего не помогает))
py.user.next
ingfa_1981
Как вытаскивать инфу из такого кода?
сначала определить алгоритм

ingfa_1981
В одном месте так
В на другой странице по другому.
когда не знаешь, как делать, проанализируй, как делаешь сам, вручную
как ты сам определяешь, где там какие части ?
вот это и заложи в алгоритм

когда алгоритм готов, можно его реализовывать каким-нибудь из способов
ingfa_1981
div/div/div/section/div/div/div/div/div/div/div/p

а как посчитать все эти div section и p?
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB