Форум сайта python.su
0
py.user.next, спасибо.
Я во второй версии программы обязательно воспользуюсь lxml.html. Но пока так все работает.
Подскажите, пожалуйста, вот что:
1. Как удалить вообще все после первой встречи словосочетания “К содержанию”? Вот так я удаляю до, а как развернуть. не могу сообразить.
s=s[s.find('К содержанию')+1:]
Отредактировано Kir@ (Сен. 9, 2015 12:30:40)
Офлайн
0
2. Как правильно написать вот эту конструкцию:
site=re.search(r'Сайт:', full)
если поиск успешен то
print ('Сайт: ‘,site.group(1))
иначе
print (’Сайт: данных нет')
Отредактировано Kir@ (Сен. 9, 2015 12:31:40)
Офлайн
3
Kir@
Открой для сбя BeautifulSoup http://wiki.python.su/Документации/BeautifulSoup
ИМХО это то, что тебе нужно.
ЗЫ. форум портит ссылки с русскими буквами. Не кликай, а скопируй и вставь в браузер.
Отредактировано Iskatel (Сен. 9, 2015 12:44:15)
Офлайн
0
IskatelIskatel, то, что мне нужно, содержится в двух моих предыдущих сообщениях
ИМХО это то, что тебе нужно.
Офлайн
3
Kir@
As you wish
Офлайн
857
Kir@А как ты узнал, что слово Сайт находится в тексте <td> а не в атрибуте
Но пока так все работает.
<img title="Сайт">
<a href="http://www.site.com">abc</a>
IskatelОно не очень развивается.
Открой для сбя BeautifulSoup
Отредактировано py.user.next (Сен. 9, 2015 12:49:52)
Офлайн
0
py.user.nextЭто специфика страницы, парсинг которой я осуществляю. К моему счастью, выгружаемые оттуда страницы имеют стандартный вид и отличаются только наличием или отсутствием таблиц.
А как ты узнал, что слово Сайт находится в тексте <td> а не в атрибуте
Отредактировано Kir@ (Сен. 9, 2015 12:55:41)
Офлайн
0
Первый вопрос победил.
Помогите, пожалуйста, со вторым. Как правильно написать вот эту конструкцию?
site=re.search(r'паттерн', full)
если поиск успешен то
print ('паттерн‘,паттерн.group(1))
иначе
print (’паттерн: данных нет')
Офлайн
253
Kir@
Первый вопрос победил.Помогите, пожалуйста, со вторым.
site=re.search(r'паттерн', full) if site: #если поиск успешен то print ('паттерн‘,паттерн.group(1)) else: #иначе print (’паттерн: данных нет')
Офлайн
0
doza_andДа, автором он назван в честь цирка Монти Пайтон, почитателем которого он является
Вы вообще хоть что-то про язык на котором пишете знаете?
Офлайн