Уведомления

Группа в Telegram: @pythonsu

#1 Сен. 9, 2015 12:30:28

Kir@
Зарегистрирован: 2015-08-13
Сообщения: 124
Репутация: +  0  -
Профиль   Отправить e-mail  

python 3.5.0a1 + regex + обработка исключений

py.user.next, спасибо.
Я во второй версии программы обязательно воспользуюсь lxml.html. Но пока так все работает.

Подскажите, пожалуйста, вот что:
1. Как удалить вообще все после первой встречи словосочетания “К содержанию”? Вот так я удаляю до, а как развернуть. не могу сообразить.

s=s[s.find('К содержанию')+1:]

Отредактировано Kir@ (Сен. 9, 2015 12:30:40)

Офлайн

#2 Сен. 9, 2015 12:31:08

Kir@
Зарегистрирован: 2015-08-13
Сообщения: 124
Репутация: +  0  -
Профиль   Отправить e-mail  

python 3.5.0a1 + regex + обработка исключений

2. Как правильно написать вот эту конструкцию:
site=re.search(r'Сайт:', full)
если поиск успешен то
print ('Сайт: ‘,site.group(1))
иначе
print (’Сайт: данных нет')

Отредактировано Kir@ (Сен. 9, 2015 12:31:40)

Офлайн

#3 Сен. 9, 2015 12:40:14

Iskatel
Зарегистрирован: 2015-07-29
Сообщения: 291
Репутация: +  3  -
Профиль   Отправить e-mail  

python 3.5.0a1 + regex + обработка исключений

Kir@
Открой для сбя BeautifulSoup http://wiki.python.su/Документации/BeautifulSoup

ИМХО это то, что тебе нужно.

ЗЫ. форум портит ссылки с русскими буквами. Не кликай, а скопируй и вставь в браузер.

Отредактировано Iskatel (Сен. 9, 2015 12:44:15)

Офлайн

#4 Сен. 9, 2015 12:44:20

Kir@
Зарегистрирован: 2015-08-13
Сообщения: 124
Репутация: +  0  -
Профиль   Отправить e-mail  

python 3.5.0a1 + regex + обработка исключений

Iskatel
ИМХО это то, что тебе нужно.
Iskatel, то, что мне нужно, содержится в двух моих предыдущих сообщениях

Офлайн

#5 Сен. 9, 2015 12:46:03

Iskatel
Зарегистрирован: 2015-07-29
Сообщения: 291
Репутация: +  3  -
Профиль   Отправить e-mail  

python 3.5.0a1 + regex + обработка исключений

Kir@
As you wish

Офлайн

#6 Сен. 9, 2015 12:48:20

py.user.next
От:
Зарегистрирован: 2010-04-29
Сообщения: 10016
Репутация: +  857  -
Профиль   Отправить e-mail  

python 3.5.0a1 + regex + обработка исключений

Kir@
Но пока так все работает.
А как ты узнал, что слово Сайт находится в тексте <td> а не в атрибуте
<img title="Сайт">
?

То же самое и со ссылками, они могут быть не только в содержимом тегов, но и в атрибутах навроде
<a href="http://www.site.com">abc</a>

Iskatel
Открой для сбя BeautifulSoup
Оно не очень развивается.



Отредактировано py.user.next (Сен. 9, 2015 12:49:52)

Офлайн

#7 Сен. 9, 2015 12:55:18

Kir@
Зарегистрирован: 2015-08-13
Сообщения: 124
Репутация: +  0  -
Профиль   Отправить e-mail  

python 3.5.0a1 + regex + обработка исключений

py.user.next
А как ты узнал, что слово Сайт находится в тексте <td> а не в атрибуте
Это специфика страницы, парсинг которой я осуществляю. К моему счастью, выгружаемые оттуда страницы имеют стандартный вид и отличаются только наличием или отсутствием таблиц.
Ну и еще количеством строк в этих таблицах, почему я и спрашиваю про обработку исключений.

Отредактировано Kir@ (Сен. 9, 2015 12:55:41)

Офлайн

#8 Сен. 9, 2015 14:15:51

Kir@
Зарегистрирован: 2015-08-13
Сообщения: 124
Репутация: +  0  -
Профиль   Отправить e-mail  

python 3.5.0a1 + regex + обработка исключений

Первый вопрос победил.
Помогите, пожалуйста, со вторым. Как правильно написать вот эту конструкцию?

site=re.search(r'паттерн', full)
если поиск успешен то
print ('паттерн‘,паттерн.group(1))
иначе
print (’паттерн: данных нет')

Офлайн

#9 Сен. 9, 2015 20:28:42

doza_and
От:
Зарегистрирован: 2010-08-15
Сообщения: 4138
Репутация: +  253  -
Профиль   Отправить e-mail  

python 3.5.0a1 + regex + обработка исключений

Kir@
Первый вопрос победил.Помогите, пожалуйста, со вторым.
site=re.search(r'паттерн', full) 
if site: #если поиск успешен то
    print ('паттерн‘,паттерн.group(1))
else: #иначе 
    print (’паттерн: данных нет')
Вы вообще хоть что-то про язык на котором пишете знаете? Помогает почитать учебник



Офлайн

#10 Сен. 10, 2015 04:44:06

Kir@
Зарегистрирован: 2015-08-13
Сообщения: 124
Репутация: +  0  -
Профиль   Отправить e-mail  

python 3.5.0a1 + regex + обработка исключений

doza_and
Вы вообще хоть что-то про язык на котором пишете знаете?
Да, автором он назван в честь цирка Монти Пайтон, почитателем которого он является

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version