Уведомления

Группа в Telegram: @pythonsu

#1 Дек. 4, 2011 20:00:30

Madcap
От:
Зарегистрирован: 2011-12-04
Сообщения: 10
Репутация: +  0  -
Профиль   Отправить e-mail  

Поиск подстроки в тексте

С помощью urllib2 стянул html код в переменную, теперь мне нужно найти комментарий пользователя в той html. Как мне найти этот комментарий и положить в другую переменную, если он находится между тегами <span></span>? В смысле как мне дернуть тот самый текст начинающийся сразу после <span> и заканчивающийся до </span>. Заранее спасибо.



Офлайн

#2 Дек. 4, 2011 22:30:37

Madcap
От:
Зарегистрирован: 2011-12-04
Сообщения: 10
Репутация: +  0  -
Профиль   Отправить e-mail  

Поиск подстроки в тексте

попробовал так (работает):

myString = 'Hello there madcap !'
mySubString = myString[myString.find("there")+5:myString.find("!")]
print mySubString
А вот так нет (( почему ?

#!/usr/bin/python
# -*- coding: cp1251 -*-

import urllib2
request = 'http://maps.google.ru/maps/place?cid=7510474565088668412&q=%D1%8F%D0%BA%D0%B8%D1%82%D0%BE%D1%80%D0%B8%D1%8F,+%D1%89%D0%B5%D0%BB%D0%BA%D0%BE%D0%B2%D1%81%D0%BA%D0%BE%D0%B5+%D1%88%D0%BE%D1%81%D1%81%D0%B5+68&hl=ru&ie=UTF8&ll=55.813279,37.797496&spn=0.000012,0.000021&t=m&z=16&vpsrc=0'
response = urllib2.urlopen(request)
htmlcontent = response.read()

comment = htmlcontent[htmlcontent.find("readonly-first-n"+2:htmlcontent.find("<")]

print comment



Офлайн

#3 Дек. 5, 2011 01:03:29

py.user.next
От:
Зарегистрирован: 2010-04-29
Сообщения: 9897
Репутация: +  855  -
Профиль   Отправить e-mail  

Поиск подстроки в тексте

с помощью модуля htmllib можно точно определить



Отредактировано (Дек. 5, 2011 01:05:27)

Офлайн

#4 Дек. 5, 2011 10:23:35

Madcap
От:
Зарегистрирован: 2011-12-04
Сообщения: 10
Репутация: +  0  -
Профиль   Отправить e-mail  

Поиск подстроки в тексте

Там синтаксическая ошибка была, нашёл, исправил… но все равно ниче не находит. Решил использовать BeautifulSoup. Подскажите как можно реализовать следующее: пробежались по переменной, содержащей код страницы, выдернули все что находилось между тегами <span>чойтотам</span> и положили в массив.



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version