Уведомления

Группа в Telegram: @pythonsu

#1 Окт. 28, 2010 10:14:38

Carzil
От:
Зарегистрирован: 2010-05-26
Сообщения: 106
Репутация: +  0  -
Профиль   Отправить e-mail  

Все слова из html

Нужно делать так:

#! /usr/bin/python
for line in re.findall('\>([^(<script>)<>\n]+)\<', html):
line = line.strip()
if line:
print '\n'.join(line.split())



Отредактировано (Окт. 28, 2010 10:15:14)

Офлайн

#2 Окт. 28, 2010 10:16:38

Александр Кошелев
От: Москва
Зарегистрирован: 2007-02-03
Сообщения: 1724
Репутация: +  2  -
Профиль   Отправить e-mail  

Все слова из html

Carzil
Добрый день, уважаемые форумчане!
Rditorial: если бы вы действительно уважали форумчан, то не называли бы тему “все слова!”.



Офлайн

#3 Окт. 28, 2010 14:17:45

o7412369815963
От:
Зарегистрирован: 2009-06-17
Сообщения: 1986
Репутация: +  32  -
Профиль   Отправить e-mail  

Все слова из html

Carzil
А мне нужно без JavaScript!!!
А это уже совсем другое условие.

Офлайн

#4 Ноя. 13, 2012 13:43:56

adw0rd
От: Санкт-Петербург
Зарегистрирован: 2012-07-28
Сообщения: 107
Репутация: +  8  -
Профиль   Отправить e-mail  

Все слова из html

Человеку нужен был strip_tags?

from w3lib.html import remove_tags
print remove_tags(html_content)




Python, Django, Flask, Git, Emacs, Nginx, MySQL, SphinxSearch, Redis, Linux, FreeBSD
Мой блог, я на GitHub

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version