Есть питоновый код:
# -*- coding: utf-8 -*-
__author__ = 'Егор'
import urllib2
from BeautifulSoup import BeautifulSoup
class ParsePage():
def __init__(self, link):
self.link = link
page = urllib2.urlopen(self.link)
soup = BeautifulSoup(page)
p = soup.findAll('strong')
print p[4].parent
print p[5].parent.nextSibling
ex = ParsePage('http://www.profvibor.ru/node/1778')
Нужный кусок html:
<p><strong><font color="#009933" size="3">Пути получения профессии</font></strong></p> <p>ВУЗы.</p> <p><strong><font color="#009933" size="3">Родственные профессии</font></strong></p> <p>Маркетолог-аналитик, экономист.</p>
Вывод:
C:\Python27\python.exe C:/Users/Егор/PycharmProjects/test_parser/temp.py
<p><strong><font color="#009933" size="3">Пути получения профессии</font></strong></p>
Process finished with exit code 0
print p.parent.nextSibling должен вывести
<p>Маркетолог-аналитик, экономист.</p>
Почему не выводит? :(