Форум сайта python.su
Собираем ссылки с словом “word” внутри url:
soup = BeautifulSoup.BeautifulSoup(html)
urls = [tag['href'] for tag in soup.findAll('a')]
f = lambda x: True if (x[:4] == "word") else False
print filter(f, urls)
Офлайн
py.websможет там не только ссылки, но и <a name
Причина второй не ясна. Сылки в скармливаемом супу ‘html’ есть.
Офлайн
Замени:
urls = [tag['href'] for tag in soup.findAll('a')]
urls = [tag.get('href') for tag in soup.findAll('a') if tag.get('href') != None]
Офлайн