Уведомления

Группа в Telegram: @pythonsu

#1 Фев. 12, 2016 10:07:22

DimWin
Зарегистрирован: 2016-02-12
Сообщения: 2
Репутация: +  0  -
Профиль   Отправить e-mail  

задание из Coursera (BeautifulSoup)

Всем доброго дня,

Ребята, очень нужна ваша помощь в решении задания из курса “Using Python to Access Web Data”. Вроде неплохо шел по всем курсам, но здесь капитально застрял, не получается написать код парсера.
само задание:

вот ссылка для проверки кода: https://pr4e.dr-chuck.com/tsugi/mod/python-data/data/known_by_Fikret.html
результат последовательного перехода по ссылкам:
Sequence of names: Fikret Montgomery Mhairade Butchi Anayah
то что должно получиться в итоге:
Last name in sequence: Anayah

Отредактировано DimWin (Фев. 12, 2016 19:56:10)

Офлайн

#2 Фев. 12, 2016 12:25:24

neri
Зарегистрирован: 2015-04-22
Сообщения: 17
Репутация: +  0  -
Профиль   Отправить e-mail  

задание из Coursera (BeautifulSoup)

Там же есть форум. Почитайте что там пишут, задайте сами вопрос про то что непонятно.
Просто какой смысл если кто-то сделает это задание за вас?

Офлайн

#3 Фев. 12, 2016 20:02:01

DimWin
Зарегистрирован: 2016-02-12
Сообщения: 2
Репутация: +  0  -
Профиль   Отправить e-mail  

задание из Coursera (BeautifulSoup)

Ветку форума там прочитал полностью, извращаюсь с кодом

import urllib
import json
import ssl
from BeautifulSoup import *
url = 'https://pr4e.dr-chuck.com/tsugi/mod/python-data/data/known_by_Sadie.html'
count = int(raw_input('Enter Count: '))
pos = int(raw_input('Enter Position: '))-1
x = 0
while x != count:
    scontext = ssl.SSLContext(ssl.PROTOCOL_TLSv1)
    uh = urllib.urlopen(url, context=scontext)
    data = uh.read()
    soup = BeautifulSoup(data)
    tags = soup('a')
    z = tags[pos]
    url = z.get('href',None)
    print url
    x = x + 1
    if x == count:
        print z.contents[0]
Ок. Понял. Вопрос снят

Отредактировано DimWin (Фев. 13, 2016 19:42:25)

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version