DjangoBB LoFi version

Найти - Пользователи

Полная версия: Не работает парсер

Начало » Центр помощи » Не работает парсер

1 2 3 4

py.user.next

Фев. 26, 2017 02:00:33

Tenebras
в некоторых из nodes отсутствует некая информация и программа прерывается. Как это обойти?

Можно проверять через is None.

Tenebras

Фев. 26, 2017 03:26:12

Он выдаёт AttributeError.
Возможно как-то обрабатывать AttributeError?
is None сейчас попробую

Благодарю!

Tenebras

Фев. 28, 2017 18:39:10

Новая загвоздка. У меня в блоке встречается не редко по две-три строки <sky_condition … >
Обрабатывается только одна. Не пойму - как тут грамотно прикрутить цикл, что бы обрабатывало все строки.

 #!/usr/bin/env python
# coding:utf8
from lxml import etree
import urllib
url = 'https://aviationweather.gov/adds/dataserver_current/current/metars.cache.xml'
urllib.urlretrieve(url, filename='metar.xml')
tree = etree.parse('metar.xml') # Парсинг файла
block = tree.xpath('/response/data/METAR')
for bl in block:
	ikao = bl.find('station_id').text
	
	clouds = bl.find('sky_condition')
	if clouds is None:
		continue
		
	cloud = clouds.get('sky_cover')
	print ikao, cloud

Romissevd

Фев. 28, 2017 19:08:06

Не оно?

 clouds = bl.findall('sky_condition')
    if clouds is None:
        continue
    for c in clouds:
        cloud = c.get('sky_cover')
        print ikao, cloud

vic57

Фев. 28, 2017 19:51:44

 #...
for bl in block:
    ikao = bl.find('station_id').text
    clouds = bl.findall('sky_condition')
    out = []
    for i in clouds:
        out.append(i.get('sky_cover'))
    print ikao,' '.join(out)

Tenebras

Фев. 28, 2017 20:11:02

Уважаемый vic57, объясните мне, пожалуйста назначение

  ,' '.join(out)

Что это и откуда оно берётся.

Спасибо большое!!!

vic57

Фев. 28, 2017 20:24:41

 >>> l =['qwe','asd','dfg']
>>> l
['qwe', 'asd', 'dfg']
>>> ' '.join(l)
'qwe asd dfg'
>>> ':'.join(l)
'qwe:asd:dfg'
>>>

можешь проще

  #...
for bl in block:
    ikao = bl.find('station_id').text
    clouds = bl.findall('sky_condition')
    out = ''
    for i in clouds:
        out += i.get('sky_cover')+ ' '
    print ikao,out

Tenebras

Фев. 28, 2017 20:42:39

Кажется первый вариант более простой)))

Tenebras

Фев. 28, 2017 23:01:49

Не хочу ради такого простого вопроса создавать новую тему. Тем более оно имеет отношение к этой.
Я из xml беру время. Как мне его грамотно разбить?
Я делаю так:

 #...
time = '2017-02-28T20:55:00Z'
tim = time.split(r'T')
ti = tim[1].split(r':')
t = ti[0]+':'+ti[1]
print t

>>> 20:55

Вопрос в громоздкости. Можно ли как-то укротить? Я разбивал в два этапа. Сперва по Т, потом по :
Можно это сделать одной строкой?

И прибавлю ещё один вопрос:

 #
a = 1.00
b = 0.75
c = 0.00
x = [a,b,c]
print min(x)

Как получить на выходе

>>> 0.00

У меня, понятное дело, выводит 0.0

Romissevd

Фев. 28, 2017 23:47:04

Можно через регулярные выражения, но не факт что быстрее. Надо проверить на скорость.

 import re
t = '2017-02-28T20:55:00Z'
print(re.findall(re.compile(r'(\d{1,2}:\d{1,2})'), t))