Форум сайта python.su
Подскажите плиз как можно отсортировать.Чтоб у меня построчно список был url
Сейчас у меня такого вида:
http://s.ggwp.be/w2tr;http://site
http://s.ggwp.be/w2ук;http://site
http://eu20.es/atr;http://site
Тоесть мне нужно всё что идёт в первой колонке оставить,нужно убрать ;http://site
Чтоб было так:
http://s.ggwp.be/w2tr
http://s.ggwp.be/w2ук
http://eu20.es/atr
Офлайн
>>> urls = ['http://s.ggwp.be/w2tr;http://site', 'http://s.ggwp.be/w2ук;http://site', 'http://eu20.es/atr;http://site']
>>> [url.replace(';http://site', '') for url in urls]
['http://s.ggwp.be/w2tr', 'http://s.ggwp.be/w2\xe3\xaa', 'http://eu20.es/atr']
Офлайн
sed ‘s/;.*$//’
Офлайн
urls = ['http://s.ggwp.be/w2tr;http://site', 'http://s.ggwp.be/w2ук;http://site', 'http://eu20.es/atr;http://site'] map(lambda x: x.split(';', 1)[0], urls)
Офлайн
у меня в файле список большой
Офлайн
with open(source_file_name, "rt", encoding="utf-8") as fin, open(output_file_name, "wt", encoding="utf-8") as fout: for line in fin: print(line.split(";")[0], file=fout)
def get_urls(fname): with open(fname, "rt", encoding="utf-8") as fin: yield from map(lambda s: s.split(";")[0], fin) for url in get_urls(source_file_name): ...
Отредактировано pyuser (Фев. 4, 2015 08:28:39)
Офлайн