Уведомления

Группа в Telegram: @pythonsu

#1 Сен. 15, 2009 18:09:24

Enchantner
От:
Зарегистрирован: 2009-02-11
Сообщения: 442
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсинг большого xls

Мужики, вот такая проблема - есть прайс-лист в xls-формате (причем с кучей наворотов - много листов, гиперссылки, скрытые поля), нужно его распарсить. Ну или преобразовать во что-то более удобоваримое и распарсить. Проблема в его сложности и размерах (нужно достать все записи, а их примерно 4500) - OpenOffice выдает “Ошибка сохранения файла”, пример из этой темы - http://python.su/forum/viewtopic.php?id=2002 - также падает с кучей ошибок. Пытался преобразовать в xlsx, но тогда вся инфа записывается в один xml-файл внутри архива, который после разархивации занимает 19 мб. Что посоветуете, как поступить?



Офлайн

#2 Сен. 15, 2009 19:11:16

igor.kaist
От:
Зарегистрирован: 2007-11-12
Сообщения: 1879
Репутация: +  3  -
Профиль   Отправить e-mail  

Парсинг большого xls

Может с csv легче будет?

Enchantner
Пытался преобразовать в xlsx, но тогда вся инфа записывается в один xml-файл внутри архива, который после разархивации занимает 19 мб
А тут проблема то в чем? Парси спокойно эти 19 мб, я думаю, не такая сложная и долгая задача для современных машин.
P.S. Способов на самом деле много… можно даже через odbc в винде подключить, как базу данных…



Офлайн

#3 Сен. 15, 2009 19:18:42

Enchantner
От:
Зарегистрирован: 2009-02-11
Сообщения: 442
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсинг большого xls

igor.kaist
из этих 19 мб приходится вручную выковыривать правила, по которым парсить данные.
Сейчас пробую скрипт для опенофиса написать.



Офлайн

#4 Сен. 15, 2009 19:20:12

Андрей Светлов
От:
Зарегистрирован: 2007-05-15
Сообщения: 3137
Репутация: +  14  -
Профиль   Адрес электронной почты  

Парсинг большого xls

А чем xlrd не подходит?



Офлайн

#5 Сен. 15, 2009 19:44:49

Enchantner
От:
Зарегистрирован: 2009-02-11
Сообщения: 442
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсинг большого xls

Андрей Светлов
Тогда буду благодарен за ссылку на нормальный док по нему.



Офлайн

#6 Сен. 15, 2009 20:02:52

Андрей Светлов
От:
Зарегистрирован: 2007-05-15
Сообщения: 3137
Репутация: +  14  -
Профиль   Адрес электронной почты  

Парсинг большого xls

Кроме http://www.lexicon.net/sjmachin/xlrd.html - ничего не знаю.
Мне хватало (плюс исходники не очень большие, можно и неплохо комментированные)



Офлайн

#7 Сен. 15, 2009 20:14:48

Enchantner
От:
Зарегистрирован: 2009-02-11
Сообщения: 442
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсинг большого xls

Андрей Светлов
Спасибо большое :) Буду пробовать!



Офлайн

#8 Сен. 15, 2009 21:30:31

slav0nic
Команда
От: dp.ua
Зарегистрирован: 2006-05-07
Сообщения: 2260
Репутация: +  41  -
Профиль   Отправить e-mail  

Парсинг большого xls

в пакете вроде были примеры использования

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version