kukuruku11
возникает необходимость ее сохранения и последующей обработки.
Ну это зависит от того как и чем вы хотите эти данные обрабатывать.
Начнем с того что текстовый файл это непонятно что. Поэтому гораздо сложнее читать и писать.
Если не надо чтобы читалось глазами
0. Если читать питоном то Pickle, cPickle самое быстрое. Если универсальный формат то см. msgpack
Если нужен универсальный формат который смогут читать другие приложения и человек то:
1. Наиболее человекочитаемый формат на мой взгляд yaml
http://pyyaml.org/ со временем оказалось что практически во всех приложениях для небольшого объема данных пользуюсь только им.
2. json встроенный - немного менее компактный, но более простой и гораздо более распространенный.
3. Судя по вашим данным, возможно подойдет (если количество элементов в строке у вас одинаково для всех строк) csv/tsv. Получите максимальную переносимость между приложениями. Минус встроенного пакета - не понимает тип переменных, все грузит как строки.
4. Если это действительно таблица, то можно сохранять данные в sqlite или другой субд - плюс что проще заменять данные если потребуется. Будет выше скорость чтения /записи по сравнению с csv.
5. Для получения пиковых скоростей чтения записи или записи очень больших объемов данных рекомендую бинарный формат hdf5. записать разнородные данные в него можно, только надо разобраться тогда с тем как в numpy структуры создаются.
По поводу xml. Он для хранения данных непригоден. т.е. стандарт предусматривает хранение только строк, другие данные там хранить нельзя. Кроме того читать его сложно и процедура чтения медленная. При наличии перечисленных выше форматов я не могу придумать когда надо предпочесть xml другим форматам.
ps
классический пакет для анализа данных pandas.