# coding=UTF-8
f = open('log.txt', 'r')
g = f.read()
print 'Массив слов'
print g
print 'Разделяем запятой'
g = g.split(',')
print g
Массив слов
Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези
Разделяем запятой
['\xcf\xf0\xe8\xe2\xe5\xf2 \xcf\xee\xea\xe0 \xe0\xed\xe8\xec\xe5 \xe1\xee\xe5\xe2\xe8\xea \xf4\xe0\xed\xf2\xe0\xf1\xf2\xe8\xea\xe0 \xf4\xfd\xed\xf2\xe5\xe7\xe8 \xcf\xf0\xe8\xe2\xe5\xf2 \xcf\xee\xea\xe0 \xe0\xed\xe8\xec\xe5 \xe1\xee\xe5\xe2\xe8\xea \xf4\xe0\xed\xf2\xe0\xf1\xf2\xe8\xea\xe0 \xf4\xfd\xed\xf2\xe5\xe7\xe8 \xcf\xf0\xe8\xe2\xe5\xf2 \xcf\xee\xea\xe0 \xe0\xed\xe8\xec\xe5 \xe1\xee\xe5\xe2\xe8\xea \xf4\xe0\xed\xf2\xe0\xf1\xf2\xe8\xea\xe0 \xf4\xfd\xed\xf2\xe5\xe7\xe8 \xcf\xf0\xe8\xe2\xe5\xf2 \xcf\xee\xea\xe0 \xe0\xed\xe8\xec\xe5 \xe1\xee\xe5\xe2\xe8\xea \xf4\xe0\xed\xf2\xe0\xf1\xf2\xe8\xea\xe0 \xf4\xfd\xed\xf2\xe5\xe7\xe8 \xcf\xf0\xe8\xe2\xe5\xf2 \xcf\xee\xea\xe0 \xe0\xed\xe8\xec\xe5 \xe1\xee\xe5\xe2\xe8\xea \xf4\xe0\xed\xf2\xe0\xf1\xf2\xe8\xea\xe0 \xf4\xfd\xed\xf2\xe5\xe7\xe8 \xcf\xf0\xe8\xe2\xe5\xf2 \xcf\xee\xea\xe0 \xe0\xed\xe8\xec\xe5 \xe1\xee\xe5\xe2\xe8\xea \xf4\xe0\xed\xf2\xe0\xf1\xf2\xe8\xea\xe0 \xf4\xfd\xed\xf2\xe5\xe7\xe8 \xcf\xf0\xe8\xe2\xe5\xf2 \xcf\xee\xea\xe0 \xe0\xed\xe8\xec\xe5 \xe1\xee\xe5\xe2\xe8\xea \xf4\xe0\xed\xf2\xe0\xf1\xf2\xe8\xea\xe0 \xf4\xfd\xed\xf2\xe5\xe7\xe8 \xcf\xf0\xe8\xe2\xe5\xf2 \xcf\xee\xea\xe0 \xe0\xed\xe8\xec\xe5 \xe1\xee\xe5\xe2\xe8\xea \xf4\xe0\xed\xf2\xe0\xf1\xf2\xe8\xea\xe0 \xf4\xfd\xed\xf2\xe5\xe7\xe8 \xcf\xf0\xe8\xe2\xe5\xf2 \xcf\xee\xea\xe0 \xe0\xed\xe8\xec\xe5 \xe1\xee\xe5\xe2\xe8\xea \xf4\xe0\xed\xf2\xe0\xf1\xf2\xe8\xea\xe0 \xf4\xfd\xed\xf2\xe5\xe7\xe8 \xcf\xf0\xe8\xe2\xe5\xf2 \xcf\xee\xea\xe0 \xe0\xed\xe8\xec\xe5 \xe1\xee\xe5\xe2\xe8\xea \xf4\xe0\xed\xf2\xe0\xf1\xf2\xe8\xea\xe0 \xf4\xfd\xed\xf2\xe5\xe7\xe8 \xcf\xf0\xe8\xe2\xe5\xf2 \xcf\xee\xea\xe0 \xe0\xed\xe8\xec\xe5 \xe1\xee\xe5\xe2\xe8\xea \xf4\xe0\xed\xf2\xe0\xf1\xf2\xe8\xea\xe0 \xf4\xfd\xed\xf2\xe5\xe7\xe8 \xcf\xf0\xe8\xe2\xe5\xf2 \xcf\xee\xea\xe0 \xe0\xed\xe8\xec\xe5 \xe1\xee\xe5\xe2\xe8\xea \xf4\xe0\xed\xf2\xe0\xf1\xf2\xe8\xea\xe0 \xf4\xfd\xed\xf2\xe5\xe7\xe8 \xcf\xf0\xe8\xe2\xe5\xf2 \xcf\xee\xea\xe0 \xe0\xed\xe8\xec\xe5 \xe1\xee\xe5\xe2\xe8\xea \xf4\xe0\xed\xf2\xe0\xf1\xf2\xe8\xea\xe0 \xf4\xfd\xed\xf2\xe5\xe7\xe8 \xcf\xf0\xe8\xe2\xe5\xf2 \xcf\xee\xea\xe0 \xe0\xed\xe8\xec\xe5 \xe1\xee\xe5\xe2\xe8\xea \xf4\xe0\xed\xf2\xe0\xf1\xf2\xe8\xea\xe0 \xf4\xfd\xed\xf2\xe5\xe7\xe8 ']
Нашел в книге что это вроде как упакованные двоичные данные, попробовал исправить:
# coding=UTF-8
import struct
f = open('log.txt', 'r')
g = f.read()
print 'Массив слов'
print g
print 'Разделяем запятой'
g = g.split(',')
h = struct.unpack('>i4sh',g)
print h
Массив слов
Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези Привет Пока аниме боевик фантастика фэнтези
Разделяем запятой
Traceback (most recent call last):
File "D:\mydoc\NetBeansProjects\test\readfile.py", line 9, in <module>
h = struct.unpack('>i4sh',g)
File "C:\Python25\lib\struct.py", line 87, in unpack
return o.unpack(s)
struct.error: unpack requires a string argument of length 10