Форум сайта python.su
Всем привет! Просьба предложить изящное решение следующей задачи.
Имеется текстовый файл из n предложений. Необходимо составить список всех различных слов (пусть их d), входящих в текст. (Можно воспользоваться dict, но вдруг есть что-то поинтереснее).
Далее необходимо составить матрицу n X d, ijй элемент - это количество вхождений j-го слова в i-е предложение.
Как я понимаю можно считывать строки текста и далее катко заполнять список слов и матрицу.
Первое знакомство с питон показывает, что многие сложные вещи можно делать в одну строчку.
Вообщем, задача превратить текст в матрицу.
Спасибо!
Офлайн
pushero
Первое знакомство с питон показывает, что многие сложные вещи можно делать в одну строчку.
Офлайн
ОНО?
Читал статью, не могу сейчас найти… Статья на хабре была хорошая
человек пробовал в матрицу загонять рейтинг “фильма” в твиттере (положительные/отрицательные) отзывы
Офлайн
pusheroНадо использовать set().
(Можно воспользоваться dict, но вдруг есть что-то поинтереснее).
pusheroВ два прохода надо делать: собрать все разные слова во множество; потом составить матрицу, отыскивая слова множества в каждом предложении.
Как я понимаю можно считывать строки текста и далее катко заполнять список слов и матрицу.
Офлайн