Найти - Пользователи
Полная версия: Чтение и сплит всех файлов из директории
Начало » Python для новичков » Чтение и сплит всех файлов из директории
1
Yulya
Ребята, я в питоне новичок, на завтра задали написать скрип : имеется папка, в ней хранятся файлы с текстами. Нужно написать такой скрипт, чтобы он считывал каждый файл, сплитил на слова и создавал частотный словарь , который содержит информацию о том, сколько раз каждое слово встречалось. Словарь один общий для всех текстов. Помогите, пожалуйста, хотя бы до уровня считывания всех файлов и сплита по словам
doza_and
:)
Задача в общем случае не для новичка. Если в тексте будет “Миклухо-маклай друг индейцев съел двух индейцов. Опять-двадцаьтпять.” то что есть слова? Миклухо-маклай или Миклухо маклай. Индейцев объединить в одно слово или нет? и т п.

А так смотрите модули os.listdir
https://docs.python.org/3/library/os.html
Функции open,close
Строчный метод split
https://docs.python.org/3/library/collections.html#collections.Counter

doza_and
:)
Задача в общем случае не для новичка. Если в тексте будет “Миклухо-маклай друг индейцев съел двух индейцов. Опять-двадцаьтпять.” то что есть слова? Миклухо-маклай или Миклухо маклай. Индейцев объединить в одно слово или нет? и т п.

А так смотрите модули os.listdir
https://docs.python.org/3/library/os.html
Функции open,close
Строчный метод split
https://docs.python.org/3/library/collections.html#collections.Counter

py.user.next
Yulya
имеется папка, в ней хранятся файлы с текстами. Нужно написать такой скрипт, чтобы он считывал каждый файл, сплитил на слова и создавал частотный словарь
1) Надо написать функцию, которая принимает путь к директории и возвращает список файлов в ней.
2) Надо написать функцию, которая принимает путь к файлу и возвращает список слов из него.
3) Надо написать функцию, которая принимает список слов и возвращает частотный словарь для этого списка слов.
4) Надо написать функцию, которая объединяет первые три функции в единый процесс.
Все функции должны быть независимы друг от друга, то есть не знать друг о друге. Обмен данными между функциями должен происходит через максимально простые структуры данных (тексты, числа, встроенные типы).
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB