Найти - Пользователи
Полная версия: Обработка текстового файла (например, типограф)
Начало » Python для новичков » Обработка текстового файла (например, типограф)
1
Persio
Задача. Есть текстовый файл (обычный txt-файл, но большого - до 3 Гб размера). В нем надо произвести множественные замены - список этих замен есть во втором текстовом файле. Каждая строка в нем - это “Что меняем” и “На что меняем”. Собственно, нужны наметки, как лучше организовать работу с файлом.

Алгоритм, я так понимаю, тут такой:

Пока есть строки в файле 2:
- Берем из файла 2 строку
- Из этой строки извлекаем ЗАМЕНЯЕМЫЙ-ТЕКСТ и ВСТАВЛЯЕМЫЙ-ТЕКСТ
- Построчно разбираем файл 1 = пока есть строки в файле 1:
- - Берем строку
- - Заменяем в ней ЗАМЕНЯЕМЫЙ-ТЕКСТ на ВСТАВЛЯЕМЫЙ-ТЕКСТ
- Сохраняем файл 1

*Текст в файле 1
*Блоки для замены в файле 2

Посоветуйте, какими методами воспользоваться?
doza_and
Второй файл лучше считать целиком. Список замен откомпилировать (можно например модуль re использовать)
Файл 1 не трогать только читать из него. Писать результат в третий файл. Для чтения первого файла наверное подойдет xreadlines (зависит от версии питона). В конце обработки первый файл удаляете и переименовываете 3 файл.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB