Найти - Пользователи
Полная версия: Генератор слов из файла большого размера
Начало » Python для новичков » Генератор слов из файла большого размера
1 2 3 4 5
djjec
ZerG
ЛОг файл, база адинезы, да много еще где
В наше время 40 гигами уже никого и не удивишь.
Я бы смотрел в сторону как решать данный вопрос со стороны самого файла (в базу кидать) чем на питоне костылить.
Но видимо там какието мамонты а программистов нет которые крутили это все
Мне главное чтобы он в Linux в терминале выводил строку чисто из рандомных двух слов, склеенных между собой! и чтобы я мог дописать в начало строки своё еще слово Итог на вводе например : ДомМишаЛена
xam1816
djjec
SyntaxError: invalid syntax
полностью код ошибки,
ZerG
djjec
Версия питона какая и отступы проверь
djjec
ZerG
Тебе правильно подсказали
Не нужно пытаться проглотить камаз целиком.
Твоя задача получить рандомные слова. Таким образом тебе нужно прежде всего отщипнуть от большого файла
по одной строке, мегабайту, длине - его кучоски в рандомных областях, после чего из полученных мелких кусочков вытянуть по слову и склеить их
посмотри в сторону chunks
https://www.bluebirz.net/en/make-it-chunks/ - это не решение твоей проблемы но наведет на мысли. Я гдето видел примеры можно просто указывать в мегабайтах кучски например содерэимое с 123 по 124 метр.
Итд. В любом случае открывать 40 гиг в память ради двух слов - ето какойто тупизм.
Если реально нужно очень много таких операций то наверное будет правильнее уже разово загнать весь этот файл в какую нить базу данных и стрелять из нее запросами
Какую именно базу выбрать нужно решать по структуре запроса и хранения данных
Это всё хорошо, но я вообще в этом новичёк, точнее чайник! Думал есть готовое решение! Задача не такая сложная как я понимаю, да и 40 гиг в наше время это вообще мелочь, но как оказалось по-моему это не реально
djjec
ZerG
Версия питона какая и отступы проверь
3.11
Полностью код скопировал который Вы мне дали.
Ошибка
File “C:\2\k\1.py”, line 11

^
SyntaxError: invalid syntax

Хотя в коде 10 строк
AD0DE412
хм а что если …. смотнировать этот файл как блочное устройство ну и дальше найти - напcиать обертку для dd
djjec
AD0DE412
хм а что если …. смотнировать этот файл как блочное устройство ну и дальше найти - напcиать обертку для dd
А можно подробнее?
Да и кстати, слова не могут повторятся если что
xam1816
djjec
File “C:\2\k\1.py”, line 11

^
SyntaxError: invalid syntax
Хотя в коде 10 строк
покажи скрин где код, и ошибка вместе
AD0DE412
ну это линукс же
https://linuxconfig.org/Dd
наверное и монтировать не обязательно

те читаем опеделеный диапазон ну итд итп
а так лучше все ваше это в базу загнать а дальше уже стандартно
djjec
xam1816
покажи скрин где код, и ошибка вместе
Прикрепил
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB