DjangoBB LoFi version

Полная версия: Генератор слов из файла большого размера

Начало » Python для новичков » Генератор слов из файла большого размера

1 2 3 4 5

djjec

Ноя. 13, 2022 21:23:26

ZerG
ЛОг файл, база адинезы, да много еще где
В наше время 40 гигами уже никого и не удивишь.
Я бы смотрел в сторону как решать данный вопрос со стороны самого файла (в базу кидать) чем на питоне костылить.
Но видимо там какието мамонты а программистов нет которые крутили это все

Мне главное чтобы он в Linux в терминале выводил строку чисто из рандомных двух слов, склеенных между собой! и чтобы я мог дописать в начало строки своё еще слово Итог на вводе например : ДомМишаЛена

xam1816

Ноя. 13, 2022 21:23:57

djjec
SyntaxError: invalid syntax

полностью код ошибки,

ZerG

Ноя. 13, 2022 21:24:07

djjec

Версия питона какая и отступы проверь

djjec

Ноя. 13, 2022 21:27:00

ZerG
Тебе правильно подсказали
Не нужно пытаться проглотить камаз целиком.
Твоя задача получить рандомные слова. Таким образом тебе нужно прежде всего отщипнуть от большого файла
по одной строке, мегабайту, длине - его кучоски в рандомных областях, после чего из полученных мелких кусочков вытянуть по слову и склеить их
посмотри в сторону chunks
https://www.bluebirz.net/en/make-it-chunks/ - это не решение твоей проблемы но наведет на мысли. Я гдето видел примеры можно просто указывать в мегабайтах кучски например содерэимое с 123 по 124 метр.
Итд. В любом случае открывать 40 гиг в память ради двух слов - ето какойто тупизм.
Если реально нужно очень много таких операций то наверное будет правильнее уже разово загнать весь этот файл в какую нить базу данных и стрелять из нее запросами
Какую именно базу выбрать нужно решать по структуре запроса и хранения данных

Это всё хорошо, но я вообще в этом новичёк, точнее чайник! Думал есть готовое решение! Задача не такая сложная как я понимаю, да и 40 гиг в наше время это вообще мелочь, но как оказалось по-моему это не реально

djjec

Ноя. 13, 2022 21:30:19

ZerG
Версия питона какая и отступы проверь

3.11
Полностью код скопировал который Вы мне дали.
Ошибка
File “C:\2\k\1.py”, line 11

^
SyntaxError: invalid syntax
Хотя в коде 10 строк

AD0DE412

Ноя. 13, 2022 21:30:49

хм а что если …. смотнировать этот файл как блочное устройство ну и дальше найти - напcиать обертку для dd

djjec

Ноя. 13, 2022 21:32:29

AD0DE412
хм а что если …. смотнировать этот файл как блочное устройство ну и дальше найти - напcиать обертку для dd

А можно подробнее?
Да и кстати, слова не могут повторятся если что

xam1816

Ноя. 13, 2022 21:36:21

djjec
File “C:\2\k\1.py”, line 11

^
SyntaxError: invalid syntax
Хотя в коде 10 строк

покажи скрин где код, и ошибка вместе

AD0DE412

Ноя. 13, 2022 21:37:10

ну это линукс же
https://linuxconfig.org/Dd
наверное и монтировать не обязательно

те читаем опеделеный диапазон ну итд итп
а так лучше все ваше это в базу загнать а дальше уже стандартно

djjec

Ноя. 13, 2022 21:40:07

xam1816
покажи скрин где код, и ошибка вместе

Прикрепил