Здравствуйте
если два файла
в первом куча словосочетаний из 1-4 слов. ( каждое с новой строки )
во втором слова ( каждое с новой строки )
фактически формат исходных файлов можно изменить ( если это каким-то образом ускорит дальнейшую обработку )
Содержимое первого файла постоянно меняется, второй же файл фактически является словарем.
нужно из первого файла удалить все фразы в которых встречается хоть 1 слово из второго файла.
как такую штуку сделать? интересует в плане производительность, т.к. размер файлов может быть достаточно большой, да и если сравнивать влоб слова то походу много проверок будет ….
в первую очередь интересуют механизмы питона на которых такое лучше всего сделать ( библиотеки, использовать списки или еще как-то … загонять в память или последовательно обрабатывать … и подобное ) + идеи возможной оптимизации.
в питоне дуб-дерево, так что если к ответу будет прилагаться код - будет просто отлично
Заранее всем большое спасибо.