1. ну для начала заготовьте файлы в которых будут повторения.
2 считайте их, разбейте на слова (см read split)
3 а дальше самое интересное - надо алгоритм придумать, да так чтобы он был не очень трудоемкий. Возможно по началу непросто будет понять условие. Попробуйте изложить варианты.
Например в таком тексте какие повторяющиеся предложения?
a= " a a a a a b b b b b"
4 надо вывести данные.