BlackRabbit
Июнь 7, 2014 19:23:35
Дорогие друзья, подскажите путь к решению задачи:
На входе имеется некоторых текст, который открывается традиционно методом:
with open('c:\Texts\File1', 'r', encoding = 'utf-8') as inp:
for line in inp:
line = line.split('\n')
В результате получаем список слов, нарезанных по знаку пробела.
Дальше с этими словами работает функция поиска устойчивых словосочетаний.
Условие: на входе имеется стихотворный текст. Нужно скрипт дополнить так, чтобы Python рассматривал только те пары слов, которые соседствуют на одной строке.
Подскажите, пожалуйста, как это сделать?
Shaman
Июнь 7, 2014 19:41:59
BlackRabbit
с этими словами работает функция поиска устойчивых словосочетаний.
Хотелось бы на неё взглянуть.
JOHN_16
Июнь 8, 2014 01:45:44
BlackRabbit
В приведенном файле я не увидел функции поиска устойчивых словосочетаний. Что куда прикручивать не ясно
py.user.next
Июнь 8, 2014 08:08:48
BlackRabbit
Нужно скрипт дополнить так, чтобы Python рассматривал только те пары слов, которые соседствуют на одной строке.
Приведи конкретный пример:
какой текст поступает
что из него надо выделить
что потом с этим делать
BlackRabbit
Июнь 8, 2014 12:52:42
Хорошо. Вот к примеру имеем папку, где находятся тексты былин о Садко.
Нужно переписать скрипт так, чтобы он брал на вход поэтический текст и рассматривал только те пары слов, которые соседствуют на одной строке
Для этого, видимо, нужно объяснить Питону, что такое стихотворная строка, но я не знаю, как это дело формализовать. По символу переноса строки?
Скрипт прилагаю.
py.user.next
Июнь 8, 2014 20:00:45
Возьми поэтический текст, скопируй его сюда, потом выдели из него нужные пары слов, скопируй их сюда. Покажи таким образом, что должен делать скрипт.
BlackRabbit
Скрипт прилагаю.
Это ничего не даёт.
BlackRabbit
Июнь 10, 2014 00:36:31
Окей. Допустим вот текст про Садко:
Как по морю, морю по синему
Бегут-побегут тридцать кораблей,
Тридцать кораблей — един Сокол-корабль
Самого Садка, гостя богатого.
А все корабли что соколы летят,
Сокол-корабль на море стоит.Начальный скрипт ищет связанные словосочетания
по всему тексту.Нужно же чтобы Python теперь рассматривал каждую строку в отдельности вот так:
1.
Как по морю, морю по синему
Бегут-побегут тридцать кораблей,
Тридцать кораблей — един Сокол-корабль
Самого Садка, гостя богатого.
А все корабли что соколы летят,
Сокол-корабль на море стоит.2.
Как по морю, морю по синему
Бегут-побегут тридцать кораблей,
Тридцать кораблей — един Сокол-корабль
Самого Садка, гостя богатого.
А все корабли что соколы летят,
Сокол-корабль на море стоит. и т.д.
Пожалуйста, есть какие-то идеи? Который день думаю
py.user.next
Июнь 10, 2014 02:04:45
BlackRabbit
Окей. Допустим вот текст про Садко:
BlackRabbit
1. Как по морю, морю по синему
Здесь шесть слов. Какие пары слов ищешь?
BlackRabbit
Июнь 10, 2014 10:41:54
Хорошо, абстрагируемся от конкретного текста и представим, что они есть, тем более в былинах повторы слов могут быть вполне. Меня интересует сам принцип, понимаете.
Для наглядности можно тогда такой условный текст:
В. Брюсов:
Сухие листья, сухие листья,
Сухие листья, сухие листья,
Под тусклым ветром, кружат, шуршат,
Сухие листья, сухие листья,
Под тусклым ветром сухие листья,
Кружась, что шепчут, что говорят?
Трепещут сучья под тусклым ветром;
Сухие листья, под тусклым ветром,
Что говорят нам, нам шепчут что?
Трепещут листья, под тусклым ветром,
Лепечут листья, под тусклым ветром,
Но слов не понял никто, никто!
Меж черных сучьев синеет небо,
Так странно нежно синеет небо,
Так странно нежно прозрачна даль.
Меж голых сучьев прозрачно небо,
Над черным прахом синеет небо,
Как будто небу земли не жаль.
Сухие листья шуршат о смерти,
Кружась под ветром, шуршат о смерти:
Они блестели, им время тлеть.
Прозрачно небо. Шуршат о смерти
Сухие листья,- чтоб после смерти
В цветах весенних опять блестеть!