Ctrl →

oldjaponec@gmail.com · Сен. 11, 2019 20:39:49

Помогите разобраться с регулярными выражениями. Я новичок, но, вроде, не такой глупый. Уже десяток раз перечитал документацию по синтаксису, а, как не получал от них то, что нужно, так и не получаю. У меня уже крыша едет от того, как это работает на практике.

Задача такая. Дана строка. Надо определить самую длинную повторяющуюся подстроку.
Пример:
'aaaa' == ‘aa’
'aghtfghkofgh' == ‘fgh’
'abc' == None

Вот это здесь не работает:

((.+)+)((.)*)\1+
(?= (\w+)(.*))\1+
(?= (\w+)+)((.*))\1{2,}
((\w+)+)(.*)\1{2}
(.+)(?:.*\1){2,}
(?:(.*)*)((\w+)+)(?:(.*)*){2,}

Отредактировано oldjaponec@gmail.com (Сен. 12, 2019 01:07:08)

py.user.next · Сен. 12, 2019 02:32:53

oldjaponec@gmail.com
Задача такая. Дана строка. Надо определить самую длинную повторяющуюся подстроку.
Пример:

Задание именно в регулярных выражениях? Именно через них надо сделать?

oldjaponec@gmail.com · Сен. 12, 2019 17:25:21

py.user.next

Ну, как бы нет. Просто тут уже принципиально, возможно ли вообще это решить с помощью регулярных выражений. Хотелось бы в них разобраться на примере этого задания. Кроме того, лично у меня, другие пути решения слишком большой перебор предполагают. Загвоздка, кстати, не малая, ещё в том, что повторяющиеся подстроки не должны перекрывать друг друга

py.user.next · Сен. 12, 2019 18:04:32

Ну, это как с задачей по распознаванию всех возможных E-mail-адресов через регекспы - сделать-то можно, только на выходе получается ужос. В то же время правила питона предполагают ясность кода, чтобы избегать закрадывания багов в нём.

Эту задачу не надо делать через регекспы. Лёгкий конечный автомат спасёт отца русской демократии.

wiki. конечный автомат
wiki. конечный автомат. пример

AD0DE412 · Сен. 12, 2019 22:28:07

oldjaponec@gmail.com
Надо определить самую длинную повторяющуюся подстроку.

Надо определить самую длинную повторяющуюся миним 2 раза подстроку те подстрока как максимум в половину длины строки

1. пжлст, форматируйте код, это в панели создания сообщений, выделите код и нажмите что то вроде

2. чтобы вставить изображение залейте его куда нибудь (например), нажмите

и вставьте ссылку на его url
…
есчщо

Отредактировано AD0DE412 (Сен. 12, 2019 22:41:36)

oldjaponec@gmail.com · Сен. 12, 2019 23:02:15

py.user.next
Спасибо. Посмотрю. В любом случае, это точно лишним не будет

oldjaponec@gmail.com · Сен. 12, 2019 23:03:36

AD0DE412

Да, именно так. Кстати, в этом ключе я не думал. Спасибо за идею

oldjaponec@gmail.com · Сен. 13, 2019 03:37:18

Короче, программа такая решала эту задачу быстро и качественно, пока ей не попалась строка ‘arefhjaref!!’, результат которой почему-то ‘!’, а не ‘aref’

l='arefhjaref!!'
k,i=len(l)//2,0
    if l!='':
        while k>0:
            if i==k:k-=1;i==0
            if l.count(l[i:k+i])>1:print(l[i:k+i])
            i+=1

Отредактировано oldjaponec@gmail.com (Сен. 13, 2019 03:39:39)

AD0DE412 · Сен. 13, 2019 08:11:00

ваш вариант не выбирает всех возможных случеев
мне кажется что нужно набирать базу всех сочетаний последовотельностей символов не превышающих половину длины строки после чего прогнать на вхождение в строку этих последовательностей
какая самая длинная и которая повторяется и не пересекается та и есть наша подстрока (ответов может быть от нет до несколко)
зы думаю как это будет в коде
ззы возможно что то из итертулз

1. пжлст, форматируйте код, это в панели создания сообщений, выделите код и нажмите что то вроде

2. чтобы вставить изображение залейте его куда нибудь (например), нажмите

и вставьте ссылку на его url
…
есчщо

Отредактировано AD0DE412 (Сен. 13, 2019 08:37:38)

vic57 · Сен. 13, 2019 08:42:18

 import re
s = 'arefhjaref!!'
out = []
for i in range(len(s)//2):
    tmp = re.findall(r'(.+).*?\1', s[i:])[0]
    if s.count(tmp) > 1 and len(tmp) > 1:
        out.append(tmp)
out.sort(key=lambda x: len(x))
print(out)

Python-сообщество

Уведомления

#1 Сен. 11, 2019 20:39:49

Нужна помощь по регулярным выражением re

#2 Сен. 12, 2019 02:32:53

Нужна помощь по регулярным выражением re

#3 Сен. 12, 2019 17:25:21

Нужна помощь по регулярным выражением re

#4 Сен. 12, 2019 18:04:32

Нужна помощь по регулярным выражением re

#5 Сен. 12, 2019 22:28:07

Нужна помощь по регулярным выражением re

#6 Сен. 12, 2019 23:02:15

Нужна помощь по регулярным выражением re

#7 Сен. 12, 2019 23:03:36

Нужна помощь по регулярным выражением re

#8 Сен. 13, 2019 03:37:18

Нужна помощь по регулярным выражением re

#9 Сен. 13, 2019 08:11:00

Нужна помощь по регулярным выражением re

#10 Сен. 13, 2019 08:42:18

Нужна помощь по регулярным выражением re

Board footer