py.user.next
С чего это вдруг? \d+ - необходимое условие, иначе как цифры накапливать?
А это тонкий намёк на необходимость и других условий.
py.user.next
Да надо просто файл через sed снаружи прогнать, если невозможно исправить алгоритм, который порождает его (со смешанными концами строк).
Способ не важен, важно правильно сравнивать времена отработки.
py.user.next
Кстати, если есть этот костыль (re.sub()), то твоя регулярка не только будет дольше искать, но и работать впустую.
Допустим, у меня хватает благоразумия не фильтровать дважды.
py.user.next
Ты же привязал таким образом регулярку к побочному содержимому, которое ещё может быть удалено каким-нибудь способом.
Почему ты считаешь содержимое побочным? Не знаешь почему до сих пор некоторые утилиты заикаются от отсутствия перевода строки в конце файлов, а другие в таких случаях намекают на некий “плохой стиль”?
С таким же подходом числовые данные могут быть тоже удалены каким либо образом и вообще на вход могут подать мусор (после того как грибы во рту вырастут).
Не могу понять к чему этот спор? Не ожидается в разделителях ничего лишнего - ловить только нужное число пробелов в регулярке, но если line endings идут разных форматов, так самое место в регулярке это и учитывать, а не городить никому не нужные очистительные каскады, жрущие так всеми нами любимую память и сопоставимое количество процессорного времени.