Форум сайта python.su
0
Всем привет, есть url
http://links.url.com=\r\n/click?upn=3DESOi2zSjWnoYTaMBHu-2BeWTtzsp4lX-2FlEHM-2Fm-2BOaFf6UfzTACsLX=\r\nCuovjm3iyLaCnkyGBTtZFXpvV90AMuZuQUTxm6pboGuCcm-2FJINu1lHaoP6ehXcWMOcMzGieUZ=\r\nbE4hR902_hKqJPPJE67uYOK2uDoNywvZwU7WeN1wEOYtC7WrQudknVTTYGjhHaoKzoj5LhWCI4l=\r\nBGNyGqhRwtbxujPAn2hFoVNvI5nZdfmuJZaZisI7I5fk11EpL6cNgZslRoXdRYY0njR5UVMPIIc=\r\nkGzWVKRmmtRze3YiyL3uJ2orkuuYiLLv0i-2BfzkALaAe-2B46CMu675lmf3mxbYcS-2FgpH7TT=\r\nFahYC43tVkRYxFWdaY-2Fh5B8Us-3D
Нужно убрать лишние символы такие как =, \r, \n, а также 3D в начале ссылки но не в конце, помогите пожалуйста.
Отредактировано torwaldino (Янв. 18, 2023 21:11:40)
Офлайн
124
попробуй
import re s = r'http://links.url.com=\r\n/ls/click?upn=3DESOi2zSjWnoYTaMBHu-2BeWTtzsp4lX-2FlEHM-2Fm-2BOaFf6UfzTACsLX=\r\nCuovjm3iyLaCnkyGBTtZFXpvV90AMuZuQUTxm6pboGuCcm-2FJINu1lHaoP6ehXcWMOcMzGieUZ=\r\nbE4hR902_hKqJPPJE67uYOK2uDoNywvZwU7WeN1wEOYtC7WrQudknVTTYGjhHaoKzoj5LhWCI4l=\r\nBGNyGqhRwtbxujPAn2hFoVNvI5nZdfmuJZaZisI7I5fk11EpL6cNgZslRoXdRYY0njR5UVMPIIc=\r\nkGzWVKRmmtRze3YiyL3uJ2orkuuYiLLv0i-2BfzkALaAe-2B46CMu675lmf3mxbYcS-2FgpH7TT=\r\nFahYC43tVkRYxFWdaY-2Fh5B8Us-3D' target = re.compile(r'=\\r\\n|(?<=upn)=3D') res = target.sub('', s) print(res)
Офлайн
857
torwaldinoСначала конкретизируй, нужно ли убирать их по отдельности или в виде целой группы символов. Потому что про символ = после подстроки upn неясно, убирать его или оставлять. С точки зрения HTTP выглядит так, что надо оставлять.
Нужно убрать лишние символы такие как =, \r, \n, а также 3D в начале ссылки но не в конце
>>> import re >>> >>> url = """http://links.url.com=\r\n/click?upn=3DESOi2zSjWnoYTaMBHu-2BeWTtzsp4lX-2FlEHM-2Fm-2BOaFf6UfzTACsLX=\r\nCuovjm3iyLaCnkyGBTtZFXpvV90AMuZuQUTxm6pboGuCcm-2FJINu1lHaoP6ehXcWMOcMzGieUZ=\r\nbE4hR902_hKqJPPJE67uYOK2uDoNywvZwU7WeN1wEOYtC7WrQudknVTTYGjhHaoKzoj5LhWCI4l=\r\nBGNyGqhRwtbxujPAn2hFoVNvI5nZdfmuJZaZisI7I5fk11EpL6cNgZslRoXdRYY0njR5UVMPIIc=\r\nkGzWVKRmmtRze3YiyL3uJ2orkuuYiLLv0i-2BfzkALaAe-2B46CMu675lmf3mxbYcS-2FgpH7TT=\r\nFahYC43tVkRYxFWdaY-2Fh5B8Us-3D""" >>> >>> tmp = url >>> tmp = tmp.replace('=\r\n', '') >>> tmp = re.sub(r'3D', '', tmp, count=1) >>> out = tmp >>> >>> out 'http://links.url.com/click?upn=ESOi2zSjWnoYTaMBHu-2BeWTtzsp4lX-2FlEHM-2Fm-2BOaFf6UfzTACsLXCuovjm3iyLaCnkyGBTtZFXpvV90AMuZuQUTxm6pboGuCcm-2FJINu1lHaoP6ehXcWMOcMzGieUZbE4hR902_hKqJPPJE67uYOK2uDoNywvZwU7WeN1wEOYtC7WrQudknVTTYGjhHaoKzoj5LhWCI4lBGNyGqhRwtbxujPAn2hFoVNvI5nZdfmuJZaZisI7I5fk11EpL6cNgZslRoXdRYY0njR5UVMPIIckGzWVKRmmtRze3YiyL3uJ2orkuuYiLLv0i-2BfzkALaAe-2B46CMu675lmf3mxbYcS-2FgpH7TTFahYC43tVkRYxFWdaY-2Fh5B8Us-3D' >>>
Отредактировано py.user.next (Янв. 19, 2023 03:08:51)
Офлайн
0
py.user.nextДа вы правы после upn = должно быть, убирается группа =\r\n. Спасибо
=\r\n
Офлайн
0
xam1816Спасибо
попробуй
Офлайн