Найти - Пользователи
Полная версия: Как убрать из url лишние символы
Начало » Python для новичков » Как убрать из url лишние символы
1
torwaldino
Всем привет, есть url
http://links.url.com=\r\n/click?upn=3DESOi2zSjWnoYTaMBHu-2BeWTtzsp4lX-2FlEHM-2Fm-2BOaFf6UfzTACsLX=\r\nCuovjm3iyLaCnkyGBTtZFXpvV90AMuZuQUTxm6pboGuCcm-2FJINu1lHaoP6ehXcWMOcMzGieUZ=\r\nbE4hR902_hKqJPPJE67uYOK2uDoNywvZwU7WeN1wEOYtC7WrQudknVTTYGjhHaoKzoj5LhWCI4l=\r\nBGNyGqhRwtbxujPAn2hFoVNvI5nZdfmuJZaZisI7I5fk11EpL6cNgZslRoXdRYY0njR5UVMPIIc=\r\nkGzWVKRmmtRze3YiyL3uJ2orkuuYiLLv0i-2BfzkALaAe-2B46CMu675lmf3mxbYcS-2FgpH7TT=\r\nFahYC43tVkRYxFWdaY-2Fh5B8Us-3D
Нужно убрать лишние символы такие как =, \r, \n, а также 3D в начале ссылки но не в конце, помогите пожалуйста.
xam1816
попробуй
  
import re
s = r'http://links.url.com=\r\n/ls/click?upn=3DESOi2zSjWnoYTaMBHu-2BeWTtzsp4lX-2FlEHM-2Fm-2BOaFf6UfzTACsLX=\r\nCuovjm3iyLaCnkyGBTtZFXpvV90AMuZuQUTxm6pboGuCcm-2FJINu1lHaoP6ehXcWMOcMzGieUZ=\r\nbE4hR902_hKqJPPJE67uYOK2uDoNywvZwU7WeN1wEOYtC7WrQudknVTTYGjhHaoKzoj5LhWCI4l=\r\nBGNyGqhRwtbxujPAn2hFoVNvI5nZdfmuJZaZisI7I5fk11EpL6cNgZslRoXdRYY0njR5UVMPIIc=\r\nkGzWVKRmmtRze3YiyL3uJ2orkuuYiLLv0i-2BfzkALaAe-2B46CMu675lmf3mxbYcS-2FgpH7TT=\r\nFahYC43tVkRYxFWdaY-2Fh5B8Us-3D'
target = re.compile(r'=\\r\\n|(?<=upn)=3D')
res = target.sub('', s)
print(res)
py.user.next
torwaldino
Нужно убрать лишние символы такие как =, \r, \n, а также 3D в начале ссылки но не в конце
Сначала конкретизируй, нужно ли убирать их по отдельности или в виде целой группы символов. Потому что про символ = после подстроки upn неясно, убирать его или оставлять. С точки зрения HTTP выглядит так, что надо оставлять.
  
>>> import re
>>> 
>>> url = """http://links.url.com=\r\n/click?upn=3DESOi2zSjWnoYTaMBHu-2BeWTtzsp4lX-2FlEHM-2Fm-2BOaFf6UfzTACsLX=\r\nCuovjm3iyLaCnkyGBTtZFXpvV90AMuZuQUTxm6pboGuCcm-2FJINu1lHaoP6ehXcWMOcMzGieUZ=\r\nbE4hR902_hKqJPPJE67uYOK2uDoNywvZwU7WeN1wEOYtC7WrQudknVTTYGjhHaoKzoj5LhWCI4l=\r\nBGNyGqhRwtbxujPAn2hFoVNvI5nZdfmuJZaZisI7I5fk11EpL6cNgZslRoXdRYY0njR5UVMPIIc=\r\nkGzWVKRmmtRze3YiyL3uJ2orkuuYiLLv0i-2BfzkALaAe-2B46CMu675lmf3mxbYcS-2FgpH7TT=\r\nFahYC43tVkRYxFWdaY-2Fh5B8Us-3D"""
>>> 
>>> tmp = url
>>> tmp = tmp.replace('=\r\n', '')
>>> tmp = re.sub(r'3D', '', tmp, count=1)
>>> out = tmp
>>> 
>>> out
'http://links.url.com/click?upn=ESOi2zSjWnoYTaMBHu-2BeWTtzsp4lX-2FlEHM-2Fm-2BOaFf6UfzTACsLXCuovjm3iyLaCnkyGBTtZFXpvV90AMuZuQUTxm6pboGuCcm-2FJINu1lHaoP6ehXcWMOcMzGieUZbE4hR902_hKqJPPJE67uYOK2uDoNywvZwU7WeN1wEOYtC7WrQudknVTTYGjhHaoKzoj5LhWCI4lBGNyGqhRwtbxujPAn2hFoVNvI5nZdfmuJZaZisI7I5fk11EpL6cNgZslRoXdRYY0njR5UVMPIIckGzWVKRmmtRze3YiyL3uJ2orkuuYiLLv0i-2BfzkALaAe-2B46CMu675lmf3mxbYcS-2FgpH7TTFahYC43tVkRYxFWdaY-2Fh5B8Us-3D'
>>>
torwaldino
py.user.next
=\r\n
Да вы правы после upn = должно быть, убирается группа =\r\n. Спасибо
torwaldino
xam1816
попробуй
Спасибо
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB