import requests
import urllib
from bs4 import BeautifulSoup
import csv
from datetime import datetime
from multiprocessing import Pool
def get_html(url):
response = urllib.request.urlopen(url)
return response.read()
def parse(html):
soup = BeautifulSoup(html, "lxml")
table = soup.find('table', class_='l l_auto')
vacancies = []
for row in table.find_all('div', class_='search-result-description__item search-result-description__item_primary'):
cols = row.find_all('div', class_='search-result-item__head')
vacancies.append({
'title': cols[0].a.text,
})
for vacancy in vacancies:
print(vacancy)
salaries = []
for row in table.find_all('div', class_='search-result-description__item search-result-description__item_primary'):
cols2 = row.find_all('div', class_='b-vacancy-list-salary')
salaries.append({
'categories': cols2[0].div.find_all('meta', class_='baseSalary')
})
for salary in salaries:
print(salary)
def main():
parse(get_html(
'https://jobs.tut.by/search/vacancy?text=%D0%9B%D0%BE%D0%B3%D0%B8%D1%81%D1%82&only_with_salary=false&area=16&enable_snippets=true&clusters=true&salary='))
if __name__ == '__main__':
main()
Выводит такую запись
{'title': 'Специалист \u2062по логистике'}
{'title': 'Специалист \u2062по логистике'}
{'title': 'Специалист по ло\u2062гистике и сервису'}
{'title': 'Специалист \u2062по логистике'}
{'title': 'Менеджер п\u2062о логистике'}
{'title': 'Логист-э\u2062кспедитор'}
{'title': 'Логист / Специалист по о\u2062рганизации грузоперевозок'}
{'title': 'Оператор TMS (лог\u2062ист по транспорту)'}
Подскажите, пожалуйста, как убрать
\u2062
Откуда она и почему образовывается, ведь в коде страницы ее нет