избранное
есть файл формата csv. В нём есть символы в какой-то неведомой кодировке. Задача тупо удалить их и сделать информацию читаемой.
file.read() - выдаёт ошибку: UnicodeDecodeError: ‘charmap’ codec can't decode byte 0x98 in position 18068: character maps to
csv.reader(tsvin, delimiter='\t') - тоже фэйлится (ещё раньше). Попытки читать в какой-то конкретной кодировке, приводят к ухудшению результата.
Соответственно вопрос как можно обработать (удалить , проигнорировать) символ если программа вылетает при его прочтении?
Попробовал через try/except - они ничего не дают , программа всё равно прекращает работу при ошибке.
Файл прилагаю.