Если взять книги, посвященные NLP, то сложится впечатление, что обработка текста- это one hot encoding и TF-IDF методы + самописные перцептроны. Все изложение растянуто на кучу мутных страниц с набором странно- изобретенных велосипедов. Очевидно, что в Python все это должно быть в десятки раз проще.
Просто уверен, что существуют современные библиотеки и паттерны работы с ними, которые позволяют небольшим количеством кода и знаний обучить модель на текстовых данных (конечно, всегда по желанию можно улучшаться и накручивать дополнительный код). Вроде как это PyTorch, но не нашел хорошей книжки по его современному использованию.
Может кто- то рекомендовать литературу с описанием современных инструментов и паттернов их использования при обучении на текстах?