Любое приложение, которое принимает на вход текст, должно как-то уметь его обрабатывать. В нашем случае есть базовая обработка платформы, на которой работает голосовой ассистент Сбера. Но что если этой обработки недостаточно и получаемый текст нужно почистить и извлечь из него значимые сущности (NER)?
В действительности мало построить кастомный NER-модуль, нужно построить его правильно.
В докладе мы покажем, как сделали правиловый NER-модуль без модели и упаковали его в красивую архитектуру, которая сделала наш код читаемым, понятным и доступным для быстрых правок.
Доклад будет полезен всем, кто сталкивался с обработкой текста и размышлял над тем, как оптимизировать ее в рамках своего проекта.