Компьютерная лексикография: лемматизация топонимов.
Хотел задать вопрос по компьютерной лингвистике. Кто знает про лемматизацию, можете объяснить что такое лемматизация топонимов в словарях? (с примерами пожалуйчста) спасибо!
По дате
По рейтингу
Если просто, то это приведение Имя собственного природного или техногенного объекта в базовую форму.
Например - Волжский паром. - после лемматизации - Волга (паром). Причем Топоним должен звучать одинаково на всех языках, И через транскрипцию должен приводится к диной лемме (название рек, озер, хребтов и т. д).
Есть масса библиотек для работы с леммами. На php, на питоне. В основном используют SEO оптимизаторы и маркетологи. Я их особо никогда не изучал и не применял.
лемитизация - от слова предел