Top.Mail.Ru
Ответы

Компьютерная лексикография: лемматизация топонимов.

Хотел задать вопрос по компьютерной лингвистике. Кто знает про лемматизацию, можете объяснить что такое лемматизация топонимов в словарях? (с примерами пожалуйчста) спасибо!

По дате
По рейтингу
Аватар пользователя
Новичок
5лет

Если просто, то это приведение Имя собственного природного или техногенного объекта в базовую форму.
Например - Волжский паром. - после лемматизации - Волга (паром). Причем Топоним должен звучать одинаково на всех языках, И через транскрипцию должен приводится к диной лемме (название рек, озер, хребтов и т. д).
Есть масса библиотек для работы с леммами. На php, на питоне. В основном используют SEO оптимизаторы и маркетологи. Я их особо никогда не изучал и не применял.

Аватар пользователя
Оракул
5лет

лемитизация - от слова предел