Какие программы печатают кирлатом (схожие буквы из разных алфавитов)?
Столкнулся с проблемой: в тексте могут быть русские символы заменены латиницей, сходной по внешнему виду. Также бывает, что вместо латиницы стоит кириллица.
Это убивает проверку орфографии и поиск, а ещё настроение и желание.
Текст не мой, приходит через браузер от клиентов. Системы не нашёл.
Нужно как-то автоматически исправлять эти ошибки, но непонятно, в какую сторону исправлять: могут быть русские слова с латиницей, могут быть латинские слова с кириллицей. В каком-то латинском слове из 5-7 букв только одна была латинской - L.
Для начала хотелось бы понять откуда это вообще проистекает.
Вряд ли люди заморачиваются и специально это делают, я подозреваю, что это какой-нибудь недоделанный Айфон или ещё что-то экономит на тексте биты.
Нет, это не экономия битов. Это либо опечатки, сделанные людьми, либо сознательное искажение слов, производимое авторами ботов - именно для того, чтобы обмануть защиту от спама и/или оскорблений и т.п. системы автоматической проверки контента.