Омоглифы и схожие символы

Омоглифы — это символы, которые из-за сходства по размеру и форме кажутся идентичными или похожими друг на друга до степени смешения. Они часто встречаются при смешивании латинского, кириллического и греческого алфавитов.

Например, латинская буква «o» (код U+006f), кириллическая строчная буква «о» (код U+043e) и греческая строчная буква омикрон «о» (код U+03bf). Иногда омоглифы встречаются в одном шрифте, такие как строчная буква хорватского алфавита «lj» (код U+01c9) и две буквы «lj» (код U+006c U+006a). Другие примеры см. в таблице.

Чтобы предотвратить создание доменных имен с омоглифами, регистратуры должны применять правила генерирования меток (LGR), которые ограничивают список кодов символово в метке набором символов одного алфавита или совместимых алфавитов. У каждой регистратуры должны быть LGR для всех алфавитов, на которых она регистрирует доменные имена.

Подробнее о механизмах безопасности Unicode для обнаружения схожести строк см. здесь.

Подробнее о схожих до степени смешения символах и соответствующе практике см.



Дополнительная информация

Интернационализированные доменные имена в приложениях (IDNA): История вопроса, пояснение и обоснование в RFC 5894.