Омоглифы и схожие символы

Омоглифы — это символы, которые из-за сходства по размеру и форме кажутся идентичными или похожими друг на друга до степени смешения. Они часто встречаются при смешивании латинского, кириллического и греческого алфавитов.

Например, латинская буква «o» (код U+006f), кириллическая строчная буква «о» (код U+043e) и греческая строчная буква омикрон «о» (код U+03bf). Другие примеры см. в таблице.

Чтобы предотвратить создание доменных имен с омоглифами, регистратуры должны применять правила генерирования меток (LGR), которые ограничивают список кодов символово в метке набором символов одного алфавита или совместимых алфавитов. У каждой регистратуры должны быть LGR для всех алфавитов, с использованием которых она регистрирует доменные имена.

Кроме того существует мультибуквенная омоглифическая схожесть составных букв (лигатур) и отдельных букв в одном алфавите. Например, буква латинского алфавита "w" (код U+0077) и две буквы "vv" (коды U+0076 и U+0076). Подробнее о механизмах безопасности Unicode для обнаружения схожести строк смотрите здесь.

Подробнее о схожих до степени смешения символах и соответствующей практике смотрите: