Омоглифы и схожие символы
Омоглифы — это символы, которые из-за сходства по размеру и форме кажутся
идентичными или похожими друг на друга до степени смешения. Они часто
встречаются при смешивании латинского, кириллического и греческого алфавитов.
Например, латинская буква «o» (код U+006f), кириллическая строчная буква «о» (код
U+043e) и греческая строчная буква омикрон «о» (код U+03bf). Другие примеры см. в
таблице.
Чтобы предотвратить создание доменных имен с омоглифами, регистратуры должны
применять правила генерирования меток (LGR), которые ограничивают список
кодов символово в метке набором символов одного алфавита или совместимых
алфавитов. У каждой регистратуры должны быть LGR для всех алфавитов,
с использованием которых она регистрирует доменные имена.
Кроме того существует мультибуквенная омоглифическая схожесть составных букв (лигатур)
и отдельных букв в одном алфавите. Например, буква латинского алфавита "w" (код U+0077)
и две буквы "vv" (коды U+0076 и U+0076).
Подробнее о механизмах безопасности Unicode для обнаружения схожести строк смотрите
здесь.
Подробнее о схожих до степени смешения символах и соответствующей
практике смотрите:
- Общая информация и руководство M3AAWG по борьбе с ненадлежащим использованием Unicode.
- Рекомендации M3AAWG по предотвращению злоупотреблений Unicode