RFC и ключевые стандарты

RFC, относящиеся к IDN-доменам

RFC 3492

Punycode: Bootstring-кодирование строк Unicode для интернационализированных доменных имен в приложениях (IDNA)

Punycode обеспечивает обратимое преобразование строки в формате Unicode в уникальную строку ASCII. Этот RFC определяет общий алгоритм, который называется Bootstring. Данный алгоритм позволяет с помощью строки базовых кодов символов уникальным образом представлять любые строки кодов символов, принадлежащих к более широкому набору.

RFC 5890

Интернационализированные доменные имена в приложениях (IDNA)

Этот RFC содержит описание протокола и среды использования интернационализированных доменных имен в приложениях (IDNA) в действующей редакции.

RFC 5891

Протокол «Интернационализированные доменные имена в приложениях (IDNA)»

Этот RFC определяет механизм протокола, который называется «Интернационализированные доменные имена в приложениях (IDNA)» и предназначен для регистрации и поиска IDN-доменов без необходимости изменения самой DNS.

RFC 5892

Коды символов Unicode и интернационализированные доменные имена в приложениях (IDNA)

RFC 5892 устанавливает правила принятия решений о том, может ли та или иная кодовая точка с учетом или без учета контекста использоваться в составе интернационализированного доменного имени (IDN-домена).

RFC 5893

Использование алфавитов с направлением письма справа налево для интернационализированных доменных имен в приложениях (IDNA)

Этот RFC вводит новое правило двунаправленного отображения меток интернационализированных доменных имен в приложениях (IDNA) при использовании алфавитов с направлением письма справа налево.

RFC 5894

Интернационализированные доменные имена в приложениях (IDNA): История вопроса, пояснение и обоснование

В этом справочном документе представлен обзор пересмотренной системы, которая способна обрабатывать новые версии Unicode, и пояснительные материалы к ее компонентам.

RFC 5895

Преобразование символов интернационализированных доменных имен в приложениях (IDNA) 2008

В этом RFC описываются действия, которые могут выполняться в том или ином варианте реализации протокола после получения введенных пользователем данных перед передачей допустимых кодов символов в новый протокол IDNA (2008). В нем указано, какую операцию обработки пользовательского ввода необходимо выполнить, чтобы подготовить введенные данные для использования в «сетевом» протоколе. Этот документ также содержит общую процедуру реализации преобразования.

RFC, относящиеся к EAI

RFC 6530

Общие сведения и концепция интернационализации электронной почты

Этим стандартом вводится ряд спецификаций, определяющих механизмы и расширения протоколов, которые необходимы для полной поддержки интернационализированных адресов электронной почты. В этом документе описывается, как различные элементы интернационализации электронной почты сочетаются друг с другом, а также описываются взаимосвязи между основными спецификациями, связанными с передачей сообщений, форматами заголовков и обработкой.

RFC 6531

Расширение протокола SMTP для интернационализации электронной почты

В этом документе описано расширение протокола Simple Mail Transfer Protocol, позволяющее серверам оповещать о возможности приема и обработки интернационализированных адресов электронной почты и интернационализированных заголовков электронной почты.

RFC 6532

Заголовки сообщений при интернационализации электронной почты

В этом документе указаны усовершенствования формата интернет-сообщений и MIME, позволяющие использовать Unicode в адресах электронной почты и значениях большинства полей заголовков. В этом документе определены усовершенствования формата интернет-сообщений (RFC 5322) и MIME, позволяющие напрямую использовать UTF-8, а не только ASCII в значениях полей заголовка, включая почтовые адреса. Определен новый тип медиа message/global для сообщений, использующих этот расширенный формат. Эта спецификация также снимает ограничение MIME на кодировку при передаче неидентификационных данных для любого подтипа сообщений верхнего уровня, так что части message/global можно безопасно передавать по существующей почтовой инфраструктуре.

RFC 6533

Интернационализация уведомлений о доставке и расположении сообщений

Этой спецификацией добавляется новый тип интернационализированных адресов электронной почты, позволяющий корректно сохранять исходный адрес получателя, содержащий символы, отличные от ASCII, после понижения версии поддерживаемого стандарта. Кроме того, в ней представлен обновленный список типов данных возвращаемого содержания для уведомлений о доставке и расположении сообщений для поддержки использования нового типа адресов.

RFC 8398

Интернационализированные адреса электронной почты в сертификатах X.509

Этот документ определяет новую форму имени для включения в поле otherName расширения альтернативного имени субъекта X.509 и альтернативного имени издателя, которое позволяет связать субъекта сертификата с интернационализированным адресом электронной почты.

RFC 8399

Обновления RFC 5290 для интернационализации Описанные в этом документе обновления RFC 5280

обеспечивают соответствие спецификации 2008 года для интернационализированных доменных имен (IDN-доменов) и добавляют поддержку интернационализированных адресов электронной почты в сертификатах X.509.

Ключевые стандарты

ISO 10646 (Unicode)

Чтобы обеспечить общую техническую основу для обработки электронной информации на разных языках, Международная организация по стандартизации (ISO) разработала международный стандарт кодирования под названием ISO 10646. ISO 10646 вводит единый стандарт кодирования символов на всех основных языках мира, включая традиционные и упрощенные китайские иероглифы. Этот широкий набор символов называется универсальным набором символов (UCS). Тот же набор символов определяется стандартом Unicode, в котором дополнительно определены дополнительные свойства символов и другие сведения о применении, представляющие большой интерес для разработчиков. Unicode — это система кодирования символов, разработанная Консорциумом Unicode для поддержки обмена, обработки и отображения текстов на всех основных языках мира. ISO 10646 и Unicode определяют несколько видов кодирования их общего набора: UTF-8, UCS-2, UTF-16, UCS-4 и UTF-32.

GB18030 (Китай)

GB 18030-2000 — это государственный стандарт Китая, который определяет расширенную кодовую страницу для использования на китайском рынке в дополнение к UTF-8. Кодом внутренней обработки набора символов может и должен быть Unicode; однако стандарт предусматривает, что поставщики программного обеспечения должны гарантировать успешную передачу данных между GB18030 и кодом внутренней обработки. Для всех без исключения продуктов, которые в настоящее время продаются или будут продаваться в Китае, необходимо спланировать переход на поддержку кодовой страницы GB18030. GB18030 — «обязательный стандарт», и правительство Китая регулирует процесс сертификации для более глубокого внедрения GB18030.