RFC и ключевые стандарты
RFC, относящиеся к IDN-доменам
RFC 3492
Punycode: Bootstring-кодирование строк Unicode для
интернационализированных доменных имен в приложениях
(IDNA)
Punycode обеспечивает обратимое преобразование строки в
формате Unicode в уникальную строку ASCII. Этот RFC
определяет общий алгоритм, который называется Bootstring.
Данный алгоритм позволяет с помощью строки базовых кодов
символов уникальным образом представлять любые строки кодов символов, принадлежащих к более широкому набору.
RFC 5890
Интернационализированные доменные имена в приложениях
(IDNA)
Этот RFC содержит описание протокола и среды использования
интернационализированных доменных имен в приложениях
(IDNA) в действующей редакции.
RFC 5891
Протокол «Интернационализированные доменные имена в
приложениях (IDNA)»
Этот RFC определяет механизм протокола, который называется
«Интернационализированные доменные имена в приложениях
(IDNA)» и предназначен для регистрации и поиска IDN-доменов
без необходимости изменения самой DNS.
RFC 5892
Коды символов Unicode и интернационализированные
доменные имена в приложениях (IDNA)
RFC 5892 устанавливает правила принятия решений о том, может
ли та или иная кодовая точка с учетом или без учета контекста
использоваться в составе интернационализированного доменного
имени (IDN-домена).
RFC 5893
Использование алфавитов с направлением письма справа
налево для интернационализированных доменных имен в
приложениях (IDNA)
Этот RFC вводит новое правило двунаправленного отображения
меток интернационализированных доменных имен в приложениях
(IDNA) при использовании алфавитов с направлением письма
справа налево.
RFC 5894
Интернационализированные доменные имена в приложениях
(IDNA): История вопроса, пояснение и обоснование
В этом справочном документе представлен обзор
пересмотренной системы, которая способна обрабатывать новые
версии Unicode, и пояснительные материалы к ее компонентам.
RFC 5895
Преобразование символов интернационализированных
доменных имен в приложениях (IDNA) 2008
В этом RFC описываются действия, которые могут выполняться в
том или ином варианте реализации протокола после получения
введенных пользователем данных перед передачей допустимых
кодов символов в новый протокол IDNA (2008). В нем указано,
какую операцию обработки пользовательского ввода необходимо
выполнить, чтобы подготовить введенные данные для
использования в сетевом протоколе. Этот документ также
содержит общую процедуру реализации преобразования.
RFC, относящиеся к EAI
RFC 6530
Общие сведения и концепция интернационализации
электронной почты
Этим стандартом вводится ряд спецификаций, определяющих
механизмы и расширения протоколов, которые необходимы для
полной поддержки интернационализированных адресов
электронной почты. В этом документе описывается, как
различные элементы интернационализации электронной почты
сочетаются друг с другом, а также описываются взаимосвязи
между основными спецификациями, связанными с передачей
сообщений, форматами заголовков и обработкой.
RFC 6531
Расширение протокола SMTP для интернационализации
электронной почты
В этом документе описано расширение протокола Simple Mail
Transfer Protocol, позволяющее серверам оповещать о
возможности приема и обработки интернационализированных
адресов электронной почты и интернационализированных
заголовков электронной почты.
RFC 6532
Заголовки сообщений при интернационализации
электронной почты
В этом документе указаны усовершенствования формата
интернет-сообщений и MIME, позволяющие использовать Unicode
в адресах электронной почты и значениях большинства полей
заголовков. В этом документе определены усовершенствования
формата интернет-сообщений (RFC 5322) и MIME, позволяющие
напрямую использовать UTF-8, а не только ASCII в значениях
полей заголовка, включая почтовые адреса. Определен новый
тип медиа message/global для сообщений, использующих этот
расширенный формат. Эта спецификация также снимает
ограничение MIME на кодировку при передаче
неидентификационных данных для любого подтипа сообщений
верхнего уровня, так что части message/global можно безопасно
передавать по существующей почтовой инфраструктуре.
RFC 6533
Интернационализация уведомлений о доставке и
расположении сообщений
Этой спецификацией добавляется новый тип
интернационализированных адресов электронной почты,
позволяющий корректно сохранять исходный адрес получателя,
содержащий символы, отличные от ASCII, после понижения
версии поддерживаемого стандарта. Кроме того, в ней
представлен обновленный список типов данных возвращаемого
содержания для уведомлений о доставке и расположении
сообщений для поддержки использования нового типа адресов.
RFC 8398
Интернационализированные адреса электронной почты в
сертификатах X.509
Этот документ определяет новую форму имени для включения в
поле otherName расширения альтернативного имени субъекта
X.509 и альтернативного имени издателя, которое позволяет
связать субъекта сертификата с интернационализированным
адресом электронной почты.
RFC 8399
Обновления RFC 5290 для интернационализации
Описанные в этом документе обновления RFC 5280
обеспечивают соответствие спецификации 2008 года для
интернационализированных доменных имен (IDN-доменов) и
добавляют поддержку интернационализированных адресов
электронной почты в сертификатах X.509.
RFC 6783
Списки рассылки с использованием не-ASCII адресов
В данной спецификации описаны рекомендации по составлению списков рассылки с использованием символов в формате UTF-8 в адресах электронной почты, т.е. символов отличных от ASCII. Описание затрагивает некоторые возможные сценарии обработки списков рассылки, в которых есть как традиционные адреса электронной почты, так и адреса с не-ASCII символами.
RFC 6855
Поддержка UTF-8 в протоколе IMAP
Данная спецификация расширяет протокол Internet Message Access Protocol (IMAP) поддержкой символов в формате UTF-8 в именах пользователей, в адресах электронной почты и в заголовках почтовых сообщений. Заменяет собой устаревшую спецификацию RFC 5738.
RFC 6856
Поддержка UTF-8 в протоколе POP3
Данная спецификация расширяет протокол Post Office Protocol Version 3 (POP3) поддержкой символов в формате UTF-8 в именах пользователей, в паролях, в адресах электронной почты, в заголовках почтовых сообщений и в текстовых строках протокольного уровня. Заменяет собой устаревшую спецификацию RFC 5721.
RFC 6857
Преобразование интернационализированных почтовых сообщений для обеспечения их поддержки клиентом
В данной спецификации описан механизм преобразования интернационализированных почтовых сообщений полученных серверами POP3 и IMAP в традиционный формат для передачи их клиентскому программному обеспечению, которое не поддерживает интернационализированные почтовые сообщения. Механизм содержит процесс конвертации интернационализированных элементов почтового сообщения, в ходе которого эти элементы перекодируются или вовсе удаляются. В последнем случае сохраняется возможность информировать получателя о том, что почтовое сообщение содержало такие элементы и они не были обработаны.
RFC 6858
Упрощенное преобразование интернационализированных почтовых сообщений для серверов POP и IMAP
Спецификация содержит методику доставки почтовыми серверами POP и IMAP интернационализированных почтовых сообщений клиентскому программному обеспечению, не поддерживающему интернационализацию, в упрощенном и легко доступном к внедрению виде, обеспечивающем только базовый результат.
Ключевые стандарты
ISO 10646 (Unicode)
Чтобы обеспечить общую техническую основу для обработки электронной информации на разных языках, Международная организация по стандартизации (ISO) разработала международный стандарт кодирования под названием ISO 10646. ISO 10646 вводит единый стандарт кодирования символов на всех основных языках мира, включая традиционные и упрощенные китайские иероглифы. Этот широкий набор символов называется универсальным набором символов (UCS). Тот же набор символов определяется стандартом Unicode, в котором дополнительно определены дополнительные свойства символов и другие сведения о применении, представляющие большой интерес для разработчиков. Unicode — это система кодирования символов, разработанная Консорциумом Unicode для поддержки обмена, обработки и отображения текстов на всех основных языках мира. ISO 10646 и Unicode определяют несколько видов кодирования их общего набора: UTF-8, UCS-2, UTF-16, UCS-4 и UTF-32.
GB18030 (Китай)
GB 18030-2000 — это государственный стандарт Китая, который определяет расширенную кодовую страницу для использования на китайском рынке в дополнение к UTF-8. Кодом внутренней обработки набора символов может и должен быть Unicode; однако стандарт предусматривает, что поставщики программного обеспечения должны гарантировать успешную передачу данных между GB18030 и кодом внутренней обработки. Для всех без исключения продуктов, которые в настоящее время продаются или будут продаваться в Китае, необходимо спланировать переход на поддержку кодовой страницы GB18030. GB18030 — «обязательный стандарт», и правительство Китая регулирует процесс сертификации для более глубокого внедрения GB18030.