IDN - Многоязычные доменные имена
Многоязычные доменные имена - что это такое?
В настоящее время термин IDN (Internationalized Domain Names -
Многоязычные Доменные Имена) прочно вошел в лексикон Международного Интернет-сообщества.
В отличие от обычного имени домена, например, AMAZON.COM или SEGODNYA.RU,
многоязычное имя записывается полностью или частично на языке, отличном от английского.
Исторически сложилось так, что Интернет зародился в англоязычной среде и ограничением
существующей системы доменных имен (DNS) является то, что для записи имен необходимо
использовать только 37 символов ASCII (латинские буквы от A до Z, цифры и символ "-"),
но бурный и опережающий рост количества пользователей Интернет в остальной части мира в
последние несколько лет заставил Интернет эволюционировать, предоставив надёжную поддержку
неанглоязычных доменных имен и для того, чтобы Интернет стал действительно глобальным
средством общения и бизнеса, необходимо было дать возможность всем потребителям и
компаниям входить в Интернет-экономику, используя свои родные языки.
Многоязычные доменные имена - какие преимущества?
- это более удобно для жителей России, ведь Русский - их родной язык
- более удобно для ведения дел, ведь Русский - это государственный язык
- позволяет людям общаться с Интернет на том языке, к которому они привыкли и с которым чувствуют себя комфортно
- решает проблему исчерпания доменных имён, открывая новые возможности для рекламы и расширяя пространство доменных имён
- даёт возможность русскоязычным людям использовать мощь Интернет в электронной коммерции, открывая новые рынки
- закрепляет индивидуальность личности или компании, позволяя доменным именам отражать торговые марки
Многоязычные доменные имена - кто первопроходцы?
Первыми начали разработку Многоязычной Системы Доменных Имён (IDNS) участники исследовательского
проекта Национального Университета Сингапура, реализованного под покровительством
Азиатско-Тихоокеанского Сетевого Объединения (APNG) в 1998 году. В 1999 году,
совместно с APNG и сетевыми информационными центрами
Китая, Японии, Кореи, ГонКонга, Тайваня, Малайзии, Тайланда и Сингапура,
технология была успешно протестирована на протяжении периода в 6 месяцев.
Результаты были анонсированы в 1999 году на Азиатско-Тихоокеанской конференции
действующих интернет-технологий (APRICOT) в Сингапуре, а также на ежегодной
конференции интернет-сообщества (INET) в Сан-Хосе.
В том же году при поддержке General Atlantic Partners, была зарегистрирована корпорация
i-DNS.net International,
для того, чтобы сделать решения IDNS коммерческой реальностью.
Регистрация полностью многоязычных доменных имён на китайском языке была запущена компанией
i-DNS.net в декабре 1999 года в Тайване. В первые же четыре дня после открытия регистрации
было зарегистрировано 90 тысяч имен! В течение 2000 года многоязычные доменные имена
завоевали признание Интернет-сообщества в Китае и Индии, Таиланде и Египте, США и Израиле.
В мае 2001 года компания RegTime.net, официальный регистратор i-DNS.net, впервые в мире
запустил регистрацию полностью русских имен в зонах .КОМ, .НЕТ и ОРГ, открыв тем самым
новые возможности для развития Интернет в России.
Многоязычные доменные имена - кто поддерживает?
В конце 1999 года в Целевой Группе Проектирования Интернет (IETF) была создана Рабочая
группа Многоязычных Доменных Имен (IDN WG). Целью рабочей группы является разработка
стандарта для использования доменных имен на национальных языках. Сопредседателем рабочей
группы был избран James Seng - Технологический директор i-DNS.net International.
В разработке документов рабочей группы принимают активное участие специалисты из
ведущих научных центров и компаний, заинтересованных в развитии Интернет, таких
как Berkeley University, TWNIC, CNNIC, JPNIC, Cisco Systems и многих других.
Консорциум Многоязычных Интернет Имен (MINC)
- некоммерческая, неправительственная,
международная организация создан для содействия интернационализации имен Интернет, включая домены
и ключевые слова, разработки соответствующих стандартов и протоколов, технической координации и
связи с другими международными организациями. Членами Консорциума являются более сорока
корпоративных и индивидуальных членов со всех континентов. Среди членов Консорциума промышленные,
академические, исследовательские, правительственные, международные организации, частные лица и
инвесторы.
В составе Консорциума, которй в настоящее время является Координатором Многоязычной системы
имен Интернет, действуют рабочие группы по направлениям и языкам.
Главными задачами MINC в настоящее время являются:
- развёртывание системы имен интернет на национальных языках в соответствие со стандартами, принимаемыми IETF
- утверждение доменов верхнего уровня на национальных языках
- утверждение политики споров по именам
- обеспечение функционирования доменов верхнего уровня на национальных языках на корневых серверах Интернет.
В октябре 2001 года в MINC была создана Рабочая группа Русского языка (RLWG), в
Координационный Совет которой вошли представители науки и бизнеса,
заинтересованные в развитии русскоязычной системы имен Интернет.
Цели Рабочей Группы - координации усилий по развитию Русскоязычной системы Имен Интернет,
предоставляющей людям возможность:
- использования Русского языка и его стандартных кодовых комбинаций для написания имен доменов или ключевых слов и навигации по Интернет;
- получения и отправки сообщений электронной почты, используя русский язык для написания адресов;
- использования других ресурсов глобальных и локальных сетей, таких как ftp, gother и др., применяя русский язык.
Для достижения поставленных целей Рабочая Группа работает в следующих направлениях:
- рассмотрение и обсуждение всех проблем, связанных с выпуском Русскоязычной системы имен Интернет;
- оценка технической возможности применения различных кодировок русского языка для интернет адресов;
- оценка воздействия на существующие стандарты и операции;
- представление требуемой документации и спецификаций для соответствующих органов (MINC PA WG, IETF IDN WG);
- уведомление совета MINC о всех вопросах и деятельности, имеющей отношение к русскоязычным именам Интернет;
- координация развертывания системы Русскоязычных Имен Интернет для регистратур, регистраторов и Интернет-Сервис Провайдеров.
Многоязычные доменные имена - как это работает?
Суть IDN технологии элегантна и проста и состоит в том, что все многоязычные имена должны быть
преобразованы из UNICODE в ASCII совместимый код ACE (ASCII Compatible Encoding) на стороне
клиента, и в таком виде отправляться в систему DNS.
На серверах имен многоязычные домены также прописываются в ACE коде.
Например, запись о домене РЕГТАЙМ.НЕТ выглядит на DNS сервере (BIND UNIX)
следующим образом:
zone "xn--80affsptq.xn--e1apq" {
type master;
file "filename";
};
и, соответственно, в файле зоны:
@ A 195.128.128.75
Таким образом, действующая система DNS совершенно не затрагивается при развертывании
Многоязычной системы имен Интернет.
Однако, в некоторых случаях требуется добавление зоны для домена с суффиксом ".aced.net" - "xn--80affsptq.xn--e1apq.aced.net".
Многоязычные доменные имена - сегодня и завтра
Являясь первопроходцем IDN, компания i-DNS.net, руководствуясь действующими стандартами и
рекомендациями IETF, развернула в 1999 году Многоязычную систему имен Интернет, базирущейся
на собственной сети корневых серверов. Корневые серверы i-DNS.net, являясь прозрачными для
обычных имен, обеспечивают функционирование зон для доменов верхнего уровня на китайском,
японском, корейском, арабском, иврите, русском и др. языков, отличных от английского.
В настоящее время пользователям Интернет, желающим расширить свои возможности используя
многоязычную систему имен, необходимо установить на своем компьютере бесплатную
программу-плагин, выполняющую преобразования многоязычных имен и направляющую
запросы через систему корневых серверов i-DNS.net. Установка плагина занимает
несколько секунд и производится полностью в автоматическом режиме.
После завершения процесса стандартизации IDN, преобразование многоязычных имен из
UNICODE в ACE и обратно будет выполняться непосредственно приложениями
(MS Internet Explorer и т.п.) и будет полностью скрыто от
пользователя, а многоязычная система имен Интернет будет продолжать функционирование
на Авторитетных Корневых серверах DNS.
Стандарты IDN
Технически русскоязычные домены функционируют
в соответствии со следующими стандартами IDN, утверждёнными IETF и IANA:
- RFC3490 — Internationalizing Domain Names in Applications (IDNA). Определение интернационализированных доменных имен (ИДН) и описание механизма IDNA, позволяющего использовать ИДН в приложениях.
- RFC3491 — Nameprep: Stringprep Profile for Internationalized Host Names. Протокол для подготовки текстовых строк, используемых для обозначения имен хостов.
- RFC3492 — Punycode: A Bootstring encoding of Unicode for IDNA. Punicode — простой и эффективный метод кодирования для представления интернационализированных доменных имен, уникально транслирующий строку из UNICODE в код АSCII и обратно.
- RFC3454 — Stringprep: Preparation of Internationalized Strings. Протокол ввода для текстовых строк, используемых для интернационализированных доменных имен.
Суть технологии состоит в том, что все многоязычные имена
преобразуются из UNICODE в ASCII совместимый код
(ACE ASCII Compatible Encoding) на стороне клиента,
и в таком виде отправляются в систему DNS.
ASCII совместимый код (ACE) служит для того,
чтобы представить строки состоящие из символов набора
UNICODE с помощью латинских букв нижнего регистра и цифр,
то есть с помощью символов, которые допускаются
для имён доменов в традиционной системе DNS.
Для использования в многоязычной системе имён
(iDNS) применяется алгоритм Punycode.
Глоссарий
- IDN — International Domain Names. Многоязычные доменные имена
- iDNS — Internationalized Domain Name System. Интернациональная Доменная Система Имен. Технология разработанная и поддерживаемая компанией i-DNS.net International. Аналог системы DNS с возможностью регистрации доменных имен на национальных языках.
- UNICODE. Универсальный набор символов, включающий в себя
практически все символы всех алфавитов, используемых в мире.
Каждому символу из этого набора сопоставлен определённый код.
- ACE — ASCII Compatible Encoding. ASCII
совместимый код. ACE не является конкретной кодировкой,
а представляет из себя название целого семейства кодировок.
Кодировки ACE служащат для того, чтобы преставить строки состоящие
из символов набора UNICODE с помощью последовательности символов из набора ASCII.
(Допускаются не любые символы ASCII, а только те символы,
которые разрешены для использования в именах доменов -
в этом отличие семейства кодировок ACE от семейства кодировок UTF-5).
Для использования в многоязычной системе имён
(iDNS) в настоящее время применяется
кодировка Punycode. Ранее для этих целей использвалась кодировка RACE.
- Punycode. Кодировка из семейства ASCII-совместимых кодировок (ACE), применяемая в настоящее время
в системе многоязычных доменных имён. Алгоритм кодирования Punycode описан в
RFC-3492.
Примеры представления строк в Punycode:
русское слово "домены" будет выглядеть как "d1acufc5f",
а буквосочетание "ру" будет представлено в виде "p1ag".
Для использования в именах доменов к преобразованному
в Punycode имени домена (точнее, к каждой из составных частей
имени домена, разделённых точкой) добавляется префикс "xn--".
Таким образом, имя домена "домены.ру"
преобразовывается в строку "xn--d1acufc5f.xn--p1ag".
- RACE — Row Based ASCII-Compatible Encoding. Кодировка из семейства ASCII-совместимых кодировок
(ACE), применявшаяся ранее в системе многоязычных доменных имён.
- UTF — Uniform Transformation Format. Метод представления символов из набора UNICODE
(например символов национальных алфавитов) с помощью последовательностей байтов.
UTF-5 — представление с помощью символов ASCII (используется 5 бит).
UTF-8 — представление в виде восьмибитовых символов.
- ASCII — American Standard Code for Information Interchange. Стандартный набор из 128 символов, поддерживаемый правтически всеми
современными вычислительными машинами. Включает в себя латинские буквы,
цифры, знаки препинания и некоторые управляющие символы.
Не содержит символов национальных алфавитов,
использующих не-латинский набор литер.
Регистрация доменов .SU на национальном языке (IDN)
Традиционно доменные имена в Интернете пишутся латинскими буквами.
Домен SU - не исключение, в нем регистрируются доменные имена,
состоящие из латинских букв и некоторых иных допустимых символов.
Поддержка доменов на национальных языках (IDN) требует введения ряда
новых технологий. Поскольку система DNS работает только с латиницей,
то реализация «многоязычия» невозможна путем прямой регистрации таких
доменных имен в Реестре. Поэтому «доменное имя» из символов национальных
алфавитов, введенное в адресную строку браузера, преобразуется средствами
самого браузера в традиционное латинское, которое и должно быть
зарегистрировано в Реестре. На сегодняшний день такое преобразование
осуществляют практически все браузеры последних версий, самостоятельно
либо с установкой дополнительных плагинов.
В качестве примера приведем домен РОСНИИРОС.SU. Он не является доменным
именем в традиционном понимании. Это IDN, мы называем его также представлением
домена. IDN'у РОСНИИРОС.SU соответствует традиционное доменное имя
на латинице XN--H1AANDDHEEF.SU, которое получается из имени РОСНИИРОС.SU
путем перекодировки с помощью алгоритма PUNYCODE. Если зарегистрировать
в Реестре доменное имя XN--H1AANDDHEEF.SU, то сделанные в адресной
строке браузера запросы к доменам РОСНИИРОС.SU и XN--H1AANDDHEEF.SU
будут открывать одну и ту же веб-страницу.
IDN'ам всегда соответствуют домены с префиксом xn-- .
28 апреля 2008 года Фонд Развития Интернет, Реестр домена SU,
снял ограничения на регистрацию доменных имен .SU с префиксом
xn--,
и сейчас у нас появилась возможность указывать в адресной строке браузера
IDN на языках более 250 различных стран мира, при использовании символов
следующих алфавитов:
Примеры допустимых доменных имён:
представления будут отображаться, если установлены соответствующие шрифты
Имя домена |
Представление имени |
xn--d1acufc.su |
домен.su |
xn----dtbitimui2ppa.su |
місто-кïев.su |
xn--jgbpi6aq.su |
دطجغؤ.su |
При регистрации IDN не допускается:
- одновременное использование в представлении домена символов из разных алфавитов;
- использование в представлении домена символов недопустимых алфавитов.
Примеры недопустимых доменных имён имён:
Недопустимое имя домена |
Причина |
xn--zka-cfdot.su |
Смешение букв из разных UNICODE таблиц в представлении |
xn--70a8d.su |
Не все символы представления входят в состав используемых UNICODE таблиц |
Регистрация доменов .NET, .COM, .CC, .TV, .NAME на национальном языке (IDN)
Традиционно доменные имена в Интернете пишутся латинскими буквами.
Поскольку система DNS работает только с латиницей, то реализация
«многоязычия»
невозможна путем прямой регистрации таких доменных имен в Реестре.
Поэтому «доменное имя» из символов национальных алфавитов, введенное
в адресную строку браузера, преобразуется средствами самого браузера
в традиционное
латинское, которое и должно быть зарегистрировано в Реестре.
На сегодняшний день
такое преобразование осуществляют практически все браузеры последних версий,
самостоятельно либо с установкой дополнительных плагинов.
В качестве примера приведем домен ДОМЕН.NET.
Он не является
доменным именем в традиционном понимании. Это IDN, мы называем
его также представлением домена. IDN'у ДОМЕН.NET соответствует
традиционное доменное имя на латинице
XN--D1ACUFC.NET, которое
получается из имени ДОМЕН.NET путем перекодировки с помощью алгоритма PUNYCODE.
IDN'ам всегда соответствуют домены с префиксом
xn--.
В доменах NET, COM, CC, TV, .NAME возможна регистрация IDN доменов на языках, которые
используют следующие алфавиты (шрифты): латинский, греческий, кириллица,
армянский, иврит, арабский, грузинский, бенгальский, ория, тамильский,
каннада, тайский, тибетский, бирманский, рунический, монгольский, корейский,
японские и китайские иероглифы.
При регистрации IDN домена в доменах NET, COM, CC, TV, .NAME нужно выбрать язык
(метку языка), который используется в представлении домена. В имени IDN
домена можно использовать только те символы, которые принадлежат алфавиту
выбранного языка. Изменить метку языка для уже зарегистрированного домена
невозможно.
RU-CENTER предлагает регистрацию IDN доменов в зонах NET, COM, CC, TV, .NAME на более,
чем 80 языках.
При регистрации IDN не допускается:
- одновременное использование в представлении домена символов
из разных алфавитов;
- использование в представлении домена символов недопустимых
алфавитов;
- использование символов алфавитов, не входящих в алфавит
указанного при регистрации домена языка.
|