Internationalized Resource Identifier
IRI (англ. Internationalized Resource Identifier) — интернационализированный идентификатор ресурса. По‐английски «IRI» произносится /aɪɑraɪ/, по‐русски иногда произносят [и́ри]. IRI — это короткая последовательность символов, идентифицирующая абстрактный или физический ресурс на любом языке мира. Идентификаторы IRI призваны в будущем заменить URI.
Основы
IRI — это символьная
http://ru.wikipedia.org/wiki/Кириллица
кодируется в URL как:
http://ru.wikipedia.org/wiki/%D0%9A%D0%B8%D1%80%D0%B8%D0%BB%D0%BB%D0%B8%D1%86%D0%B0
Подробнее о кодировании см. URL.
В итоге URI во всех языках, кроме основанных на базовой
В остальном идентификаторы IRI пока почти идентичны URI. Существует возможность несложной конвертации (англ. mapping) между идентификаторами URI и IRI.
История
Разработка IRI началась примерно в ноябре
Применение
В настоящее время IRI уже применяются в следующих технологиях:
Существует также предложение об использовании Юникода (в формате UTF-8) в системе доменных имён DNS — система IDNA[англ.], основанная на Punycode.
Проблемы
Для однозначной идентификации адреса, например в ссылке, придется применять особые методы — например, дополнительное оформление для разных символов с одинаковым начертанием (например, символы А, В, Е, К, М, Н, О, Р, С, Т, Х в кириллице и латинице) — отличающиеся шрифты, цвета и т. п., либо владелец, скажем, домена «example.com» будет вынужден приобретать все домены, в которых содержатся такие символы в любой комбинации, которых в данном случае несколько: два «e», «x», «а» и «p», во избежание действий злоумышленников, которые могут выдать такой «смешанный» домен за сайт владельца домена «example.com», и получить конфиденциальную информацию от посетителей через формы.
Также необходимо будет регистрировать желаемые домены на всех языках мира, частично, по тем же причинам. В случае торговых марок проблему можно будет решить правовыми методами, а вот с такими сайтами, как «а.ком» и «a.com» дело обстоит иначе. Самому посетителю будет сложно разобраться с такими адресами, если это, например, чьи‑то
Некоторые[кто?] считают, что ограничение доменного имени латинскими символами так же естественно, как для операторов в языках программирования. Проблема же названий файлов и разделов может успешно решаться браузерами: например, Opera 8.5 и Firefox 3.0 отображают адрес «http://ru.wikipedia.org/wiki/Кириллица
» именно так, кодируя его лишь для передачи запроса серверу.
См. также
Ссылки
- RFC 3987 (IRI)
- RFC 3986 / STD 66 (URI)
- Общее представление идентификаторов IRI от W3C
- Рабочая группа интернационализации при W3C
В статье не хватает ссылок на источники (см. рекомендации по поиску). |