/* 04.05.2006 */
Ссылки на символы в HTML4
В мире существует большое количество языков и просто огромное количество символов. HTML4 позволяет нам использовать большую часть из них, причем использовать на одной странице китайские иероглифы, кириллицу и иврит. Однако не всегда возможно указать явно какие-то символы в документе, и связано это с кодировкой документа, ограничивающей наши возможности, но ссылки-мнемоники на символы, позволяют обойти ограничения кодировок.
Источник проблем
HTML страница - это обычный текстовый файл. Какие символы позволяет использовать HTML4? Любые символы Unicode, а это знаки практически всех письменных языков. Т.е. вы можете создавать свои страницы в кодировке Unicode и использовать явным образом в документе огромное количество символов из различных алфавитов (но для этого редактор должен поддерживать Unicode; так же имейте ввиду, что документ в кодировке юникод имеет, больший размер, так как один символ кодируется не одним байтом, как в различных национальных кодировках, а несколькими байтами (но есть и исключения), например, данная статья в юникод-кодировке UTF-8 имеет размер в 1,5 раза больший чем в кодировке windows-1251, и в 2 раза больше размер будет в кодировке UTF-16). Однако пока большинство документов в сети используют 8-битные кодировки, ограниченные набором символов из 256 элементов. Таким образом, используемая в документе кодировка может ограничивать набор символов документа лишь теми символами, которые она "знает". Поэтому HTML предлагает механизм, называемый ссылки на символы, для представления любых юникод-символов в документе независимо от кодировки документа.
Ссылки-мнемоники на символы в HTML 4
Ссылки на символы - это конструкции специального вида, встречая которые браузер заменяет их на соответствующие Unicode-символы. Например, встречая на странице конструкцию π или π браузер знает, что это ссылка на юникод-символ греческой pi - π, и заменяет конструкцию на данный символ. Ссылки на символ (мнемоники) могут быть двух видов:
- Цифровые мнемоники (десятеричные или шестнадцатеричные);
- Именные мнемоники.
Цифровые мнемоники
Цифровые ссылки-мнемоники на символы указывают кодовую позицию символа в символьном наборе документа. Цифровые мнемоники бывают двух видов:
- "&#D;", где D, десятеричное число, ссылается на десятеричное значение D символа Unicode (ISO 10646;)
- "&#xH;" или "&#XH;", где H, шестнадцатеричное число, ссылается на шестнадцатеричное значение H символа Unicode (ISO 10646). Шестнадцатеричные числа в цифровых мнемониках нечувствительны к регистру.
Примеры:
- å (å) - представляет букву "a" с маленьким кружком сверху (используется, напр., в Норвегии) заданная десятичным числом;
- å или å - та же самая буква что и выше но заданная шестнадцатеричным числом;
Именные мнемоники (ссылки-мнемоники по псевдониму)
Некоторые, наиболее часто используемые мнемоники имеют имена (псевдонимы), например, ранее упомянутая мнемоника π имеет также псевдоним π. Как видно, псевдоним запомнить намного проще, чем кодовую позицию символа.
Следует отметить, что HTML 4 определяет символьные мнемоники не для всех символов кодового набора, а так же слудует знать, что символьные мнемоники чувствительны к регистру. Так, именная мнемоника Å ссылается на заглавную Å , а å на строчную å.
Будте осторожны
Иногда в тексте документа необходимо использовать символы "<" и ">" которые зарезервированы как служебные для обрамления дескрипторов. Поэтому в тексте, воизбежании возможных конфликтов с началом или концом тега, данные символы следует заменять на их мнемоники < для "<" и > для ">".
Также обратите внимание на использование самого символа "&". Так как он зарезервирован в качестве начала ссылки-мнемоники, то в тексте его следует заменять на мнемонику &
И ещё. Значения атрибутов дескрипторов обрамляются двойными кавычками ("), поэтому при необходимости указать кавычки в значении атрибута вы можете использовать мнемонику ", чтобы избежать конфликта с закрывающимися кавычками.