Описание
string
htmlspecialchars
( string string [, int quote_style [, string charset]] )
В HTML некоторые символы имеют специальное значение и для
сохранения своего значения должны быть преобразованы в HTML сущности.
Эта функция возвращает строку, над которой проведены некоторые из
таких преобразований. Этих преобразований достаточно для большинства
задач веб-программирования. Если вам нужно преобразовать все
возможные сущности, используйте htmlentities()
.
Эта функция полезна при отображении данных, введенных пользователем,
которые могут содержать нежелательные HTML тэги, например в форуме
или гостевой книге. Необязательный второй аргумент
quote_style
определяет режим обработки
одиночных и двойных кавычек.
В режиме по умолчанию, ENT_COMPAT
, преобразуются
двойные кавычки, одиночные остаются без изменений. В режиме
ENT_QUOTES
преобразуются и двойные, и одиночные
кавычки. а в режиме ENT_NOQUOTES
и двойные, и
одиночные кавычки остаются без изменений.
Производятся следующие преобразования:
'&' (амперсанд) преобразуется в '&'
'"' (двойная кавычка) преобразуется в '"' when ENT_NOQUOTES
is not set.
''' (одиночная кавычка) преобразуется в ''' только в
режиме ENT_QUOTES
.
'<' (знак "меньше чем") преобразуется в '<'
'>' (знак "больше чем") преобразуется в '>'
Обратите внимание, что функция не производит других преобразований
кроме описанных выше. Для преобразования всех HTML сущностей
используйте htmlentities()
. Поддержка
необязательного второго аргумента была добавлена в PHP 3.0.17 и PHP
4.0.3.
Необязательный третий аргумент charset
определяет кодировку, используемую при преобразовании. По умолчанию
используется кодировка ISO-8859-1. Поддержка этого аргумента была
добавлена в PHP 4.1.0.
Начиная с PHP 4.3.0 поддерживаются следующие кодировки.
Таблица 1. Поддерживаемые кодировки
Кодировка |
Псевдонимы |
Описание |
ISO-8859-1 |
ISO8859-1 |
Западно-европейская Latin-1
|
ISO-8859-15 |
ISO8859-15 |
Западно-европейская Latin-9. Добавляет знак евро, французские и
финские буквы к кодировке Latin-1(ISO-8859-1).
|
UTF-8 |
|
8-битная Unicode, совместимая с ASCII.
|
cp866 |
ibm866, 866 |
Кириллическая кодировка, применяемая в DOS.
Поддерживается в версии 4.3.2.
|
cp1251 |
Windows-1251, win-1251, 1251 |
Кириллическая кодировка, применяемая в Windows.
Поддерживается в версии 4.3.2.
|
cp1252 |
Windows-1252, 1252 |
Западно-европейская кодировка, применяемая в Windows.
|
KOI8-R |
koi8-ru, koi8r |
Русская кодировка.
Поддерживается в версии 4.3.2.
|
BIG5 |
950 |
Традиционный китайский, применяется в основном на Тайване.
|
GB2312 |
936 |
Упрощенный китайский, стандартная национальная кодировка.
|
BIG5-HKSCS |
|
Расширенная Big5, применяемая в Гонг-Конге.
|
Shift_JIS |
SJIS, 932 |
Японская кодировка.
|
EUC-JP |
EUCJP |
Японская кодировка.
|
Замечание:
Не перечисленные выше кодировки не поддерживаются, и вместо них
применяется ISO-8859-1.