Как обзывается кодировка в урле выдачи поисковиков. – Яндекс – Поисковые системы – Форум об интернет-маркетинге

“Символы, которые не могут быть отправлены по сети (все кроме латиницы, цифр и ряда знаков), предварительно кодируются с помощью алгоритма x-www-form-urlencoded. Байты кодировки заменяются на последовательности вида%XX. Вместо XX подставляются две шестнадцатеричные цифры (http://www. faqs. org/rfcs/rfc1738). Стоп. Самый главный вопрос: x-www-form-urlencoded – это кодировка или нет? Традиционно под кодировкой понимают комбинацию набора символов и схемы кодирования. Например, когда говорят utf-8, то подразумевают схему кодирования utf-8 и набор символов Unicode, ровно, как и для utf-16. А если вы слышите windows-1251, то здесь название кодировки дано по названию набора символов. Т. к. как такового отдельного алгоритма кодирования цифры, под которой в данном наборе фигурирует, например, буква “Ы” – нет. Просто 8 бит – бери и пиши их в файл как есть, без каких-либо дополнительных преобразований. Так что x-www-form-urlencoded – это не кодировка, это способ отправить те самые байты, в которые было выполнено преобразование строки текста согласно некоторой “настоящей” кодировке (точнее схеме кодирования). Следовательно, если я открываю адрес вида: http: //Мой-сайт. ru/ящики_с_пивом
То, в зависимости от используемой кодировки, данные будут отправлены либо так:%FF%F9%E8%EA%E8_%F1_%EF%E8%E2%EE%EC – так выглядит слово “ящики с пивом” в кодировке windows-1251%D1%8F%D1%89%D0%B8%D0%BA%D0%B8_%D1%81_%D0%BF%D0%B8%D0%B2%D0%BE%D0%BC – а так выглядит это слово в кодировке utf-8.
Возвращаясь к анализу двух примеров запроса данных, мы нигде не видим указания на то какая кодировка используется для отправки данных. Может, у меня не правильный браузер, и какие то другие, правильные, браузеры указывают кодировку отправляемых данных? Увы, ни internet explorer 6, 7 ни firefox 2, 3 ни opera 9. 5 не указывают сведений о кодировке. ”
Источник:
http://www. black-zorro. com/mediawiki/Java_ru_1#. D0. A2. B8. BF. BE. B2. D1. 8B. B5_. 80. B1. BB. B5. BC. 8B_. 81_. BA. 82. B8_. 81. B0. 8E. 8F_java-. B7. 87