Проблема Sape и кириллических символов в URL
Перенеся сайт на новый хостинг, столкнулся с проблемой в системе
Sape
и URL’ами, содержащими кириллические символы. Система индексировала данные страницы, но из-за какой-то ошибки не добавляла купленные ссылки на них и впоследствии купленные ссылки попадали в Error. Пришлось немного помозговать и поискать на разных источниках решения данной проблемы.
Во-первых. Никаких кириллических символов в URL, как таковых, нет и быть не может! Для этого используется особое кодирование. То есть сначала каждый символ кодируется в Юникоде (UTF-8) в последовательность из двух байт, а потом каждый байт данной последовательности записывается в шестнадцатеричном представлении. Перед каждым таким шестнадцатеричным кодом байта, согласно спецификации URL ставится знак процента (%).
Сайт работает на CMS Livestreet ,а там как знаете используется шаблонизатор Smarty и различные способы описанные на форуме sape не подходят.
Рассмотрим на примере
В строке вида:
http://neopier.com/tag/комедия/
http://neopier.com/tag/скачать%20с%20торрента/
Работа скрипта проверенна в DLE и Livestreet
Источник:8dle.ru, DLE