Проблема Sape и кириллических символов в URL
Перенеся сайт на новый хостинг, столкнулся с проблемой в системе
Sape
и URL’ами, содержащими кириллические символы. Система индексировала данные страницы, но из-за какой-то ошибки не добавляла купленные ссылки на них и впоследствии купленные ссылки попадали в Error. Пришлось немного помозговать и поискать на разных источниках решения данной проблемы.
Во-первых. Никаких кириллических символов в URL, как таковых, нет и быть не может! Для этого используется особое кодирование. То есть сначала каждый символ кодируется в Юникоде (UTF-8) в последовательность из двух байт, а потом каждый байт данной последовательности записывается в шестнадцатеричном представлении. Перед каждым таким шестнадцатеричным кодом байта, согласно спецификации URL ставится знак процента (%).
Сайт работает на CMS Livestreet ,а там как знаете используется шаблонизатор Smarty и различные способы описанные на форуме sape не подходят.
Рассмотрим на примере
В строке вида:
http://neopier.com/tag/комедия/
http://neopier.com/tag/скачать%20с%20торрента/
Работа скрипта проверенна в DLE и Livestreet
Источник:8dle.ru, DLE
💬 Комментарии
В связи с новыми требованиями законодательства РФ (ФЗ-152, ФЗ «О рекламе») и ужесточением контроля со стороны РКН, мы отключили систему комментариев на сайте.
🔒 Важно Теперь мы не собираем и не храним ваши персональные данные — даже если очень захотим.
💡 Хотите обсудить материал?
Присоединяйтесь к нашему Telegram-каналу:
https://t.me/blogssmartzНажмите кнопку ниже — и вы сразу попадёте в чат с комментариями