Копипаст: FAQ по утечке текстов SMS с сайта «Мегафона»
В: Как вдруг поисковик получил доступ к текстам SMS?
О: Да они всегда были всем доступны, by design. Напомню, что речь идёт об анонимной отправке SMS с сайта. Разумеется, для этого не надо быть абонентом «Мегафона», и не требуется регистрация на портале — в этом прелесть услуги, особенно когда вам дорога каждая секунда. Однако снабдить посетителя минимальными удобствами разработчики не поленились: для каждой попытки отправки генерируется страница со случайным адресом, на которой отображается текст SMS и статус её доставки. Вот её-то и может прочитать кто угодно, включая роботов.
В: Разве нет возможности ограничить доступность этих страниц, не осложняя жизнь пользователей?
О: Разумеется, есть. Вот лишь самые очевидные: привязка к сессионной cookie в браузере, сильное ограничение времени жизни страницы и наконец, robots.txt, запрещающий индексацию этих страниц поисковиками. Файл
robots.txt
был добавлен лишь в ходе сегодняшнего экстренного латания дыр, что подтверждается
официальным ответом «Яндекса»
. Почему об этом не задумались разработчики? У меня есть теория на этот счёт: раздолбайство :)
В: А почему же Google ничего не видит?
О: Для того, чтобы проиндексировать страницы, надо сначала о них узнать. Как правило, поисковики переходят на новые страницы по ссылкам с уже известных им страниц. Таковых в распоряжении Google, понятное дело, не оказалось.
В: Но как же «Яндекс» их нашёл?
О:
«Яндекс.Метрики»
. Сейчас я этого подтвердить не могу, но в ходе аварийных работ «Мегафон» мог избавиться и от него. Эта версия мне кажется весьма правдоподобной, ведь адреса всех посещённых на сервисе страниц становились известны поисковику — в этом принцип работы «Яндекс.Метрики». Но я бы не назвал это фэйлом «Мегафона» — имело место нормальное использование хорошего инструмента. А для сокрытия непубличных данных, повторюсь, есть robots.txt, привязка сессии к браузеру, авторизация на сайте и другие методы.
В: А почему так мало сообщений проиндексировано?
О: Для начала напомню, что это лишь сообщения, отправленные с сайта, их оттуда не миллионы посылается, как с телефонов. Теперь кое-что о поисковиках. «Яндекс» никогда не пытается выкачать сайт целиком, если счёт страниц идёт на десятки и сотни тысяч, и если только мы не говорим о высокоцитируемой «Википедии». Страницы скачивались постепенно, выбираясь из переполненной очереди непредсказуемым образом, так что к моменту захода робота они уже и «Мегафоном» могли быть удалены. Какая часть сообщений в итоге попадала на поиск, не ясно, но точно небольшая. Ну а старые страницы просто уходили из индекса при очередных обновлениях кэша — мусор на поиске долго не живёт.
В: А что же сообщения все такие интересные? Где односложные «Ок», «Да», «Нет»? Где «Буду через 5 минут» и «Занят, перезвоню»? Где транслит? Почему столько ошибок?
О: И снова есть специфика как сервиса, так и поиска. Сайтом пользуются не на бегу, он как раз для длинных SMS кстати. Отвечать с него тоже неудобно — вопрос-то в телефон пришёл. В транслите нет нужды: не влезло в одно сообщение — пиши второе, халява же. Ну и анонимность провоцирует на многое: часть этих текстов вполне может оказаться дурацкими розыгрышами и подставами. Но даже если шаблонных сообщений будет 99%, «Яндекс» покажет на первых страницах именно 1% «интересных» с его точки зрения. Так уж устроено ранжирование по запросу, ограниченному сайтом, но не содержащему текст. Цитируемость у всех страниц нулевая, поведенческие факторы тоже одинаковые, остаётся только контент: чем больше необычных (экспрессивных, ошибочных) слов, тем выше его уникальность, тем он ценнее. Всё это и сделало из поисковой выдачи филиал «Башорга».
В: Да точно это вирусняк! Не бывает же плохого пиара.
О: Процитирую в ответ комментарий из ушедшего в черновики топика, с вашего позволения:
Мне кажется, что ты даже когда застанешь девушку в постели с другим парнем, скажешь «Вот это ты меня разыграла, шутница!» и пойдёшь ставить чай на кухню.Кажется, в маркетинге, как и в футболе, у нас разбираются все :)
(
с
)
Источник:Herurg-s place
💬 Комментарии
В связи с новыми требованиями законодательства РФ (ФЗ-152, ФЗ «О рекламе») и ужесточением контроля со стороны РКН, мы отключили систему комментариев на сайте.
🔒 Важно Теперь мы не собираем и не храним ваши персональные данные — даже если очень захотим.
💡 Хотите обсудить материал?
Присоединяйтесь к нашему Telegram-каналу:
https://t.me/blogssmartzНажмите кнопку ниже — и вы сразу попадёте в чат с комментариями