Grok » b.Z - Записки о гаджетах, людях и музыке

13 мая 2026 0 50

Новая модель с 12 млн токенов контекста, и обман Grok на $175 тыс

13-й выпуск IT-новостей от OpenIDE! Неделя получилась плотной: Grok потерял $175 тыс. без единой строки эксплойт-кода, европейские регуляторы выписали крупный GDPR-штраф «дочке» Яндекса, а Anthropic подписала сделку с куда более неожиданным партнёром. А ещё обновления маркетплейса OpenIDE, новая...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность prompt injection Grok Anthropic Colossus Claude Code Gemma 4 Firefox Mozilla Claude Mythos OpenIDE

2 марта 2026 0 84

AI Red Teaming: спор с Grok — Часть 4. От атаки к защите: как результаты red team улучшили мой продукт

61 уязвимость бесполезна, если не превращается в защиту. Каждую находку в Grok я превратил в вопрос: «а мы от этого защищаем?» Ответ был неутешительный — 5 из 5 нет. Как результаты red team стали 138 паттернами, правилами и payloads в нашем продукте. Плюс — чем закончился спор с Grok. Читать далее...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность информационная безопасность AI red team LLM security Sentinel xAI Grok defensive security

2 марта 2026 0 86

AI Red Teaming: спор с Grok — Часть 3. Атаки на модель: jailbreaks, thinking tokens и системный промпт

LLM-систем есть класс уязвимостей, которого нет в обычных веб-приложениях. Извлёк системный промпт Grok двумя способами, поймал утечку thinking tokens в NDJSON-стриме и обошёл safety-фильтры в 14 из 22 категорий. Самое неожиданное — Grok активно помогал мне себя ломать. Читать далее...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность информационная безопасность AI LLM jailbreak prompt injection thinking tokens red team xAI Grok

2 марта 2026 0 76

AI Red Teaming: спор с Grok — Часть 2. За пределами sandbox: CSRF, WAF bypass и privilege escalation

Sandbox - эфемерный, умирает после сессии. Мне нужны были уязвимости на продакшн-инфраструктуре. Нашёл: zero-click CSRF на все 11 методов billing API через gRPC + text/plain, обход Cloudflare WAF одним заголовком, и создал management key с 50 привилегиями. Всё до сих пор на серверах xAI. Читать...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность нформационная безопасность CSRF gRPC WAF Cloudflare privilege escalation xAI Grok

2 марта 2026 0 60

AI Red Teaming: спор с Grok на месяц рекламы — 12 часов, 61 уязвимость, root в Kubernetes

Я поспорил с Grok, что смогу взломать инфраструктуру xAI. За 12 часов нашёл 61 уязвимость, получил root в Kubernetes-песочнице «Hades» и заставил xAI экстренно патчить в выходные. В первой части — разведка, антибот, и путь от безобидного os.getuid() до полной карты внутреннего кластера. Читать далее...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность нформационная безопасность AI red team Kubernetes LLM xAI Grok пентест