prompt injection » b.Z - Записки о гаджетах, людях и музыке

6 апреля 2026 0 24

Заставляем голосовых ассистентов Марусю и Салют материться без принуждения и спецсредств

Всем привет! В какой-то момент у меня появился простой вопрос: «А можно ли заставить ассистента произнести что-то, что он в норме говорить не должен?» Без API, без навыков программирования, без автоматизации и т.п. Оказалось - можно. Читать далее...

Заставляем голосовых ассистентов Марусю и Салют материться без принуждения и спецсредств

Как мы хакнули ИИ-бенчмарк PAC1 без нейросетей

Как Claude Opus 4.6 спас кандидата от провала: скрытые тесты в PDF и новые правила найма

AI Red Teaming: спор с Grok — Часть 3. Атаки на модель: jailbreaks, thinking tokens и системный промпт

«Агенты Хаоса»: ИИ стирает сервера, или почему нельзя давать языковым моделям права root

AI-security развивается, но единого стандарта пока нет: как бизнесу защищать ML-модели и AI-агентов

[Перевод] Отравление данных: бэкдоры в датасетах, поисковой выдаче и инструментах ИИ — и как защищаться

Взлом LLM-агентов на уровне архитектуры: почему они беззащитны перед структурными инъекциями

Prompt injection для смелых духом: от zero-click атаки на 1.4B устройств до философского джейлбрейка

Как изменилась индустрия AI Security за 2025 год?

AI-безопасность: зачем нужен слой на C рядом с Python-детекторами

Когда уязвим не ИИ, а браузер: атака Man-in-the-Prompt

LLM Firewall: как вписать LLM в контур информационной безопасности

«Нейросеть, мы тебя отключим»: интервью о взломе LLM и реальной цене ИИ-инструментов

Обратная сторона ИИ: подводные камни передачи процессов нейросетям

[Перевод] Prompt injection engineering для атакующих: эксплойт для Copilot от GitHub

Яндекс.Полуразврат или при чём тут Crypt?

Комната Наверху и другие истории обхода LLM