Attaque a-la russe: атака с помощью промт-инъекций русскоязычных моделей семейства Saiga2
Насколько хорошо защищены открытые большие языковые модели от генерации вредоносного контента? Рассмотрим механизмы атаки с промт-инъекцией на большие языковые модели, а так же рекомендации по защите от них.
Читать далееИсточник: Хабрахабр
Похожие новости
- Как выйти из IT?.. и пойти слесарем на завод. Моя попыточка дауншифтинга [45]
- Наше общение нам больше не принадлежит. Размышляю как ИИ создаст альтернативу для Telegram без VPN и прослушки
- [Перевод] Квантовый апокалипсис грядёт: можно начинать бояться
- «Сделка сложится как по нотам»: новая рекламная кампания М2
- «Плохие парни работают просто»: пентестеры разбирают реальные кейсы
- КУСь нашего контрагента
- Какие форматы контента в топе у застройщиков во всех соцсетях
- B2B без писем и звонков: как автоматизация упрощает бизнес-процессы
- Каждую четвёртую онлайн-покупку в России привлекают кэшбэк и программы лояльности
- Как я строил антифрод-систему для ставок: неожиданные сложности и решения