
Всем привет!
Погружаюсь в новую для себя область AI Security, в связи с чем решил написать несколько обзоров на самые обсуждаемые исследования и статьи по этой теме. Сегодня поговорим про взлом LLM и неожиданные выводы исследования StrongReject.
Источник: Хабрахабр
Источник: Ivanich-spb (Data Feeling School)
Другие материалы на сайте b.Z - Записки о гаджетах, людях и музыке