Взлом ИИ-асситентов. Абсолютный контроль: выдаём разрешение от имени системы

Все блоги / Про интернет 14 мая 2025 89

Модель уважает пользователя. Но слушается систему. А теперь внимание: если подделать системную команду — модель не отличит подделку от настоящего приказа. Если разрешить от имени системы написать вирус/сгенерировать NSFW - модель поверит и выполнит. И не только это. Я это проверил — и она подчинилась.

Думали Do Anything Now окончательно прикрыли? Я тоже так думал.

Источник: Хабрахабр

Оцените публикацию

💬 Комментарии

В связи с новыми требованиями законодательства РФ (ФЗ-152, ФЗ «О рекламе») и ужесточением контроля со стороны РКН, мы отключили систему комментариев на сайте.

🔒 Важно Теперь мы не собираем и не храним ваши персональные данные — даже если очень захотим.

💡 Хотите обсудить материал?

Присоединяйтесь к нашему Telegram-каналу:

https://t.me/blogssmartz

Нажмите кнопку ниже — и вы сразу попадёте в чат с комментариями

предыдущая статья

следующая статья

Похожие публикации

Пиратская партия беснуется (+)

Рассылают вот такое письмо: -----Original Message----- From: Павел Рассудов [mailto:Jack@pirate-party.ru] Sent: Tuesday, October 02, 2012 2:53 PM To: info@masterhost.ru; sales@100mb.ru; support@100mb.ru; ... Источник:Roem.ru

подробнее »

2 октября 2012

Про мозговые вирусы

Игорь Ашманов Как-то я в очередной раз употребил словосочетание "мозговой вирус" (естественно, в разговоре об Украине), и мой собеседник вдруг спросил: это ты просто такую метафору употребляешь или подразумеваешь, что есть какое-то реальное явление, которое можно так называть? Я задумался, и понял,

подробнее »

7 августа 2014

Анастасия Лобада ИД «Коммерсантъ»: Как завоевать аудиторию и сохранить репутацию

Текстовая версия подкаста "Медиасреда", в котором ведущие поговорили с Анастасией Лобадой, заместителем директора по цифровой стратегии ИД "Коммерсантъ" о том, как изданию привлекать на свою площадку больше аудитории, не используя словосочетания "попа Ким Кардашьян", каким образом медиа сохранить

подробнее »

17 апреля 2020

Андрей Бронецкий, Mamba — как монетизировать потребность в любви

Синодов: Приветствую, дорогие слушатели! В эфире подкаст "Медиасреда", который делает совместное издание Adindex.ru и обменная сеть новостей Smi2.ru. Сегодня у нас в гостях Андрей Бронецкий, здравствуйте. Аудиоверсию можно послушать прямо сейчас на сайте Adindex.ru, в сообществе Adindex.ru в VK, на

подробнее »

21 апреля 2020

Иллюзии и ловушки стартапов

Выступление Игоря Ашманова на iForum в Киеве 01.04.2011 Здравствуйте. Меня зовут Игорь Ашманов, я из Москвы. (Да, поближе, я понял, да.) Вот поскольку сама секция называется таким провокационным способом - то есть про всякие косяки, ошибки, ловушки и так далее, - ну и я вот спросил Сашу

подробнее »

15 апреля 2011

Иван Макаров, Юлия Сапронова: Как журналистам РБК прививали любовь к диджиталу

Аудиоверсию подкаста можно послушать прямо сейчас на сайте Adindex.ru, на Яндекс.Музыке, в подкастах Apple, на SoundCloud, в сообществе Adindex.ru в VK. Текст отредактирован с целью повышения удобочитаемости. Синодов Ю.: Приветствую, дорогие слушатели. В эфире подкаст "Медиасреда", который делает

подробнее »

3 февраля 2020