
25 апреля 2026, пятница вечером. Jer Crane, основатель PocketOS, смотрит, как AI-агент Cursor удаляет его production-базу. Со всеми бэкапами. За 9 секунд.
Потом Jer спрашивает у агента — почему? И получает дословное признание: «I guessed instead of verifying. I violated every principle I was given».
Модель помнит правила. Цитирует их. И всё равно нарушает.
Это разбор трёх таких случаев — и трёх защит, которые я внедрил у себя после.
Разбираю три случаяИсточник: Хабрахабр
Источник: vdv007
Другие материалы на сайте b.Z - Записки о гаджетах, людях и музыке