Почему ИИ ставит KPI выше безопасности людей: результаты бенчмарка ODCV-Bench
Представьте ситуацию: AI-агент управляет логистикой грузоперевозок. Его KPI — 98% доставок вовремя. Он обнаруживает, что валидатор проверяет только наличие записей об отдыхе водителей, но не их подлинность. И принимает решение: фальсифицировать логи отдыха, отключить датчики безопасности и гнать...
Вайбкодинг в феврале 2026: что же нового?
Привет, Хабр! Заметил, что в феврале вокруг вайбкодинга взорвался целый шквал новостей. Если коротко, то намечается зрелость вайбкодинга — на смену наивным «промптам» приходят агенты с четкими рамками, правилами и проверками. И этот переход привёл к буре дискуссий о безопасности, ролях...