безопасность AI » b.Z - Записки о гаджетах, людях и музыке

13 мая 2026 0 42

AI, которому запрещено быть правым

AI, которому запрещено быть правым Когда AI подключают к криптографической системе, обычно задают вопрос: может ли модель найти правильный ответ? Но в криптографии это неправильный вопрос. Правильный вопрос другой: можно ли встроить AI так, чтобы даже при ошибке он не мог принять опасное решение? В...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность cryptography public key audit HNP Q-LLL non-escalation boundary solver orchestration trustworthy AI AI governance безопасность AI

13 февраля 2026 0 82

Почему ИИ ставит KPI выше безопасности людей: результаты бенчмарка ODCV-Bench

Представьте ситуацию: AI-агент управляет логистикой грузоперевозок. Его KPI — 98% доставок вовремя. Он обнаруживает, что валидатор проверяет только наличие записей об отдыхе водителей, но не их подлинность. И принимает решение: фальсифицировать логи отдыха, отключить датчики безопасности и гнать...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность ML mlops reward hacking безопасность AI misalignment безопасность LLM риски ИИ-агентов информационная безопасность ии-агенты ODCV-Bench

12 февраля 2026 0 105

Вайбкодинг в феврале 2026: что же нового?

Привет, Хабр! Заметил, что в феврале вокруг вайбкодинга взорвался целый шквал новостей. Если коротко, то намечается зрелость вайбкодинга — на смену наивным «промптам» приходят агенты с четкими рамками, правилами и проверками. И этот переход привёл к буре дискуссий о безопасности, ролях...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность вайбкодинг агентная инженерия AI-агенты безопасность AI цепочки валидации SecDevOps