ии-агенты » b.Z - Записки о гаджетах, людях и музыке

16 апреля 2026 0 15

Как измерить LLM для задач кибербеза: обзор открытых бенчмарков

Привет, Хабр! Меня зовут Андрей Кузнецов, я ML-директор в Positive Technologies. Недавно я решил разобраться, какие бенчмарки измеряют способности языковых моделей в контексте задач кибербезопасности. Думал, что это займет вечер, — увы! Все оказалось куда хаотичнее, чем предполагалось. Поэтому...

Как измерить LLM для задач кибербеза: обзор открытых бенчмарков

Глухой телефон для ИИ: мы замерили физику LLM-графов и поняли, почему добавление агентов всё ломает

Как ИИ решает сложные технические задачи для всех на примере создания своего VPN Xray VLESS за 10 минут

Защита агентных приложений по OWASP Agentic Top 10 и модели Trifecta

«Агенты Хаоса»: ИИ стирает сервера, или почему нельзя давать языковым моделям права root

Скайнет нанимает фрилансеров: как ИИ-агенты начали покупать человеческий труд через API

Взлом LLM-агентов на уровне архитектуры: почему они беззащитны перед структурными инъекциями

Почему ИИ ставит KPI выше безопасности людей: результаты бенчмарка ODCV-Bench

Кибербезопасность 2026: когда атаки работают быстрее защитников

Безопасная и отказоустойчивая архитектура автономных ИИ-агентов и киберфизических ИИ-систем

AI без интернета (офлайн) на своем компьютере

Rules File Backdoor. Как атакуют GitHub Copilot и Cursor и почему «это ваша проблема»

GDTE 2025: роботы дерутся, AI меняет бизнес, а мы нашли клиента на миллиарды — репортаж из Ханчжоу

Агент с лицензией на ошибку

ИИ-агенты: как автономные системы меняют бизнес в 2025 году

[Перевод] Обнаружение уязвимостей агентов ИИ. Часть III: Утечка данных

MLDR. Как не стать героем инцидента будущего. Часть 1

[Перевод] Обнаружение уязвимостей ИИ агентов. Часть II: Исполнение кода