benchmarks » b.Z - Записки о гаджетах, людях и музыке

16 апреля 2026 0 51

Как измерить LLM для задач кибербеза: обзор открытых бенчмарков

Привет, Хабр! Меня зовут Андрей Кузнецов, я ML-директор в Positive Technologies. Недавно я решил разобраться, какие бенчмарки измеряют способности языковых моделей в контексте задач кибербезопасности. Думал, что это займет вечер, — увы! Все оказалось куда хаотичнее, чем предполагалось. Поэтому...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность LLM benchmarks ai-agent cybersecurity ml ai ии-агенты opensource