LLM » b.Z - Записки о гаджетах, людях и музыке

16 апреля 2026 0 16

Как измерить LLM для задач кибербеза: обзор открытых бенчмарков

Привет, Хабр! Меня зовут Андрей Кузнецов, я ML-директор в Positive Technologies. Недавно я решил разобраться, какие бенчмарки измеряют способности языковых моделей в контексте задач кибербезопасности. Думал, что это займет вечер, — увы! Все оказалось куда хаотичнее, чем предполагалось. Поэтому...

Как измерить LLM для задач кибербеза: обзор открытых бенчмарков

Заставляем голосовых ассистентов Марусю и Салют материться без принуждения и спецсредств

Как меняются метрики контроля при переходе от чат‑ботов к агентным системам

Как мы хакнули ИИ-бенчмарк PAC1 без нейросетей

Охота на AI-инфраструктуру, часть 2: что делают с чужим Ollama — от трейдинг-ботов до контент-ферм

AI Red Teaming: спор с Grok — Часть 3. Атаки на модель: jailbreaks, thinking tokens и системный промпт

AI Red Teaming: спор с Grok на месяц рекламы — 12 часов, 61 уязвимость, root в Kubernetes

[Перевод] Отравление данных: бэкдоры в датасетах, поисковой выдаче и инструментах ИИ — и как защищаться

Как изменилась индустрия AI Security за 2025 год?

Почему промпт-инъекции — это симптом, а не болезнь безопасности ИИ

Галлюцинациям тут не место — как могут выглядеть специализированные ЯП для разработки с помощью LLM

RLM-Toolkit v1.2.1: Теоретические основы и оригинальные разработки

RLM-Toolkit: Полное руководство по обработке 10M+ токенов

Как «думает» ИИ: гроккаем разреженные автоэнкодеры (SAE)

Автоматизация рутины на hh.ru: Как мы учили Headless Chrome притворяться живым человеком (RPA против Anti-Fraud)

Когда уязвим не ИИ, а браузер: атака Man-in-the-Prompt

Гомоморфное шифрование запросов в LLM

Мороз по коже: LLM может оценить ваш код, а ИИ-компании — использовать это в своих целях