ai security » b.Z - Записки о гаджетах, людях и музыке

25 марта 2026 0 24

Agentic SOC в 2026: как ИИ-агенты меняют центр мониторинга безопасности и где им нельзя доверять

Agentic SOC — это не «ещё один модный модуль с ИИ», а переход от ручной обработки инцидентов и цепочек автоматизации к более самостоятельной модели, где агенты собирают контекст, обогащают инциденты, предлагают действия и иногда запускают безопасные реакции под контролем человека. Проблема в том,...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность soc information security ai security security operation center

18 марта 2026 0 53

Как Claude Opus 4.6 спас кандидата от провала: скрытые тесты в PDF и новые правила найма

Работодатель спрятал в PDF с тестовым заданием скрытую инструкцию для ИИ. Claude Opus 4.6 не только отказался ее выполнять, но и предупредил кандидата о ловушке. Разбираемся, как устроена гонка вооружений между HR и соискателями в эпоху LLM. И главное, как проверять такие документы перед работой....

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность opus 4.6 claude prompt injection llm безопасность ai security anthropic найм сотрудников искусственный интеллект нейросети

11 февраля 2026 0 50

Хакнуть ИИ: обзор игры «Защищ[AI]» — киберполигона для изучения промт-инъекций

ИИ-ассистенты все чаще используются не только как вспомогательные инструменты, но и как часть корпоративных процессов — с доступом к данным, внутренним системам и инфраструктуре. При этом многие защитные решения, которые кажутся надежными, на практике оказываются уязвимыми для промт-инъекций —...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность ai security промт-инъекции промт ии llm ai selectel

31 января 2026 0 44

Регуляторные документы РФ по безопасности ИИ — с чем мы вступаем в 2026 год

Что было интересного в 2025 году по безопасности ИИ? Помимо развития AI-агентов и их протоколов, гардрейлов, и появления фреймворков, для российского рынка важно отметить появление нескольких новых официальных документов. О них и поговорим, так как я искренне считаю, что они выводят нашу...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность ai security llm ai-агенты кибербезопасность нормативные документы регуляторика ии

20 января 2026 0 29

Сканеры ML-моделей: разбор инструментов и некоторых методов обхода их проверок

Не у всех нас имеется достаточное количество ресурсов (вычислительных, умственных и других) для проектирования и обучения моделей машинного обучения с нуля. Поэтому кажется логичным взять уже готовые модели — к счастью, за нас многое уже сделано. Для понимания масштаба: на одном только HF уже...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность ai model scanners ai security mlsecops information security

12 января 2026 0 22

Как «думает» ИИ: гроккаем разреженные автоэнкодеры (SAE)

В этой статье разберём исследование от компании Anthropic, которое демонстрирует практическую возможность вскрытия «черного ящика» больших языковых моделей для обеспечения их контролируемости и безопасности с помощью разреженных автоэнкодеров (SAE - Sparse AutoEncoders). И в конце, попробуем...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность Сезон ИИ в разработке LLM interpretable ml interpretability interpretable AI искусственный интеллект ai security Steering SAE Sparse AutoEncoder

26 ноября 2025 0 84

AI security на практике: атаки и базовые подходы к защите

Привет, Хабр! Я Александр Лебедев, старший разработчик систем искусственного интеллекта в Innostage. В этой статье расскажу о нескольких интересных кейсах атак на ИИ-сервисы и базовых способах защиты о них. В конце попробуем запустить свой сервис и провести на нем несколько простых атак, которые...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность ai security безопасность ии безопасность llm guardrails alignment mlops ml ai

26 июня 2025 0 199

Как построить безопасный MLOps-pipeline: Tier-уровни зрелости, принципы и реальные инструменты

На практике продакшен-модели чаще всего «падают» из-за трёх вещей: несоответствие с инфраструктурой, дрейфа данных, и ошибочного отката/обновления версии. Единый гайд по безопасной разработке ML-моделей — от хаотичного до полностью автоматизированного уровня зрелости. Что внутри: Как применять...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность mlsecops mlops DevSecOps ai security ai safety безопасная разработка ML жизненный цикл ML модели Kubernetes ML

23 июня 2025 0 135

Проверка на Data Poisoning в MLSecOps

В первой обзорной статье про MLSecOps мы сформировали общее понимание этого нового направления в IT, узнали про основные навыки, необходимые инженерам и архитекторам MLSecOps для успешной работы, подсветили яркое будущее и перспективы этой профессии. Cсылка на статью: MLSecOps: защита машинного...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность mlsecops data poisoning отравление данных безопасный ии ai security aurora owasp top-10 очистка данных машинное обучение информационная безопасность

7 марта 2025 0 146

Системы оценки критичности уязвимостей в AI Security

Уязвимости в GenAI-системах - таинственное и неприступное понятие. Что это? Они вообще существуют? Существуют, конечно. Приглашаю к прочтению, если эта тема вас интересует. Расскажу, какие есть примеры уязвимостей (прям с CVE), и какие есть подходы к оценке их критичности. Читать далее...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность уязвимости cvss llm скоринг оценка критичности ai security ai safety

23 февраля 2025 0 117

Илон Маск заинтересовался взломом AI-агента на $50000

AI-агенты, способные самостоятельно обращаться к функциям системы для решения задач, набирают популярность. На прошлой неделе OWASP опубликовал гайд об угрозах для AI-агентов и примеры уязвимостей на базе популярных фреймворков. Участник лаборатории ИТМО AI Security Lab Александр Буянтуев предложил...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность ai-агенты ai security искусственный интеллект вызовы функций безопасность