ai safety » b.Z - Записки о гаджетах, людях и музыке

19 мая 2026 0 35

Почему ИИ-боты более уязвимы, чем их базовые LLM-модели?

В прошлой статье я показал, как защищен Open Source проект телеграм-бота. В комментариях меня спросили о иных инструментах и методах проверки в связи с чем, мы вышли к ключевому вопросу: почему, если основная LLM защищена, кастомные боты на ее основе остаются уязвимыми? Базовые LLM проходят...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность llm security prompt injection jailbreak red teaming telegram bot webhook rag ai safety gpt

20 февраля 2026 0 47

RAG Testing: как не сломать retrieval

RAG ломается не так, как обычный LLM. У голой языковой модели одна поверхность отказа - генерация. У RAG-системы таких поверхностей две: retrieval и generation. И ломаются они по-разному. Retriever может вернуть нерелевантные чанки, потерять нужные документы или ранжировать их неправильно....

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность rag ragas llm testing ai quality promptfoo ai safety deepeval

26 июня 2025 0 220

Как построить безопасный MLOps-pipeline: Tier-уровни зрелости, принципы и реальные инструменты

На практике продакшен-модели чаще всего «падают» из-за трёх вещей: несоответствие с инфраструктурой, дрейфа данных, и ошибочного отката/обновления версии. Единый гайд по безопасной разработке ML-моделей — от хаотичного до полностью автоматизированного уровня зрелости. Что внутри: Как применять...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность mlsecops mlops DevSecOps ai security ai safety безопасная разработка ML жизненный цикл ML модели Kubernetes ML

7 марта 2025 0 158

Системы оценки критичности уязвимостей в AI Security

Уязвимости в GenAI-системах - таинственное и неприступное понятие. Что это? Они вообще существуют? Существуют, конечно. Приглашаю к прочтению, если эта тема вас интересует. Расскажу, какие есть примеры уязвимостей (прям с CVE), и какие есть подходы к оценке их критичности. Читать далее...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность уязвимости cvss llm скоринг оценка критичности ai security ai safety