отравление данных » b.Z - Записки о гаджетах, людях и музыке

29 апреля 2026 0 59

[Перевод] Пять документов ломают ваш RAG: где реальная уязвимость и что с ней делать

RAG часто воспринимают как аккуратный способ «заземлить» LLM на документах и снизить риск галлюцинаций. Но у этой архитектуры есть менее очевидная проблема: контекст из базы знаний обычно считается доверенным, хотя именно через него в модель могут попасть вредоносные инструкции. В статье разбираем,...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность RAG LLM промпт-инъекции безопасность llm отравление данных векторные базы данных эмбеддинги OWASP LLM Top 10

3 апреля 2026 0 35

Data Gravity и отравление выборки

Любой, кто хоть немного знаком с ИИ знает, что для эффективной работы искусственного интеллекта необходимы качественные данные. В результате 80% времени любого ML-проекта уходит не на подбор гиперпараметров и не на архитектуру нейросети, а на рутинный, выматывающий процесс — вылизывание данных. Мы...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность ml ai data gravity качество данных отравление данных data poisoning смещение данных валидация данных drift данных

25 февраля 2026 0 38

[Перевод] Отравление данных: бэкдоры в датасетах, поисковой выдаче и инструментах ИИ — и как защищаться

В 2025 году отравление данных перестало быть академической гипотезой и превратилось в практическую поверхность атаки для LLM-систем. «Яд» может прятаться в репозиториях, веб-контенте, инструментах агентов и синтетических пайплайнах, переживать дообучение и срабатывать спустя месяцы в виде триггеров...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность отравление данных data poisoning безопасность ИИ LLM бэкдор RAG prompt injection

31 октября 2025 0 63

Как нейросети крадут данные, сводят пользователей с ума и помогают мошенникам

Глупо отрицать, что нейросети ускорили работу профессионалов. Дизайнеры рисуют картинки за 5-10 минут вместо 2-х часов, редакторы за день собирают воронку постов, а благодаря вайбкодингу непрофессиональные разработчики кое-как, но могут собрать прототип будущего продукта. Только, как это часто...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность фишинг промпт-инъекции галлюцинации утечка данных отравление данных нейросети

23 июня 2025 0 152

Проверка на Data Poisoning в MLSecOps

В первой обзорной статье про MLSecOps мы сформировали общее понимание этого нового направления в IT, узнали про основные навыки, необходимые инженерам и архитекторам MLSecOps для успешной работы, подсветили яркое будущее и перспективы этой профессии. Cсылка на статью: MLSecOps: защита машинного...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность mlsecops data poisoning отравление данных безопасный ии ai security aurora owasp top-10 очистка данных машинное обучение информационная безопасность