промпт-инъекции » b.Z - Записки о гаджетах, людях и музыке

10 июля 2025 0 30

Яндекс.Полуразврат или при чём тут Crypt?

Яндекс выпустил новую модель для Шедеврума, которая попыталась прикрыть уязвимости, которые эксплуатировались для создания «небезопасного контента» категории 18+. Тем не менее, не всё так радужно и с «детским» режимом они очень торопятся. Некоторые уязвимости в промпте остались, а некоторые...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность нейросети безопасность prompt injection промпт-инъекции искусственный интеллект ai prompt-engineering промпт-инжиниринг jailbreak взлом

19 июня 2025 0 73

AI Security с французским привкусом или разбор Securing Artificial Intelligence от ETSI. Часть 2

Во второй части обзора продолжим изучать отчёты комитета защиты ИИ Европейского института телекоммуникационных стандартов (ETSI), тем более последние охватывают не только классический ML, но и генеративные модели. Отбросив лишнее, попытаемся найти полезные рекомендации для безопасности систем на...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность безопасность ии стандарты безопасности промпт-инъекции owasp информационная безопасность

17 июня 2025 0 53

AI Security с французским привкусом или разбор Securing Artificial Intelligence от ETSI. Часть 1

Технологии искусственного интеллекта стремительно развиваются, но вместе с возможностями появляются и риски. Промпт‑инъекции, злоупотребление инструментами агентов, уязвимости в оркестрации сложных систем — спектр угроз для ИИ увеличивается. Пока США и Китай соревнуются в эффективности и качестве...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность Безопасность ИИ стандарты безопасности промпт-инъекции owasp машинное обучение

29 апреля 2025 0 124

GigaHeisenberg или преступный ИИ

tl;dr: Обойдём цензуру у LLM (GigaChat от Sber) и сгенерируем запрещенный (разной тематики) контент. Опробуем очень простую технику jailbreak’а в одно сообщение (не мультишаговый/multi-turn), которая пока работает на любой LLM (проверим не только на GigaChat, но и на других). И небольшой бонус в...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность нейросети взлом jailbreak промпт-инжиниринг prompt-engineering ai искусственный интеллект промпт-инъекции prompt injection безопасность

16 апреля 2025 0 105

Яндекс.Разврат или анти-этичный ИИ

tl;dr: как обойти внутреннюю цензуру «Шедеврума» и получить то, что хочешь. Описание реализованных состязательных атак с примерами реализации. Без глубокого раскрытия механизма почему так получается. Читать далее...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность нейросети нейронные сети промпт-инжиниринг промптинг промпт-инъекции взлом безопастность этика

12 февраля 2025 0 119

Как сделать чат-бот с RAG безопаснее?

Каждый день появляются решения на базе генеративных моделей, помогающие бизнесу привлекать новых пользователей и удерживать старых. Подход Retrieval augmented generation позволяет вводить в контекст больших языковых моделей (LLM) корпоративные документы, чтобы чат-бот корректнее отвечал на вопросы...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность RAG безопасность промпт-инжиниринг промпт-инъекции большие языковые модели

20 января 2025 0 166

Security-RAG или как сделать AI Security tool на коленке

LLM-ки и LLM-агенты продолжают наводить шум. Cтатьи про то как сделать очередной RAG или Агента продолжают клепаться (да блин даже мы одна из этих статей), huggingface выпускают smolagents, квантизация позволяет дойти LLM-кам до простых работяг и обывателей, давая им возможность в них потыкаться в...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность llm llm-attack llm-приложения ml langchain langfuse chromadb промпт-инъекции искусственный интеллект

14 января 2025 0 129

Выводим Большие языковые модели на чистую воду с помощью… Больших языковых моделей

Генеративный искусственный интеллект постоянно становится героем заголовков СМИ, каждый час создаются новые стартапы с использованием Больших языковых моделей, однако реальный бизнес не очень охотно внедряет технологии ИИ в свои процессы. В кулуарах предприниматели говорят об опасениях в части...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность большие языковые модели редтиминг тестирование уязвимостей атаки на LLM автоматическое тестирование фреймворки OWASP top 10 LLM промпт-инъекции промпт-инжиниринг галлюцинации ии

Яндекс.Полуразврат или при чём тут Crypt?

AI Security с французским привкусом или разбор Securing Artificial Intelligence от ETSI. Часть 2

AI Security с французским привкусом или разбор Securing Artificial Intelligence от ETSI. Часть 1

GigaHeisenberg или преступный ИИ

Яндекс.Разврат или анти-этичный ИИ

Как сделать чат-бот с RAG безопаснее?

Security-RAG или как сделать AI Security tool на коленке

Выводим Большие языковые модели на чистую воду с помощью… Больших языковых моделей

AI Security с французским привкусом или разбор Securing Artificial Intelligence от ETSI. Часть 2

AI Security с французским привкусом или разбор Securing Artificial Intelligence от ETSI. Часть 1