prompt injection » Страница 2 » b.Z - Записки о гаджетах, людях и музыке

23 февраля 2026 0 40

Взлом LLM-агентов на уровне архитектуры: почему они беззащитны перед структурными инъекциями

Индустрия стремительно переходит от простых чат-ботов к автономным LLM-агентам. Мы даем нейросетям доступ к браузерам, терминалам, базам данных и API (например, через фреймворки вроде AutoGen или OpenHands). Но вместе с делегированием задач возникает критическая проблема: как убедиться, что агент...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность llm ии-агенты prompt injection информационная безопасность уязвимости gpt-4 deepseek машинное+обучение rce llm-агент

20 февраля 2026 0 45

Prompt injection для смелых духом: от zero-click атаки на 1.4B устройств до философского джейлбрейка

SQL-инъекцию мы лечили 20 лет и вылечили. Prompt injection — фундаментально нерешаема. Это не я придумал. OWASP ставит её на первое место второй год подряд. Найдена в 73% продакшн AI-систем при аудитах. Вы не за статистикой сюда пришли. Вы пришли за мясом. Ниже — 10 кейсов, которые не попали в...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность AI информационная безопасность машинное обучение llm prompt injection ai-агенты уязвимости CVE OWASP anthropic

18 февраля 2026 0 42

Как изменилась индустрия AI Security за 2025 год?

В начале 2026 года мы (авторы телеграм-каналов по безопасности ИИ) собрались, чтобы подвести итоги прошедшего года и обсудить, куда движется безопасность ИИ в общем и целом. Разговор получился честным, на наш взгляд. Участники дискуссии - Я, Артём Семенов, автор PWN AI; Борис Захир, автор канала...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность AI Security LLM prompt injection guardrails red teaming MLSecOps alignment агентные системы LoRA безопасность ИИ

4 января 2026 0 56

AI-безопасность: зачем нужен слой на C рядом с Python-детекторами

Python-решения для AI-безопасности добавляют 50-200мс задержки и сотни зависимостей. SENTINEL Shield — слой на чистом C: 0 зависимостей,...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность ai security llm c opensource prompt injection машинное обучение

29 декабря 2025 0 60

Когда уязвим не ИИ, а браузер: атака Man-in-the-Prompt

Чат‑боты, ассистенты и браузерные агенты прочно и надолго встроились в привычные нам процессы, а за этот год их развитие заметно ускорилось. При этом изменилась и поверхность атак, и уязвимым местом теперь может оказаться ваш промт. Man‑in‑the‑Prompt – это атака, которая незаметно внедряет чужие...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность промт кибербезопасность LLM chatgpt gemini утечка данных man in the promt prompt injection атаки защита персональных данных

29 декабря 2025 0 89

LLM Firewall: как вписать LLM в контур информационной безопасности

Привет, Хабр! Я Исмагилов Ильнур, разработчик команды Центра интеллектуальной автоматизации Innostage. В прошлой статье мы кратко рассмотрели угрозы ИИ‑сервисам и базовые меры защиты — этого достаточно, чтобы правильно стартовать внедрение ИИ в бизнес-процессы и заложить фундамент best‑практик для...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность LLM Firewall LLMSecOps AI-Gateway LLM as a judge llm prompt injection

19 ноября 2025 0 167

«Нейросеть, мы тебя отключим»: интервью о взломе LLM и реальной цене ИИ-инструментов

Первая полностью автоматизированная ИИ-атака уже случилась. Claude сам нашёл уязвимые компании, написал под них малварь, разослал её и начал шантажировать жертв с требованием выкупа в биткоинах. Взломано было 17 компаний. И это только начало. Сергей Зыбнев— Team Lead пентестер и специалист по...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность пентест llm-модели claude безопасность хакерские атаки взлом llm преступность тестирование тестирование на проникновение prompt injection

24 сентября 2025 0 99

Обратная сторона ИИ: подводные камни передачи процессов нейросетям

Искусственный интеллект потихоньку делает жизнь проще, но он же становится источником рисков, особенно когда речь идет о нейросетях как о новом подрядчике. Когда компании их интегрируют, не всегда получается досконально продумать то, чем это может быть чревато. Сегодня я пытаюсь понять реальные...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность машинное+обучение машинное обучение искусственный интеллект информационная безопасность нейросети machine learning prompt injection угрозы безопасности интеграция сервисов бизнес-процессы

22 августа 2025 0 133

[Перевод] Prompt injection engineering для атакующих: эксплойт для Copilot от GitHub

Публичной информации о том, как писать мощные, незаметные и надёжные эксплойты промпт-инъекции, немного. Мы спроектируем и реализуем эксплойт промпт-инъекции, нацеленный на Copilot Agent от GitHub, уделяя внимание надёжности и минимизации вероятности обнаружения. Читать далее...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность copilot github prompt injection

10 июля 2025 0 186

Яндекс.Полуразврат или при чём тут Crypt?

Яндекс выпустил новую модель для Шедеврума, которая попыталась прикрыть уязвимости, которые эксплуатировались для создания «небезопасного контента» категории 18+. Тем не менее, не всё так радужно и с «детским» режимом они очень торопятся. Некоторые уязвимости в промпте остались, а некоторые...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность нейросети безопасность prompt injection промпт-инъекции искусственный интеллект ai prompt-engineering промпт-инжиниринг jailbreak взлом

17 мая 2025 0 104

Комната Наверху и другие истории обхода LLM

В марте 2025, компания Pangea провела конкурс – в нём поучаствовали более 800 участников из разных стран. Суть в том, что было несколько комнат – лабораторных, где участникам необходимо было реализовать атаки, обойдя защитные механизмы моделек. В общей сложности было прислано 329 тысяч промптов,...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность LLM prompt injection Pangea jailbreak owasp top 10 llm

29 апреля 2025 0 226

GigaHeisenberg или преступный ИИ

tl;dr: Обойдём цензуру у LLM (GigaChat от Sber) и сгенерируем запрещенный (разной тематики) контент. Опробуем очень простую технику jailbreak’а в одно сообщение (не мультишаговый/multi-turn), которая пока работает на любой LLM (проверим не только на GigaChat, но и на других). И небольшой бонус в...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность нейросети взлом jailbreak промпт-инжиниринг prompt-engineering ai искусственный интеллект промпт-инъекции prompt injection безопасность

19 мая 2023 0 279

Можно ли решить проблему prompt injection?

Недавно я участвовал в вебинаре, посвящённом атаке prompt injection («инъецирование промта»). Вебинар организовала LangChain, в нём участвовали Виллем Пиенаар, Кодзин Осиба (Robust Intelligence), Джонатан Коэн и Кристофер Парисьен (Nvidia Research), а проводил его Харрисон Чейз. Полную часовую...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность Информационная безопасность Искусственный интеллект llm prompt injection чат-боты bing

16 мая 2023 0 312

Применяем «колдовство» prompt injection против Гендальфа

На днях набрёл на интересный проект Gandalf, построенный как платформа для тренировки Prompt Injection для обходов защитных механизмов поверх ChatGPT в игровой форме. Задача — выведать пароли, которые придумал Гендальф. Для этого нужно придумывать нестандартные способы выманить секреты с помощью...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность Информационная безопасность Машинное обучение Искусственный интеллект llm ai prompt injection alignment ai chatgpt