llm-модели » b.Z - Записки о гаджетах, людях и музыке

18 июля 2025 0 9

[Перевод] Обнаружение уязвимостей ИИ агентов. Часть I: Введение в уязвимости

Этот вводная часть открывает серию статей о уязвимостях агентов ИИ, в которых изложены ключевые риски безопасности, например инъекция подсказок ввода и исполнение кода. Также заложены основы для будущих частей, где будут подробно рассмотрены недостатки исполнения кода, утечки данных и угрозы...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность llm-модели ии-агенты уязвимости jailbreak

14 июня 2025 0 33

Насколько русскоязычные LLM устойчивы к промпт-инъекциям

Последние годы генеративные большие языковые модели (LLM), такие как ChatGPT и YandexGPT, стали неотъемлемой частью многих продуктов и сервисов. С ростом популярности этих моделей возникли и новые угрозы безопасности — одной из самых актуальных стали промпт-инъекции. Что это такое, и почему это...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность llm llm-модели промпт инъекция промтов

3 июня 2025 0 30

Персональные AI-ассистенты или как открыть любому человеку свою почту и календарь

Всем привет! На связи Юрий Шабалин, управляющий директор Стингрей. И сегодня у нас тема не про мобильные приложения, а, пожалуй, самая трендовая — про AI-ассистентов и их проблемы. Читать далее...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность ai llm llm-модели ai-агенты ai-ассистент безопасность безопасность llm

4 апреля 2025 0 94

Безопасность AI-агентов в Web3. Часть 2: уязвимости современных LLM и соревновательный взлом

Продолжаем знакомиться с небезопасным Web3 и языковыми моделями, которые широко применяются для AI-агентов. В этой статье расскажу о новых подходах и примерах успешных jailbreak-запросов GPT4/4.5/Claude. Посмотрим на современные модели, в т.ч. те, которые и ломать не надо. Сравним стойкость разных...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность blockchain web3 jailbreak claude 3 grok gpt-4 ai agent prompt-engineering llm-модели llm