prompt-engineering » b.Z - Записки о гаджетах, людях и музыке

27 января 2026 0 26

Я заставил 14 нейросетей врать: Большой аудит галлюцинаций 2026

Или как я потратил неделю, чтобы доказать: ИИ сегодня — это красноречивые лжецы в костюмах экспертов. В конце 2025 года я устал читать маркетинг в стиле «наша модель умнее ChatGPT на 15%». Умнее по какому бенчмарку? MMLU? Это всё равно что мерить интеллект человека по результатам ЕГЭ. Я решил...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность llm ai нейросети chatgpt deepseek искусственный интеллект галлюцинации тестирование безопасность prompt-engineering

13 ноября 2025 0 62

Как повысить свою продуктивность с генеративным ИИ (и почему это не ChatGPT)

Если ты управляешь даже небольшой командой, то знаешь: каждая минута на счету, а цена ошибки — заоблачная. Мы живем в мире, где стратегическое решение нужно принять не через неделю, а «вчера». И тут на сцену выходит ИИ. Но я не собираюсь рассказывать, как попросить ChatGPT написать за тебя письмо...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность ai-first ии в бизнесе цифровая трансформация генеративный ии ии для бизнеса автоматизация бизнеса автоматизация процессов prompt-engineering chatgpt rag

10 июля 2025 0 149

Яндекс.Полуразврат или при чём тут Crypt?

Яндекс выпустил новую модель для Шедеврума, которая попыталась прикрыть уязвимости, которые эксплуатировались для создания «небезопасного контента» категории 18+. Тем не менее, не всё так радужно и с «детским» режимом они очень торопятся. Некоторые уязвимости в промпте остались, а некоторые...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность нейросети безопасность prompt injection промпт-инъекции искусственный интеллект ai prompt-engineering промпт-инжиниринг jailbreak взлом

29 апреля 2025 0 211

GigaHeisenberg или преступный ИИ

tl;dr: Обойдём цензуру у LLM (GigaChat от Sber) и сгенерируем запрещенный (разной тематики) контент. Опробуем очень простую технику jailbreak’а в одно сообщение (не мультишаговый/multi-turn), которая пока работает на любой LLM (проверим не только на GigaChat, но и на других). И небольшой бонус в...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность нейросети взлом jailbreak промпт-инжиниринг prompt-engineering ai искусственный интеллект промпт-инъекции prompt injection безопасность

4 апреля 2025 0 154

Безопасность AI-агентов в Web3. Часть 2: уязвимости современных LLM и соревновательный взлом

Продолжаем знакомиться с небезопасным Web3 и языковыми моделями, которые широко применяются для AI-агентов. В этой статье расскажу о новых подходах и примерах успешных jailbreak-запросов GPT4/4.5/Claude. Посмотрим на современные модели, в т.ч. те, которые и ломать не надо. Сравним стойкость разных...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность blockchain web3 jailbreak claude 3 grok gpt-4 ai agent prompt-engineering llm-модели llm

3 апреля 2025 0 142

Безопасность AI-агентов в Web3. Часть 1: архитектура, уязвимости и старые добрые джейлбрейки

В последние годы мы наблюдаем активный рост популярности LLM-моделей и интереса к их интеграции в Web3-приложения, такие как DAO и dApp-боты или автоматические трейдеры. Представьте: смарт-контракт управляет финансами, а подключённая языковая модель принимает решения, основываясь на анализе...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность llm jailbreak ai agent blockchain web3 prompt-engineering