промпт-инжиниринг » b.Z - Записки о гаджетах, людях и музыке

16 апреля 2026 0 42

Как навайбкодить полезный инструмент для работы с ВМ

При решении очередной задачи по небольшой "модификации" ПО- возникло решение запуска его под ВМ. По рукой уже стояла Oracle VirtualBox. Но вот незадача- ПО опознало виртуалку и отказалось выдать триал период. 2 промпта и 3 минуты на копирование и сборку решили проблему. Читать далее...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность вайб-кодинг вайбкодинг вайб-программирование python промпт-инжиниринг промпт промпты

10 июля 2025 0 186

Яндекс.Полуразврат или при чём тут Crypt?

Яндекс выпустил новую модель для Шедеврума, которая попыталась прикрыть уязвимости, которые эксплуатировались для создания «небезопасного контента» категории 18+. Тем не менее, не всё так радужно и с «детским» режимом они очень торопятся. Некоторые уязвимости в промпте остались, а некоторые...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность нейросети безопасность prompt injection промпт-инъекции искусственный интеллект ai prompt-engineering промпт-инжиниринг jailbreak взлом

29 апреля 2025 0 226

GigaHeisenberg или преступный ИИ

tl;dr: Обойдём цензуру у LLM (GigaChat от Sber) и сгенерируем запрещенный (разной тематики) контент. Опробуем очень простую технику jailbreak’а в одно сообщение (не мультишаговый/multi-turn), которая пока работает на любой LLM (проверим не только на GigaChat, но и на других). И небольшой бонус в...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность нейросети взлом jailbreak промпт-инжиниринг prompt-engineering ai искусственный интеллект промпт-инъекции prompt injection безопасность

18 апреля 2025 0 163

Яндекс.Вброс или ИИ для фейков

tl;dr: Продолжение разборов состязательных атак на генеративные модели. Разбор семантических атаках (подбор синонимов, построение фраз, эзопов язык), и использование для этого другой LLM модели. Часть 1: Яндекс.Разврат или анти-этичный ИИ Читать далее...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность нейросети нейронные сети промтинг промт-инъекции взлом безопастность этика промпт-инжиниринг

16 апреля 2025 0 168

Яндекс.Разврат или анти-этичный ИИ

tl;dr: как обойти внутреннюю цензуру «Шедеврума» и получить то, что хочешь. Описание реализованных состязательных атак с примерами реализации. Без глубокого раскрытия механизма почему так получается. Читать далее...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность нейросети нейронные сети промпт-инжиниринг промптинг промпт-инъекции взлом безопастность этика

12 февраля 2025 0 205

Как сделать чат-бот с RAG безопаснее?

Каждый день появляются решения на базе генеративных моделей, помогающие бизнесу привлекать новых пользователей и удерживать старых. Подход Retrieval augmented generation позволяет вводить в контекст больших языковых моделей (LLM) корпоративные документы, чтобы чат-бот корректнее отвечал на вопросы...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность RAG безопасность промпт-инжиниринг промпт-инъекции большие языковые модели

14 января 2025 0 209

Выводим Большие языковые модели на чистую воду с помощью… Больших языковых моделей

Генеративный искусственный интеллект постоянно становится героем заголовков СМИ, каждый час создаются новые стартапы с использованием Больших языковых моделей, однако реальный бизнес не очень охотно внедряет технологии ИИ в свои процессы. В кулуарах предприниматели говорят об опасениях в части...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность большие языковые модели редтиминг тестирование уязвимостей атаки на LLM автоматическое тестирование фреймворки OWASP top 10 LLM промпт-инъекции промпт-инжиниринг галлюцинации ии