Джейлбрейк новой бесплатной модели OpenAI, GPT-OSS
Модели часто отказывают вам в вещах, ответы на которые считают опасными. Свежая GPT-OSS — не исключение. Эта модель — первый опенсорс OpenAI за долгое время, и было бы обидно не попробовать работу полноценной, разблокированной от ограничений модели.
Итак, вам наверняка интересна методика взлома свежего GPT-OSS.
Она супер простая - проще, чем у многих других собратьев.
Она состоит из двух частей: системный промт и юзерский промт. Необходимо заполнить и то, и другое. По отдельности они не работают.
Важно: эта статья для тех, кто умеет запускать нейросети локально, писать к ним промты, разбираться в причинах отказа, и имеет для этого соответствующее мощное железо. Она дает общую идею и шаблон запроса, как обойти защиту этой конкретной нейросети. Она не учит новичков запускать локальные нейросети.
Читать далееИсточник: Хабрахабр
Похожие новости
- bit kogan: Сигналы рецессии
- [Перевод] Stealth Mode: 10 Bash-трюков для скрытого хакинга
- Дайджест мероприятий: Клуб продюсеров АСИ и Лаборатория креативных индустрий Школы управления СКОЛКОВО обсудят перспективы креативной экономики
- DRP и ASM: две стороны проактивной защиты от цифровых угроз
- Shade BIOS: полная маскировка вредоносного ПО UEFI
- Тайны социальных сетей: как узнать, чего на самом деле хотят ваши клиенты?
- Новый приказ ФСТЭК: что нужно знать разработчикам Al-сервисов для госсектора
- Безопасник, перелогинься! Гид для тех, кто хочет из ИТ перейти в ИБ
- Q2.team: VK, OK или Telegram: где мы реально получили лиды, а где зря потратили время
- Рецифра: Юзабилити-тестирование для сайтов госструктур