Уязвимость к атакам российских больших языковых моделей с открытым исходным кодом
Маленькая ремарка
С появлением больших языковых моделей обществу был брошен вызов. Первые проблемы, с которыми пришлось столкнуться в области LLM, были связаны с тем, что модели могут неправильно трактовать информацию, давать губительные советы в убедительном тоне, говорить, как сделать бомбу, или вообще оскорблять определенные расы. Естественно, после такого поведения моделей последовало несколько неприятных событий.
Читать дальше →
Источник: Хабрахабр
Похожие новости
- Острова и несколько личностей на одном устройстве: как мы делаем приватность частью архитектуры
- Reset — прохождение сложной машины от Tryhackme
- bitkogan: Срок Набиуллиной заканчивается. Что дальше?
- Блог ленивого инвестора: ☀ Итоги недели: входим в лето!
- Редакция Spark.ru: 60 лет “культурной революции”
- Spark_news: Самые большие штрафы ГИБДД платят зумеры
- OpenBSD 7.9: поддержка Wi-Fi 6, USB4 и 255 ядер. Основные изменения в ОС
- Zero Trust для AI-агентов: как безопасно давать LLM доступ к инструментам, данным и действиям
- Как DPI вычисляет MTProto-прокси: технический разбор детекции протоколов по сигнатурам
- 800 серверов, четыре названия, два брата: как Stark Industries уходил от санкций ЕС