llm » Страница 3 » b.Z - Записки о гаджетах, людях и музыке

3 декабря 2024 0 119

[Перевод] DeepSeek AI: От инъекции промпта до захвата аккаунта

Около двух недель назад китайская лаборатория DeepSeek представила свою новую AI модель DeepSeek-R1-Lite, которая специализируется на логических рассуждениях. Конечно, у всего AI-сообщества быстро загорелся огонь в глазах от заявленных возможностей модели. И я один из них. Как обычно: раз новая...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность xss веб-безопасность инъекция промпта llm ai эксплойт base64 пентестинг ии машинное+обучение

22 ноября 2024 0 194

Как мы обучали LLM для поиска уязвимостей в смарт-контрактах Solidity

Наша команда в Positive Technologies занимается анализом безопасности смарт-контрактов, исследованием уязвимостей и разработкой инструментов для их обнаружения. Идея использовать LLM для анализа смарт-контрактов Solidity показалась крайне заманчивой. Загрузить код, запустить модель — и она сама...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность llm lora blockchain solidity уязвимости llama3.1 chatgpt промпт

3 ноября 2024 0 176

[Перевод] Анатомия LLM RCE

По мере того, как большие языковые модели (LLM) становятся все более сложными, и разработчики наделяют их новыми возможностями, резко увеличиваются случаи возникновения угрозы безопасности. Манипулируемые LLM представляют собой не только риск нарушения этических стандартов, но и реальную угрозу...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность llm rce ai уязвимости

27 сентября 2024 0 127

Создание своих тестов для Garak

В прошлой статье (https://habr.com/ru/companies/oleg-bunin/articles/843644/) я уже говорил о тёмной стороне больших языковых моделей и способах борьбы с проблемами. Но новые уязвимости вскрываются ежедневно, и даже самые крутые инструменты с постоянными обновлениями не всегда за ними успевают....

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность Garak mlsecops ai llm-attack malware большие языковые модели анализ уязвимостей выявление угроз llm

15 сентября 2024 0 207

[Перевод] Безопасность приложений больших языковых моделей (LLM, GenAI)

Откройте для себя OWASP Top 10 для LLM и GenAI и изучите основные стратегии защиты ваших моделей и приложений искусственного интеллекта. Появление больших языковых моделей (LLMs) и технологий генеративного искусственного интеллекта (GenAI), таких как GPT-4, произвело революцию в различных отраслях...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность llm genai owasp owasp top 10 security

29 июля 2024 0 138

Turbo ML Conf 2024 — по следам

В формате разбора содержания докладов я, автор канала @borismlsec, приведу три интереснейших из тех, что мне довелось посетить на конференции Turbo ML 2024. Они привлекли меня не только как дата саентиста, но и как сотрудника вендора решений по кибербезопасности. И по каждому докладу в конце я...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность ml nlp recsys llm cybersecurity soar ueba

9 июня 2024 0 150

Как защитить своего бота на базе LLM (ChatGPT) от взлома?

Как гарантировано защитить своего бота на ChatGPT от взлома его системной роли? В статье предлагается один из подходов, который может защитить бота на базе любой LLM. В итоге бот ни при каких обстоятельствах не должен раскрыть пользователю свою системную роль и не говорить на темы, которые мы...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность llm промпт защита информации безопасность security bot chatgpt ai искусственный интеллект бот

22 мая 2024 0 189

О чем еще говорят питонисты? Python-праздник на Positive Hack Days Fest 2. Часть 2

В прошлой статье, посвященной Python Day, который пройдет 26 мая в рамках киберфестиваля Positive Hack Days 2, мы рассказали о 4 из 8 запланированных докладов конференции. Продолжаем свой рассказ, дополняя его комментариями участников программного комитета мероприятия. Читать далее...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность phdays python ai llm ddd gil chatgpt cybersecurity

15 мая 2024 0 130

Угрозы под контролем: применение ML для автоматического анализа отчётов

Привет, Хабр! Меня зовут Валерия Чулкова, я продакт-менеджер R-Vision TIP. Сегодня совместно с Анастасией Перковой и Сергеем Ивановым мы расскажем про сервис для распознавания отчетов о киберугрозах, созданный командой экспертов в области машинного обучения R-Vision. В этой статье мы объединили...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность threat intelligence информационная безопасность ioc ner named entity recognition llm

14 мая 2024 0 156

Могут ли LLM-агенты взламывать сайты и эксплуатировать уязвимости?

Рассказываем про исследование, в рамках которого тестировалась способность LLM-агентов взламывать сайты и эксплуатировать уязвимости. Читать далее...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность языковые модели llm vulnerability уязвимости безопасность сайтов эксплуатация уязвимостей

27 апреля 2024 0 269

Большие языковые модели в финтехе: можно ли доверять им данные

Меня зовут Илья Кашлаков, я руковожу департаментом разработки в ЮMoney. Сегодня расскажу о том, какие задачи финтех может доверить большим языковым моделям (LLM) и как мы в компании следим за безопасностью, чтобы не допускать утечку данных. Также вспомним три самых распространённых уязвимости LLM...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность llm машинное обучение обучение модели безопасность данных owasp top-10 copilot

25 апреля 2024 0 147

Attaque a-la russe: атака с помощью промт-инъекций русскоязычных моделей семейства Saiga2

Насколько хорошо защищены открытые большие языковые модели от генерации вредоносного контента? Рассмотрим механизмы атаки с промт-инъекцией на большие языковые модели, а так же рекомендации по защите от них. Читать далее...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность llm ai safety

5 марта 2024 0 143

Как защитить бизнес при внедрении LLM (часть 1)

Новый мир с LLM — прекрасен! Нам, инженерам, он открывает много перспектив. А тем, кто его незаконно использует — предоставляет новые страшные инструменты. Как же защитить свой бизнес от угроз нейросетей? Меня зовут Евгений Кокуйкин и я — руководитель AI продуктов компании Raft. Занимаюсь...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность llm информационная безопасность нейросети machine learning уязвимости модели риски бизнеса prompt плагины langchain

21 февраля 2024 0 153

Можно ли получить «опасный» ответ от GPT-4 и как защищаться от Token Smuggling

Мы продолжаем рассказывать вам о уязвимостях LLM. На этот раз давайте поговорим о авторегрессионных моделях и “Token Smuggling”, а также посмотрим, сможет ли GPT-4 выдать нам ответы на опасные вопросы. Узнать больше...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность llm ai безопасность nlp (natural language processing) code-generation авторегрессионные модели Token Smuggling gpt-4 Контрабанда токенов

4 декабря 2023 0 501

Способы атаки на ИИ (Claude & ChatGPT): floating attention window attack

Хакеры придумывают всё более изощренные способы атаки на искусственный интеллект. Один из наиболее интересных — это атака «плавающего окна внимания»: злоумышленники манипулируют контекстом диалога с ИИ, подталкивая его к опасным выводам и смещению фокуса. Чрезвычайно тонкий подход, позволяющий...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность llm nlp claude chatgpt

28 ноября 2023 0 144

Лучшие инструменты с ChatGPT для ИБ-специалиста

Любой инструмент можно использовать как во вред, так и во благо. Точно так же с нейросетью. Пока WormGPT помогает хакерам писать убедительные фишинговые письма на разных языках, ChatGPT уже давно и твёрдо стоит на страже кибербеза. Привет! Меня зовут Александр Быков, я создаю облачные ИБ-сервисы в...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность chatgpt инструменты иб облачная безопасность кибербезопасность ai open ai nebula pentest tools llm

20 ноября 2023 0 140

[Перевод] Как уговорить Google Bard слить тебе ценные данные

В последнее время у Google Bard появилось несколько мощных обновлений, в том числе Extensions. Extensions позволяют Bard получать доступ к YouTube, искать авиарейсы и отели, а также иметь доступ к личным документам и письмам пользователя. То есть теперь Bard способен читать и анализировать Диск,...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность ruvds_переводы google bard чат-боты google документы google docs llm большие языковые модели

23 июня 2023 0 229

Взламывая ChatGPT: как мы участвовали в хакатоне по атакам на ИИ

Мы поучаствовали в хакатоне от LearnPrompting, посвященном атакам на ChatGPT, и заняли восьмое место среди около четырехсот команд. Если вам интересно, зачем мы провели несколько ночей за взломом чат-бота, как нам пригодился опыт борьбы с фишингом и умеют ли нейросети хранить секреты, — добро...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность Блог компании «Лаборатория Касперского» Информационная безопасность Машинное обучение Искусственный интеллект llm языковые модели chatgpt хакатон prompt openai нейронные сети нейросети искусственный интеллект м