языковые модели » b.Z - Записки о гаджетах, людях и музыке

17 апреля 2026 0 39

Опубликован второй выпуск Продолжения Дневника писателя, его тема: ИИ и Достоевский

Искусственный интеллект пока несовершенен, ему свойственны предвзятость, необъяснимость, а то и простое вранье, которое принято дипломатично называть «галлюцинациями». Эти проблемы актуальны и для мышления человека, поэтому люди давно изобрели способы их решения. В частности, Федор Достоевский...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность искусственный интеллект нейросети языковые модели

22 декабря 2025 0 52

Анатомия Prompt Injection: Как я вошел в топ-10 глобального рейтинга Lakera Agent Breaker

Как пробить многоуровневую защиту LLM-агента, обученную на 80+ млн атаках? В декабре 2025 я вошел в топ-10 глобального рейтинга Lakera Agent Breaker. В этой статье - не просто обзор решения, а детальный разбор уязвимостей современных LLM-систем и архитектура кастомного фаззинг-пайплайна. Читать...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность информационная безопасность искусственный интеллект llm языковые модели хакатон cybersecurity ai leaderboard ctf bughunting

8 декабря 2025 0 60

Галлюцинации ИИ — это не баг, а фича разработчика. Почему вайб-кодинг не заменит программистов

Недавно провели стрим, где собрались специалисты, у которых ИИ не в презентациях, а в production. Провели разговор про галлюцинации моделей и про будущее разработки с ИИ. Ниже основные мысли — получился материал про три уровня работы с ИИ (вайб-кодинг, ИИ-ассистированная разработка и промышленный...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность программирование вайб-кодинг вайб-программирование языковые модели llm-модели галлюцинации ии программирование для начинающих экономика it-образование конвейер

22 июля 2025 0 90

Как мы строим умный «файрвол» для LLM

Привет, Хабр! Я Данила Катальшов, старший промпт-инженер в команде фундаментальных исследований MWS AI. Недавно вместе с коллегами из корейского университета KOREATECH мы опубликовали научную статью, в которой представили новый фреймворк для борьбы с такими грехами LLM, как галлюцинации, генерация...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность ethical ai ai prompts искусственный интеллект нейросети этика фреймфорк языковые модели llm-модели фильтр исследование

14 мая 2024 0 223

Могут ли LLM-агенты взламывать сайты и эксплуатировать уязвимости?

Рассказываем про исследование, в рамках которого тестировалась способность LLM-агентов взламывать сайты и эксплуатировать уязвимости. Читать далее...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность языковые модели llm vulnerability уязвимости безопасность сайтов эксплуатация уязвимостей

18 июля 2023 0 357

[Перевод] Генерация полиморфного вредоносного кода при помощи ChatGPT

В стремительно меняющемся мире кибербезопасности злоумышленники постоянно ищут новые способы внедрения в компьютерные системы, их дестабилизации и эксплуатации уязвимостей. Один из самых коварных их инструментов — полиморфное вредоносное ПО, угроза-оборотень, затрудняющая использование традиционных...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность Блог компании Бастион Информационная безопасность Программирование Искусственный интеллект вредоносное по зловред инструкция openai искуственный интеллект языковые модели программирование полиморфизморфизм

23 июня 2023 0 309

Взламывая ChatGPT: как мы участвовали в хакатоне по атакам на ИИ

Мы поучаствовали в хакатоне от LearnPrompting, посвященном атакам на ChatGPT, и заняли восьмое место среди около четырехсот команд. Если вам интересно, зачем мы провели несколько ночей за взломом чат-бота, как нам пригодился опыт борьбы с фишингом и умеют ли нейросети хранить секреты, — добро...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность Блог компании «Лаборатория Касперского» Информационная безопасность Машинное обучение Искусственный интеллект llm языковые модели chatgpt хакатон prompt openai нейронные сети нейросети искусственный интеллект м