AI safety » b.Z - Записки о гаджетах, людях и музыке

10 июня 2026 0 26

Мифы о Mythos: как Anthropic пытается продать страх

Последние два месяца в кибербезопасности только и разговоров, что о Mythos. Новая модель Anthropic, которую компания отказалась выпускать в открытый доступ, слишком опасная, по заявлениям разработчиков: находит zero-day-уязвимости в каждой крупной операционной системе и каждом браузере, строит...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность Anthropic Claude Mythos кибербезопасность AI safety маркетинг IPO LLM OpenAI Project Glasswing zero-day

27 ноября 2025 0 67

3 главных инсайта о «взломах» LLM из исследования StrongREJECT

Всем привет! Погружаюсь в новую для себя область AI Security, в связи с чем решил написать несколько обзоров на самые обсуждаемые исследования и статьи по этой теме. Сегодня поговорим про взлом LLM и неожиданные выводы исследования StrongReject. Джейлбрейкнуть...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность AI security AI safety Benchmark Jailbreak LLM StrongREJECT Strong REJECT

6 июня 2025 0 110

Absolute Zero Reasoner: ИИ научился программированию без входных данных — и это может поменять всё

Возможно я был недостаточно внимателен, но мне попалось на Хабре буквально одно, очень краткое упоминание крайне интересного исследования от команды из Университета Цинхуа и партнерских институтов нескольких стран: Absolute Zero Reasoner (AZR) — новую систему машинного обучения, которая развивает...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность Absolute Zero Reasoner AZR машинное обучение без данных самообучающийся ИИ self-play безопасность ИИ AI safety