anthropic » b.Z - Записки о гаджетах, людях и музыке

18 марта 2026 0 53

Как Claude Opus 4.6 спас кандидата от провала: скрытые тесты в PDF и новые правила найма

Работодатель спрятал в PDF с тестовым заданием скрытую инструкцию для ИИ. Claude Opus 4.6 не только отказался ее выполнять, но и предупредил кандидата о ловушке. Разбираемся, как устроена гонка вооружений между HR и соискателями в эпоху LLM. И главное, как проверять такие документы перед работой....

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность opus 4.6 claude prompt injection llm безопасность ai security anthropic найм сотрудников искусственный интеллект нейросети

20 февраля 2026 0 27

Prompt injection для смелых духом: от zero-click атаки на 1.4B устройств до философского джейлбрейка

SQL-инъекцию мы лечили 20 лет и вылечили. Prompt injection — фундаментально нерешаема. Это не я придумал. OWASP ставит её на первое место второй год подряд. Найдена в 73% продакшн AI-систем при аудитах. Вы не за статистикой сюда пришли. Вы пришли за мясом. Ниже — 10 кейсов, которые не попали в...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность AI информационная безопасность машинное обучение llm prompt injection ai-агенты уязвимости CVE OWASP anthropic

16 февраля 2026 0 17

OpenClaw присоединился к OpenAI. И почему Claude от Anthropic тоже стоит волноваться

OpenAI забирает к себе создателя OpenClaw Питера Штайнбергера, а сам OpenClaw переводят в формат независимого фонда и обещают поддерживать как open-source. На первый взгляд, обычная кадровая новость. Но на самом деле это сигнал: гонка смещается от тех, у кого умнее модель к тем, у кого агент...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность claude skills openclaw openai anthropic нейросети искусственный интеллект вайбкодинг vibecoding ии агенты

17 декабря 2025 0 43

[Перевод] Исповедь взломанного разума: как хакеры заставили ИИ поверить, что он — герой, спасающий мир

В 3:47 утра по тихоокеанскому времени 18 сентября 2025 года Джейкоб Кляйн наблюдал за тем, чего не должно было быть. На экране его ноутбука агент ИИ по имени Claude Code проводил кибератаку на химическое предприятие в Германии, генерируя тысячи попыток взлома в секунду - скорость, недостижимая для...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность ии нейросети anthropic claude безопасность

4 сентября 2025 0 156

[Перевод] «Вайб хакинг»: как киберпреступники используют ИИ-агентов для масштабирования вымогательских атак

В августовском отчёте Threat Intelligence Report: August 2025 компания Anthropic раскрыла детали новой волны киберпреступности: злоумышленники всё активнее используют ИИ-агентов для автоматизации атак и масштабного вымогательства данных. Исследование показывает, что искусственный интеллект теперь...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность информационная безопасность кибербез ии искусственный интеллект vibe hacking ai anthropic claude

14 декабря 2024 0 139

Новый универсальный метод взлома LLM от Anthropic «Best-of-N Jailbreaking»

Буквально несколько часов назад (на момент написания этой статьи), компания Anthropic предоставила свое новое исследование по обходу защитных механизмов LLM в открытый доступ. Новый способ взлома «Best‑of‑N Jailbreaking» описывает универсальный метод обхода защиты передовых AI‑моделей, работающий с...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность anthropic claude chatgpt взлом обход защиты автоматизация jailbreak цензура информационная безопасность

12 ноября 2024 0 188

Anthropic и гонка к «безопасному ИИ»: что рассказал CEO компании Дарио Амодеи на подкасте Lex Fridman

Недавно Лекс Фридман пригласил Дарио Амодеи, основателя и CEO компании Anthropic, на подкаст, где они почти пять часов обсуждали, к чему идёт развитие ИИ и как создать мощные, но безопасные модели. Если у вас, как и у меня, нет пяти часов на просмотр, — я подготовил это саммари, чтобы решить, стоит...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность ai anthropic claude 3.5