llm » b.Z - Записки о гаджетах, людях и музыке

16 апреля 2026 0 12

Токсичный контент, промпт-хакинг и защита ИИ — всё о Guardrails для LLM

Сегодня LLM — модный инструмент, завтра — обязательный компонент инфраструктуры. Мы разберём, какие уязвимости у языковых моделей есть уже сейчас, почему вокруг guardrails формируется целый стек технологий и как разработчикам влиться в эту волну, пока она только набирает высоту Читать далее...

Токсичный контент, промпт-хакинг и защита ИИ — всё о Guardrails для LLM

Как мы в CodeScoring модель для поиска секретов готовили

Глухой телефон для ИИ: мы замерили физику LLM-графов и поняли, почему добавление агентов всё ломает

Как Claude Opus 4.6 спас кандидата от провала: скрытые тесты в PDF и новые правила найма

Как маскировать персональные данные на изображениях: наш эксперимент с OCR и NER

Халява уходит из разработки Агентов

«Агенты Хаоса»: ИИ стирает сервера, или почему нельзя давать языковым моделям права root

Разработка под eCommerce, пулинг объектов в .NET, менеджмент и open source — чтение на выходные от нашей DIY-платформы

Скайнет нанимает фрилансеров: как ИИ-агенты начали покупать человеческий труд через API

Взлом LLM-агентов на уровне архитектуры: почему они беззащитны перед структурными инъекциями

Prompt injection для смелых духом: от zero-click атаки на 1.4B устройств до философского джейлбрейка

Защита LLM за 3ms: как я построил open-source иммунную систему для AI

Хакнуть ИИ: обзор игры «Защищ[AI]» — киберполигона для изучения промт-инъекций

Zero Trust и LLM в корпорации, что это и зачем надо

Регуляторные документы РФ по безопасности ИИ — с чем мы вступаем в 2026 год

Я заставил 14 нейросетей врать: Большой аудит галлюцинаций 2026

Ну, LLM, погоди…

AI-безопасность: зачем нужен слой на C рядом с Python-детекторами