Steering » b.Z - Записки о гаджетах, людях и музыке

12 января 2026 0 44

Как «думает» ИИ: гроккаем разреженные автоэнкодеры (SAE)

В этой статье разберём исследование от компании Anthropic, которое демонстрирует практическую возможность вскрытия «черного ящика» больших языковых моделей для обеспечения их контролируемости и безопасности с помощью разреженных автоэнкодеров (SAE - Sparse AutoEncoders). И в конце, попробуем...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность Сезон ИИ в разработке LLM interpretable ml interpretability interpretable AI искусственный интеллект ai security Steering SAE Sparse AutoEncoder