Как мы обезличиваем ПДн, сохраняя их смысл и качество. Чтобы тестовый стенд был полезным, будто там данные с прода
Год назад мы выпустили «Маскировщик» — промышленный софт, который обезличивает персональные данные, сохраняя их качество и смысл. То есть гендерный баланс; социально‑демографическую структуру; родственные связи; страну и оператора в телефоне; валидность паспортов, ИНН, СНИЛС. В общем, «Маскировщик» делает так, чтобы вы тестировали продукты и обучали ML‑модели будто бы на «живых» ПД.
В этой статье пролью свет на методы изменения состава и семантики, которые использует продукт. Для простоты буду называть их «алгоритмами маскирования». Расскажу, по какой логике меняем одни данные другими, какие ограничения и как учитываем.
Разобраться в алгоритмах маскированияИсточник: Хабрахабр
Похожие новости
- Product Radar: Экспресс-аудит кибербезопасности, AI-студия для создания мини-сериалов – и ещё 8 российских стартапов
- Мультистейдж-сборка на Docker BuildX: мифы и реальность
- Текст как бензин: Почему в эпоху нейросетей и подкастов старый добрый шрифт всё ещё рулит
- OpenVEX в CI/CD: как перестать бороться с ложными CVE и научить Trivy понимать контекст
- Prompt injection нельзя запатчить: год «летальной триады» и лента CVE 2026 года
- OSINT для ленивых. Заметки на полях. Пароли
- Технический трек R-EVOlution Conference 2026: 11 докладов, которые теперь можно посмотреть в записи
- «Fix typo»: как в PHP закоммитили бэкдор и почему composer install — это акт доверия
- Книга: «Безопасность контейнеров. Фундаментальный подход к защите контейнеризированных приложений. 2-е изд.»
- Android Kiosk: как купить сухарики, когда ларёк закрыт