Генератор эмбеддингов: как провести качественный анализ метрик сотрудников без прямого доступа к персональным данным
Привет, Хабр! Меня зовут Роман, я работаю в Сбере в блоке HR исследователем данных. Мне и моим коллегам часто приходится иметь дело с персональными данными сотрудников (далее ПДн). А получить допуск к использованию этих данных в различных контурах банка очень непросто: в Сбере серьёзно относятся к безопасности ПДн. Ситуация усложняется тем, что для решения разных задач требуются разные наборы данных. Каждый раз запрашивать допуск — можно, но это долго. Поэтому для упрощения и ускорения работы с использованием ПДн мы решили разработать пайплайн, который анонимизирует данные сотрудников, позволяя проверять их влияние на разные метрики без доступа к чувствительной информации. Результатом работы этого механизма является эмбеддинг.
В статье я показываю особенности работы одной из частей утилиты «Генератор эмбеддингов» в конкретной задаче — поиск похожего сотрудника внутри компании. Подобная задача имеет массу прикладных направлений в бизнесе: поиск преемника, оперативный поиск сотрудника на место уволившегося, профилирование должностей и др. Без использования ПДн здесь, к сожалению, не обойтись. Так, например, для многих сотрудников важную роль играет удалённость офиса банка. И для того чтобы предложить оптимальный вариант работы, нужно учитывать место проживания человека, что уже является ПДн. «Генератор эмбеддингов» помогает оптимизировать этот процесс.
Узнать больше о нашем решенииИсточник: Хабрахабр
Похожие новости
- Крауд, социальные и сабмиты: сколько Web 2.0 ссылок нужно для продвижения сайта в топ выдачи и где их взять
- Работа с блогерами 2025: что ждет рынок после ввода новых ограничений
- Используем RFM-анализ для повышения конверсии: пошаговое руководство
- DOT на лидирующих позициях в Рейтинге Рунета 2025
- Как найти клиентов и генерить лиды. Инструкция для агентств, продакшенов и фрилансеров
- [Перевод] Как я убедил виртуальную машину, что у неё есть кулер
- Студия Лаба: Секунда в секунду: наладили мгновенный обмен данными между 1С, Битрикс24 и базой клиентов в 70 магазинах по всей России
- HackTheBox Labs (Starting Point) — Dancing
- Комплексная защита веб-приложений: обзор взаимодействия разных типов ИБ-решений
- Что делать с раскрытыми паролями