От хаоса к порядку: как ML помогает искать и защищать конфиденциальную информацию
В современном мире объемы данных растут экспоненциально: компании ежедневно генерируют и обрабатывают огромные массивы информации — от реляционных баз данных и текстовых документов до изображений, аудио и видео. С ростом объемов информации усложняется и ее защита, особенно в отношении чувствительных сведений: персональных данных сотрудников и клиентов, финансовой информации, корпоративных документов и других конфиденциальных материалов.
Традиционные методы обнаружения и классификации информации, основанные на формальной экспертизе и регулярных выражениях, демонстрируют ограниченную эффективность: они неплохо работают для стандартных форматов, таких как email-адреса и банковские карты, но могут не покрывать с должной полнотой обнаружение в реальных сценариях. На помощь приходит машинное обучение, позволяющее автоматизировать процесс классификации, учитывать контекст и работать с разными источниками информации.
Меня зовут Вадим Безбородов. Мы c Максимом Митрофановым в департаменте Data science & ML в Positive Technologies занимаемся исследованием и внедрением машинного обучения в продукты компании. В этой статье расскажем о наших исследованиях и внедрении ML в модуль поиска и классификации чувствительных данных в PT Data Security.
ЧитатьИсточник: Хабрахабр
Похожие новости
- HR-фокусы 2025: оптимизация затрат, обучение персонала и повышение эффективности — в приоритете у работодателей
- [Перевод] Запускаем Kali Linux в контейнере Apple
- Могут ли шпионить RFID-метки в купленной одежде?
- Тестируем новую версию менеджера паролей Пассворк: обзор изменений от интерфейса до доступа по API
- Медиатренды-2025: как поймать внимание пользователя в эпоху стремительного потребления контента
- Балансируя на грани: как внедрить Differential Privacy в аналитические пайплайны на Python
- Zero Trust Architecture и персональные данные
- Редакция Spark.ru: Как написать холодное сообщение b2b–клиенту так, чтобы он ответил
- Что если бы в Аэрофлоте были ИБМ МФ и z/OS
- Что на самом деле радует пиарщиков