

В прошлой статье мы разобрали идею нашего компонентного анализатора и поделились результатами некоторых экспериментов, проведенных в лабораторных условиях. Результаты, полученные на маленькой части датасета в размере 3000 библиотек, вышли довольно оптимистичными. В этой статье опишем сложности, с которыми мы столкнулись при попытках применить решение на ~105к библиотек, и расскажем, как с ними справлялись.
Читать далееИсточник: Хабрахабр
Источник: orlov-pg (TINKOFF)
Другие материалы на сайте b.Z - Записки о гаджетах, людях и музыке