В рамках инициативы PAIR компания Google выпустила Facets — инструмент визуализации с открытым исходным кодом, помогающий понять и проанализировать наборы данных машинного обучения.

Сводка. Обзор фасетов автоматически дает пользователям быстрое представление о распределении значений по функциям их наборов данных. Несколько наборов данных, таких как обучающий набор и тестовый набор, можно сравнивать в одной и той же визуализации. На первый план выдвигаются распространенные проблемы с данными, которые могут препятствовать машинному обучению, такие как: неожиданные значения признаков, признаки с высоким процентом отсутствующих значений, признаки с несбалансированным распределением и перекос распределения признаков между наборами данных.

Полный пост, опубликованный командой Google Big Picture, доступен здесь.

В ближайшие недели я подробно расскажу о гранях, подписывайтесь на me на Medium, если хотите узнать больше!