Вы в поезде сели в первый класс. Напротив вас сидит женщина. Вы начинаете замечать в ней некоторые детали, например, у нее макбук и светлые волосы. На ней белый джемпер, и она потягивает кофе из Starbucks. У нее также есть браслет Пандора. Имеет 6 амулетов. Одним из таких оберегов является серебряная сова с голубыми глазами.

Вы понимаете, что смотрите. Вы смотрите в окно и видите поле коров.

Коровы пасутся в поле вокруг большого загородного поместья, типа того, где гордо выглядящий особняк вырисовывается на заднем плане.

Так вы спросите себя. Могла ли эта женщина жить в таком доме?

Вы можете начать строить небольшие гипотезы о женщине. Если у нее есть макбук, у нее может быть располагаемый доход. С другой стороны, она может быть просто студенткой и поэтому имеет право на скидку.

Если у нее есть браслет пандоры, возможно, у нее была богатая мать, которая покупала ей амулеты, и которая оказалась какой-то графиней.

Это вопросы классификации. Как мы можем решить, что это такое, основываясь на том, что мы уже знаем об этом.

У специалистов по обработке и анализу данных есть инструмент, называемый деревом решений, который может помочь в решении подобных проблем. Является ли эта опухоль доброкачественной? На этой картинке собака или кошка? Эта женщина живет в доме, похожем на тот, что на холме, в окружении коров.

Деревья решений определяют, какой фактор является наиболее важным для ответа на поставленный вопрос: браслет Pandora (да), Macbook (да), каштановые волосы (нет).

Часто всего один или два фактора лучше всего отвечают на эти вопросы. Размер опухоли может лучше всего сигнализировать о том, является ли она доброкачественной. Размер глаз животного может лучше всего указать, кошка это или собака.

Деревья решений учитывают все возможные факторы и спрашивают: «Насколько это важно для этого вопроса».

Это вопрос, который вы начинаете часто задавать себе в повседневном разговоре.