На этой неделе я потратил некоторое время, чтобы освежить свои знания о машинном обучении в Python, в основном с использованием моделей дерева решений.

Давайте посмотрим, что такое деревья решений и как они помогают нам принимать решения в бизнесе или любом проекте.

Что такое дерево решений?

Дерево решений разбивает данные, которые мы хотим смоделировать, на основе определенного набора параметров. На основе этих параметров мы можем выделить ключевые сегменты данных, которые помогут нам найти решение, которое мы стремимся разработать.

Например, если мы хотим узнать, каков процент домов в районе с 2 спальнями или меньше, в этом может помочь дерево решений. Или, если мы хотим знать, какой продукт является самым продаваемым определенной компанией.

Деревья решений помогают нам ответить на эти вопросы и, следовательно, они весьма полезны для большинства приложений в бизнесе. Это один из самых простых методов моделирования в машинном обучении.

Самые нижние узлы дерева называются листьями. Это говорит само за себя, когда вы думаете о дереве в смысле реального дерева.

Какой простой способ создать модель дерева решений?

Здесь на помощь приходит Python. В частности, определенная библиотека Python, называемая scikit-learn.

Sci-kit learning помогает нам делать прогнозы на основе данных, используя различные методы обучения.

#sci-kit learn is coined as sklearn
from sklearn.tree import DecisionTreeRegressor
#Now, create a model to implement a decision tree. We set a random
#random_state allows your data to be split into reproducible parts
your_model = DecisionTreeRegressor(random_state = 1)
#Fit the model with your data
#X is your predictor variables and y is your target variable
iowa_model.fit(X,y)
#Make a simple prediction
predictions = iowa_model.predict(X)
print(predictions)

Вот и все. Просто как тот.

Следите за тем, как я углубляюсь в изучение методов машинного обучения, но упрощаю их для вас, чтобы вы могли быстро учиться и применять их ко всем своим проблемам.