Я выполняю дерево решений с помощью приведенных ниже примеров данных.
Поэтому я преобразовал приведенные выше данные в LabelEncoder для выполнения дерева решений и успешно создал модель DT.
Итак, теперь мое требование: я хотел бы предсказать приведенные ниже значения. Итак, как передать эти значения в коде Python.
Чтобы предсказать существующее значение, я могу использовать приведенный ниже код предсказания.
model.predict([[2,1,1]])
ПОЛНЫЙ КОД
import pandas as pd
df = pd.read_csv(r"salaries.csv")
df.head()
inputs = df.drop('salary_more_then_100k',axis='columns')
target = df['salary_more_then_100k']
from sklearn.preprocessing import LabelEncoder
le_company = LabelEncoder()
le_job = LabelEncoder()
le_degree = LabelEncoder()
inputs['company_n'] = le_company.fit_transform(inputs['company'])
inputs['job_n'] = le_job.fit_transform(inputs['job'])
inputs['degree_n'] = le_degree.fit_transform(inputs['degree'])
inputs_n = inputs.drop(['company','job','degree'],axis='columns')
from sklearn import tree
model = tree.DecisionTreeClassifier()
model.fit(inputs_n, target)
model.score(inputs_n,target)
new_list = ['google'] print(le_company.fit_transform(new_list))
, и я проверил для Google, где он отображает вывод[0]
, но он должен быть[2]
- person Vikas   schedule 26.09.2020le_company.transform(new_list)
- person Vaziri-Mahmoud   schedule 26.09.2020y contains previously unseen labels: ['apple']
- person Vikas   schedule 26.09.2020