как получить labelencoder для новых данных в дереве решений

Я выполняю дерево решений с помощью приведенных ниже примеров данных.

Поэтому я преобразовал приведенные выше данные в LabelEncoder для выполнения дерева решений и успешно создал модель DT.

Итак, теперь мое требование: я хотел бы предсказать приведенные ниже значения. Итак, как передать эти значения в коде Python.

Чтобы предсказать существующее значение, я могу использовать приведенный ниже код предсказания.

model.predict([[2,1,1]])

ПОЛНЫЙ КОД

import pandas as pd

df = pd.read_csv(r"salaries.csv")
df.head()

inputs = df.drop('salary_more_then_100k',axis='columns')
target = df['salary_more_then_100k']

from sklearn.preprocessing import LabelEncoder
le_company = LabelEncoder()
le_job = LabelEncoder()
le_degree = LabelEncoder()

inputs['company_n'] = le_company.fit_transform(inputs['company'])
inputs['job_n'] = le_job.fit_transform(inputs['job'])
inputs['degree_n'] = le_degree.fit_transform(inputs['degree'])

inputs_n = inputs.drop(['company','job','degree'],axis='columns')

from sklearn import tree
model = tree.DecisionTreeClassifier()
model.fit(inputs_n, target)

model.score(inputs_n,target)

Vikas 26.09.2020 источник

comment

Возможно, это ваш ответ - Vaziri-Mahmoud 26.09.2020

comment

Спасибо за это. Я попробовал в соответствии с вашим предложением, используя код new_list = ['google'] print(le_company.fit_transform(new_list)), и я проверил для Google, где он отображает вывод [0], но он должен быть [2] - Vikas 26.09.2020

comment

Вы должны использовать le_company.transform(new_list) - Vaziri-Mahmoud 26.09.2020

comment

Я изменил и работает, когда я передаю google, но когда я передаю apple, он говорит y contains previously unseen labels: ['apple'] - Vikas 26.09.2020

comment

Потому что кодировщик никогда не видел «яблоко». Вы должны прочитать это - Vaziri-Mahmoud 26.09.2020

comment

Понял. Если я хочу предсказать новые значения, как я это сделаю? - Vikas 26.09.2020

comment

Давайте продолжим обсуждение в чате. - Vikas 26.09.2020

как получить labelencoder для новых данных в дереве решений

Вопросы по теме