Вопросы по теме 'sklearn-pandas'

как применить методы предварительной обработки к нескольким столбцам одновременно в sklearn
Мой вопрос: у меня так много столбцов в моем фрейме данных pandas, и я пытаюсь применить предварительную обработку sklearn, используя сопоставитель фреймов данных из библиотеки sklearn-pandas, такой как mapper= DataFrameMapper([...
3222 просмотров

Неожиданный вывод StandardScaler fit_transform
Я пытаюсь масштабировать серию панд с помощью StandardScaler().fit_transform(). Однако вывод всегда представляет собой массив нулей. Входная серия имеет длину 201, когда я делаю: print values[:5] Я получаю список поплавков, как показано...
751 просмотров
schedule 24.09.2022

неупорядочиваемые типы: dict () ‹= int () при запуске классификатора OneVsRest
Я использую многозначную классификацию входных данных с 330 функциями и около 800 записями. Я использую RandomForestClassifier со следующим параметром param_grid: > param_grid = {"n_estimators": [20], > "max_depth": [6], >...
521 просмотров
schedule 15.03.2023

read_table в пандах, как получить ввод из текста в фрейм данных
Alabama[edit] Auburn (Auburn University)[1] Florence (University of North Alabama) Jacksonville (Jacksonville State University)[2] Alaska[edit] Fairbanks (University of Alaska Fairbanks)[2] Arizona[edit] Flagstaff (Northern Arizona University)[6]...
2192 просмотров
schedule 25.06.2023

Как заполнить нулевое значение в атрибутах объекта при разработке функций?
Я изучил метод fill null в Kaggle в разработке функций. Некоторые игроки заполняют NA другим значением объекта. Например, в столбце пола есть значения «Мужской», «Женский» и NA. Метод заключается в заполнении NA другим значением объекта,...
930 просмотров

В чем разница между импортом всего модуля и импортом только необходимого метода из модуля в Python?
При использовании scikit learn или других подобных библиотек Python в чем разница между выполнением: import sklearn.cluster as sk model = sk.KMeans(n_clusters=n) И from sklearn.cluster import KMeans model = KMeans(n_clusters=n) Есть...
444 просмотров
schedule 03.07.2022

Пути коэффициентов для гребневой регрессии в scikit-learn
Начиная с pandas DataFrame, d_train (774 строки): Идея состоит в том, чтобы следовать примеру здесь , чтобы исследовать пути коэффициента Риджа. В этом примере, вот типы переменных: X, y, w = make_regression(n_samples=10,...
1544 просмотров

ошибка значения подобия косинуса python scikit-learn: не удалось преобразовать целочисленный скаляр
Я пытаюсь создать матрицу сходства косинусов, используя текстовые описания приложений. Приведенный ниже сценарий сначала считывает файл данных csv (я могу предоставить файл данных, если это необходимо), который содержит два столбца, один с двумя...
902 просмотров

Не удается импортировать линейную регрессию из Sklearn
from sklearn.linear_model import LinearRegression дает мне эту ошибку в Jupyter Notebook: --------------------------------------------------------------------------- ImportError Traceback (most recent call...
7153 просмотров
schedule 09.10.2022

Python sklearn-pandas Преобразование нескольких столбцов одновременно с ошибкой
Я использую python с pandas и sklearn и пытаюсь использовать новый и очень удобный sklearn-pandas . У меня есть большой фрейм данных, и мне нужно аналогичным образом преобразовать несколько столбцов. У меня есть несколько имен столбцов в...
904 просмотров

Получение ошибки на StandardScalar Fit_Transform
import numpy as np import matplotlib.pyplot as plt import pandas as pd dataset = pd.read_csv('Position_Salaries.csv') X = dataset.iloc[:, 1:2].values y = dataset.iloc[:, 2].values from sklearn.preprocessing import StandardScaler sc_X =...
13750 просмотров

Precision_proba DecisionTreeClassifier возвращает 0 или 1
Я пытаюсь использовать классифицированное дерево решений для идентификации двух классов (переименованных в 0 и 1) на основе определенных параметров. Я обучаю его с использованием набора данных, а затем запускаю его на «тестовом наборе данных». Когда...
8381 просмотров
schedule 05.09.2022

StandardScaler не масштабируется должным образом
Я пытаюсь использовать StandardScaler для масштабирования функций нейронной сети. Допустим, тогда нейронная сеть имеет следующие функции: 1.0 2.0 3.0 4.0 5.0 6.0 4.0 11.0 12.0 etc ... Когда я применяю StandardScaler ко всему (все...
2797 просмотров

Наивный байесовский классификатор - пустой словарь
Я пытаюсь использовать Наивный Байес для обнаружения юмора в текстах. У меня есть этот код, взятый из здесь , но у меня есть некоторые ошибки, и я не не знаю, как их решить, потому что я новичок в машинном обучении и этих алгоритмах. Мои данные...
463 просмотров

UnicodeDecodeError в арабских наборах данных классификации Python
У меня есть арабские наборы данных для классификации с использованием Python; два каталога (отрицательный и положительный) в каталоге Twitter. Я хочу использовать классы Python для классификации данных. Когда я запускаю прикрепленный код,...
442 просмотров

Sklearn DecisionTreeclassifier возвращает невозможное значение для разделения
Я пытаюсь реализовать DecisionTreeClassifier из sklearn с помощью DataFrame (pandas), но он возвращает некоторые странные значения при разделении моих данных. Мой набор данных содержит 3 столбца с коэффициентами корреляции Пирсона, которые могут быть...
283 просмотров

Как получить важность функции в логистической регрессии с использованием весов?
У меня есть набор отзывов с меткой класса положительный/отрицательный. Я применяю логистическую регрессию к этому набору данных отзывов. Во-первых, я конвертирую в Bag of words . Здесь sorted_data['Text'] — это отзывы , а final_counts — это...
13067 просмотров

Установите sklearn_pandas с помощью conda через командную строку Windows
Я хочу установить библиотеку sklearn_pandas с conda через командную строку Windows. Пакет, по-видимому, является «частным» в репозитории conda (по общему признанию, вполне может быть, почему я не могу его установить, но я предпочитаю спросить...
3013 просмотров

Как я могу использовать кодировщик меток sklearn и напрямую обращаться к моему кадру данных
У меня есть кадр данных, и я хочу использовать LabelEncoder непосредственно на нем. Датафрейм: df.select_dtypes('object').iloc[:,1:] Gender Married x_y x_z 0 Male No 0 No 1 Male Yes 1 No 2 Male...
179 просмотров
schedule 28.05.2022

ValueError: количество функций модели должно соответствовать входным данным (sklearn)
Я пытаюсь запустить классификатор для некоторых данных обзора фильмов. Данные уже были разделены на reviews_train.txt и reviews_test.txt . Затем я загрузил данные и разделил их на просмотр и метку (либо положительную (0), либо отрицательную (1)),...
3297 просмотров