Публикации по теме sklearn-pandas

Вопросы по теме 'sklearn-pandas'

как применить методы предварительной обработки к нескольким столбцам одновременно в sklearn

Мой вопрос: у меня так много столбцов в моем фрейме данных pandas, и я пытаюсь применить предварительную обработку sklearn, используя сопоставитель фреймов данных из библиотеки sklearn-pandas, такой как mapper= DataFrameMapper([...

3222 просмотров

24.09.2022

Неожиданный вывод StandardScaler fit_transform

Я пытаюсь масштабировать серию панд с помощью StandardScaler().fit_transform(). Однако вывод всегда представляет собой массив нулей. Входная серия имеет длину 201, когда я делаю: print values[:5] Я получаю список поплавков, как показано...

751 просмотров

python scikit-learn sklearn-pandas

24.09.2022

неупорядочиваемые типы: dict () ‹= int () при запуске классификатора OneVsRest

Я использую многозначную классификацию входных данных с 330 функциями и около 800 записями. Я использую RandomForestClassifier со следующим параметром param_grid: > param_grid = {"n_estimators": [20], > "max_depth": [6], >...

521 просмотров

python scikit-learn sklearn-pandas

15.03.2023

read_table в пандах, как получить ввод из текста в фрейм данных

Alabama[edit] Auburn (Auburn University)[1] Florence (University of North Alabama) Jacksonville (Jacksonville State University)[2] Alaska[edit] Fairbanks (University of Alaska Fairbanks)[2] Arizona[edit] Flagstaff (Northern Arizona University)[6]...

2192 просмотров

python-3.x python pandas sklearn-pandas

25.06.2023

Как заполнить нулевое значение в атрибутах объекта при разработке функций?

Я изучил метод fill null в Kaggle в разработке функций. Некоторые игроки заполняют NA другим значением объекта. Например, в столбце пола есть значения «Мужской», «Женский» и NA. Метод заключается в заполнении NA другим значением объекта,...

930 просмотров

machine-learning kaggle sklearn-pandas feature-extraction

04.07.2023

В чем разница между импортом всего модуля и импортом только необходимого метода из модуля в Python?

При использовании scikit learn или других подобных библиотек Python в чем разница между выполнением: import sklearn.cluster as sk model = sk.KMeans(n_clusters=n) И from sklearn.cluster import KMeans model = KMeans(n_clusters=n) Есть...

444 просмотров

python scikit-learn sklearn-pandas

03.07.2022

Пути коэффициентов для гребневой регрессии в scikit-learn

Начиная с pandas DataFrame, d_train (774 строки): Идея состоит в том, чтобы следовать примеру здесь , чтобы исследовать пути коэффициента Риджа. В этом примере, вот типы переменных: X, y, w = make_regression(n_samples=10,...

1544 просмотров

python machine-learning linear-regression sklearn-pandas

11.01.2023

ошибка значения подобия косинуса python scikit-learn: не удалось преобразовать целочисленный скаляр

Я пытаюсь создать матрицу сходства косинусов, используя текстовые описания приложений. Приведенный ниже сценарий сначала считывает файл данных csv (я могу предоставить файл данных, если это необходимо), который содержит два столбца, один с двумя...

902 просмотров

python scikit-learn sklearn-pandas cosine-similarity

23.05.2023

Не удается импортировать линейную регрессию из Sklearn

from sklearn.linear_model import LinearRegression дает мне эту ошибку в Jupyter Notebook: --------------------------------------------------------------------------- ImportError Traceback (most recent call...

7153 просмотров

scikit-learn sklearn-pandas

09.10.2022

Python sklearn-pandas Преобразование нескольких столбцов одновременно с ошибкой

Я использую python с pandas и sklearn и пытаюсь использовать новый и очень удобный sklearn-pandas . У меня есть большой фрейм данных, и мне нужно аналогичным образом преобразовать несколько столбцов. У меня есть несколько имен столбцов в...

904 просмотров

python pandas dataframe scikit-learn sklearn-pandas

17.04.2023

Получение ошибки на StandardScalar Fit_Transform

import numpy as np import matplotlib.pyplot as plt import pandas as pd dataset = pd.read_csv('Position_Salaries.csv') X = dataset.iloc[:, 1:2].values y = dataset.iloc[:, 2].values from sklearn.preprocessing import StandardScaler sc_X =...

13750 просмотров

python arrays machine-learning scikit-learn sklearn-pandas

10.07.2023

Precision_proba DecisionTreeClassifier возвращает 0 или 1

Я пытаюсь использовать классифицированное дерево решений для идентификации двух классов (переименованных в 0 и 1) на основе определенных параметров. Я обучаю его с использованием набора данных, а затем запускаю его на «тестовом наборе данных». Когда...

8381 просмотров

python sklearn-pandas decision-tree roc

05.09.2022

StandardScaler не масштабируется должным образом

Я пытаюсь использовать StandardScaler для масштабирования функций нейронной сети. Допустим, тогда нейронная сеть имеет следующие функции: 1.0 2.0 3.0 4.0 5.0 6.0 4.0 11.0 12.0 etc ... Когда я применяю StandardScaler ко всему (все...

2797 просмотров

python pandas scikit-learn sklearn-pandas theano

13.07.2022

Наивный байесовский классификатор - пустой словарь

Я пытаюсь использовать Наивный Байес для обнаружения юмора в текстах. У меня есть этот код, взятый из здесь , но у меня есть некоторые ошибки, и я не не знаю, как их решить, потому что я новичок в машинном обучении и этих алгоритмах. Мои данные...

463 просмотров

python machine-learning scikit-learn sklearn-pandas naivebayes

12.10.2022

UnicodeDecodeError в арабских наборах данных классификации Python

У меня есть арабские наборы данных для классификации с использованием Python; два каталога (отрицательный и положительный) в каталоге Twitter. Я хочу использовать классы Python для классификации данных. Когда я запускаю прикрепленный код,...

442 просмотров

python-2.7 sklearn-pandas text-classification naivebayes nearest-neighbor

16.08.2022

Sklearn DecisionTreeclassifier возвращает невозможное значение для разделения

Я пытаюсь реализовать DecisionTreeClassifier из sklearn с помощью DataFrame (pandas), но он возвращает некоторые странные значения при разделении моих данных. Мой набор данных содержит 3 столбца с коэффициентами корреляции Пирсона, которые могут быть...

283 просмотров

python pandas sklearn-pandas decision-tree

19.01.2023

Как получить важность функции в логистической регрессии с использованием весов?

У меня есть набор отзывов с меткой класса положительный/отрицательный. Я применяю логистическую регрессию к этому набору данных отзывов. Во-первых, я конвертирую в Bag of words . Здесь sorted_data['Text'] — это отзывы , а final_counts — это...

13067 просмотров

machine-learning scikit-learn sklearn-pandas logistic-regression

20.12.2023

Установите sklearn_pandas с помощью conda через командную строку Windows

Я хочу установить библиотеку sklearn_pandas с conda через командную строку Windows. Пакет, по-видимому, является «частным» в репозитории conda (по общему признанию, вполне может быть, почему я не могу его установить, но я предпочитаю спросить...

3013 просмотров

command-line windows conda scikit-learn sklearn-pandas

05.08.2023

Как я могу использовать кодировщик меток sklearn и напрямую обращаться к моему кадру данных

У меня есть кадр данных, и я хочу использовать LabelEncoder непосредственно на нем. Датафрейм: df.select_dtypes('object').iloc[:,1:] Gender Married x_y x_z 0 Male No 0 No 1 Male Yes 1 No 2 Male...

179 просмотров

python scikit-learn sklearn-pandas

28.05.2022

ValueError: количество функций модели должно соответствовать входным данным (sklearn)

Я пытаюсь запустить классификатор для некоторых данных обзора фильмов. Данные уже были разделены на reviews_train.txt и reviews_test.txt . Затем я загрузил данные и разделил их на просмотр и метку (либо положительную (0), либо отрицательную (1)),...

3297 просмотров

python machine-learning scikit-learn sklearn-pandas tfidfvectorizer

22.09.2022