Вопросы по теме 'sklearn-pandas'
как применить методы предварительной обработки к нескольким столбцам одновременно в sklearn
Мой вопрос: у меня так много столбцов в моем фрейме данных pandas, и я пытаюсь применить предварительную обработку sklearn, используя сопоставитель фреймов данных из библиотеки sklearn-pandas, такой как
mapper= DataFrameMapper([...
3222 просмотров
schedule
24.09.2022
Неожиданный вывод StandardScaler fit_transform
Я пытаюсь масштабировать серию панд с помощью StandardScaler().fit_transform(). Однако вывод всегда представляет собой массив нулей.
Входная серия имеет длину 201, когда я делаю:
print values[:5]
Я получаю список поплавков, как показано...
751 просмотров
schedule
24.09.2022
неупорядочиваемые типы: dict () ‹= int () при запуске классификатора OneVsRest
Я использую многозначную классификацию входных данных с 330 функциями и около 800 записями. Я использую RandomForestClassifier со следующим параметром param_grid:
> param_grid = {"n_estimators": [20],
> "max_depth": [6],
>...
521 просмотров
schedule
15.03.2023
read_table в пандах, как получить ввод из текста в фрейм данных
Alabama[edit]
Auburn (Auburn University)[1]
Florence (University of North Alabama)
Jacksonville (Jacksonville State University)[2]
Alaska[edit]
Fairbanks (University of Alaska Fairbanks)[2]
Arizona[edit]
Flagstaff (Northern Arizona University)[6]...
2192 просмотров
schedule
25.06.2023
Как заполнить нулевое значение в атрибутах объекта при разработке функций?
Я изучил метод fill null в Kaggle в разработке функций. Некоторые игроки заполняют NA другим значением объекта.
Например, в столбце пола есть значения «Мужской», «Женский» и NA. Метод заключается в заполнении NA другим значением объекта,...
930 просмотров
schedule
04.07.2023
В чем разница между импортом всего модуля и импортом только необходимого метода из модуля в Python?
При использовании scikit learn или других подобных библиотек Python в чем разница между выполнением:
import sklearn.cluster as sk
model = sk.KMeans(n_clusters=n)
И
from sklearn.cluster import KMeans
model = KMeans(n_clusters=n)
Есть...
444 просмотров
schedule
03.07.2022
Пути коэффициентов для гребневой регрессии в scikit-learn
Начиная с pandas DataFrame, d_train (774 строки):
Идея состоит в том, чтобы следовать примеру здесь , чтобы исследовать пути коэффициента Риджа.
В этом примере, вот типы переменных:
X, y, w = make_regression(n_samples=10,...
1544 просмотров
schedule
11.01.2023
ошибка значения подобия косинуса python scikit-learn: не удалось преобразовать целочисленный скаляр
Я пытаюсь создать матрицу сходства косинусов, используя текстовые описания приложений. Приведенный ниже сценарий сначала считывает файл данных csv (я могу предоставить файл данных, если это необходимо), который содержит два столбца, один с двумя...
902 просмотров
schedule
23.05.2023
Не удается импортировать линейную регрессию из Sklearn
from sklearn.linear_model import LinearRegression
дает мне эту ошибку в Jupyter Notebook:
---------------------------------------------------------------------------
ImportError Traceback (most recent call...
7153 просмотров
schedule
09.10.2022
Python sklearn-pandas Преобразование нескольких столбцов одновременно с ошибкой
Я использую python с pandas и sklearn и пытаюсь использовать новый и очень удобный sklearn-pandas .
У меня есть большой фрейм данных, и мне нужно аналогичным образом преобразовать несколько столбцов.
У меня есть несколько имен столбцов в...
904 просмотров
schedule
17.04.2023
Получение ошибки на StandardScalar Fit_Transform
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
dataset = pd.read_csv('Position_Salaries.csv')
X = dataset.iloc[:, 1:2].values
y = dataset.iloc[:, 2].values
from sklearn.preprocessing import StandardScaler
sc_X =...
13750 просмотров
schedule
10.07.2023
Precision_proba DecisionTreeClassifier возвращает 0 или 1
Я пытаюсь использовать классифицированное дерево решений для идентификации двух классов (переименованных в 0 и 1) на основе определенных параметров. Я обучаю его с использованием набора данных, а затем запускаю его на «тестовом наборе данных». Когда...
8381 просмотров
schedule
05.09.2022
StandardScaler не масштабируется должным образом
Я пытаюсь использовать StandardScaler для масштабирования функций нейронной сети.
Допустим, тогда нейронная сеть имеет следующие функции:
1.0 2.0 3.0
4.0 5.0 6.0
4.0 11.0 12.0
etc ...
Когда я применяю StandardScaler ко всему (все...
2797 просмотров
schedule
13.07.2022
Наивный байесовский классификатор - пустой словарь
Я пытаюсь использовать Наивный Байес для обнаружения юмора в текстах. У меня есть этот код, взятый из здесь , но у меня есть некоторые ошибки, и я не не знаю, как их решить, потому что я новичок в машинном обучении и этих алгоритмах. Мои данные...
463 просмотров
schedule
12.10.2022
UnicodeDecodeError в арабских наборах данных классификации Python
У меня есть арабские наборы данных для классификации с использованием Python; два каталога (отрицательный и положительный) в каталоге Twitter.
Я хочу использовать классы Python для классификации данных. Когда я запускаю прикрепленный код,...
442 просмотров
schedule
16.08.2022
Sklearn DecisionTreeclassifier возвращает невозможное значение для разделения
Я пытаюсь реализовать DecisionTreeClassifier из sklearn с помощью DataFrame (pandas), но он возвращает некоторые странные значения при разделении моих данных. Мой набор данных содержит 3 столбца с коэффициентами корреляции Пирсона, которые могут быть...
283 просмотров
schedule
19.01.2023
Как получить важность функции в логистической регрессии с использованием весов?
У меня есть набор отзывов с меткой класса положительный/отрицательный. Я применяю логистическую регрессию к этому набору данных отзывов. Во-первых, я конвертирую в Bag of words . Здесь sorted_data['Text'] — это отзывы , а final_counts — это...
13067 просмотров
schedule
20.12.2023
Установите sklearn_pandas с помощью conda через командную строку Windows
Я хочу установить библиотеку sklearn_pandas с conda через командную строку Windows. Пакет, по-видимому, является «частным» в репозитории conda (по общему признанию, вполне может быть, почему я не могу его установить, но я предпочитаю спросить...
3013 просмотров
schedule
05.08.2023
Как я могу использовать кодировщик меток sklearn и напрямую обращаться к моему кадру данных
У меня есть кадр данных, и я хочу использовать LabelEncoder непосредственно на нем.
Датафрейм:
df.select_dtypes('object').iloc[:,1:]
Gender Married x_y x_z
0 Male No 0 No
1 Male Yes 1 No
2 Male...
179 просмотров
schedule
28.05.2022
ValueError: количество функций модели должно соответствовать входным данным (sklearn)
Я пытаюсь запустить классификатор для некоторых данных обзора фильмов. Данные уже были разделены на reviews_train.txt и reviews_test.txt . Затем я загрузил данные и разделил их на просмотр и метку (либо положительную (0), либо отрицательную (1)),...
3297 просмотров
schedule
22.09.2022