Вопросы по теме 'binning'

сколько бинов с учетом некоторых данных
Мне нужно построить некоторые данные, используя гистограммы. Мои данные находятся между [0,1], без больших концентраций в какой-либо конкретной точке. Каково хорошее соотношение между количеством выборок и количеством ячеек (одинаковой длины)?
603 просмотров
schedule 28.06.2022

Бинирование списка в python
Прежде всего, я хотел бы сказать, что я новичок в python, и этот код был создан с учетом советов и предложений пользователей на stackoverflow. Код показан ниже: f = open('E:\Python27\WASP DATA\Sample Data.txt',"r") num=0 line = f.readlines() X =...
4527 просмотров
schedule 19.02.2023

Доступно ли объединение в стиле cut () в dplyr?
Есть ли способ сделать что-то вроде функции cut() для объединения числовых значений в dplyr таблицу? Я работаю над большой таблицей postgres и в настоящее время могу либо написать оператор case в sql с самого начала, либо вывести неагрегированные...
20862 просмотров
schedule 26.01.2023

Создание гистограммы со средними значениями биннинга
Я делаю две гистограммы, используя скользящие средние и биннинг. Я получил скользящее среднее из 18 тыс. точек данных, большинство из которых имеют 0 значений, используя Excel. Это то, что я хотел сделать с помощью R "Скользящая средняя" Я...
1082 просмотров
schedule 01.09.2022

Сгруппируйте/бин/базовые данные в R и получите количество значений на ведро и сумму значений на ведро
Я хочу ведро/группу/бин данные: C1 C2 C3 49488.01172 0.0512 54000 268221.1563 0.0128 34399 34775.96094 0.0128 54444 13046.98047 0.07241 61000 2121699.75 0.00453 78921 71155.09375 0.0181 13794...
32298 просмотров
schedule 25.03.2023

Поиск всех возможных комбинаций корзин
У меня есть 100 000 наблюдений с переменной age в диапазоне 18-80. Я хочу найти X корзины на основе переменной age . Диапазоны бинов не должны перекрываться и вместе должны охватывать весь интервал. Например, с X = 4 возможной комбинацией...
290 просмотров
schedule 26.10.2022

Как сделать логарифмический биннинг на гистограмме?
Я ищу метод логарифмического бинирования некоторых наборов данных. У нас есть данные со значениями в диапазоне от _min до _max (число с плавающей запятой >= 0), и пользователь должен иметь возможность указать различное количество ячеек...
1886 просмотров
schedule 20.10.2022

Получите 2D-таблицу (6x6) для кадра данных, содержащего две непрерывные переменные, путем объединения
Я пытаюсь разделить наблюдения во фрейме данных на 36 групп на основе двух непрерывных переменных. Точнее говоря, я пытаюсь разбить каждую из двух переменных на шесть групп, а затем сгруппировать наблюдения в одну из 36 различных возможных групп....
42 просмотров
schedule 14.11.2022

используя Spark: объединение столбца 1 и поиск среднего значения столбца 2 на основе ячеек столбца 1
Я изучаю apache spark и язык scala. Так что помогите, пожалуйста. Я получаю 3 столбца ( c1 , c2 и c3 ) от запроса cassandra и получаю его в кадре данных в коде scala. Я должен bin(размер ячейки = 3) (статистика, как на гистограмме) c1 и...
554 просмотров
schedule 06.08.2023

r бин равные децили
У меня есть набор данных, содержащий более 6000 наблюдений, каждая запись имеет оценку от 0 до 100. Ниже приведен образец: +-----+-------+ | uID | score | +-----+-------+ | 1 | 77 | | 2 | 61 | | 3 | 74 | | 4 | 47 | | 5 |...
6208 просмотров
schedule 15.08.2022

Нерегулярный биннинг p2 python pandas
У меня есть один небольшой дополнительный вопрос о биннинге в python pandas. У меня есть кадр данных, подобный следующему: df = variable test_score -1 52.0 1 53.0 4 54.0 6 64.0 6 64.0...
182 просмотров

Как использовать метод биннинга для определения входящей точки, к какому бину принадлежит?
У меня есть небольшой запрос. У меня есть два набора данных. Например, в одном наборе данных я выполнил биннинг и рассчитал среднее значение и стандартное значение вместе с групповым биннингом. Теперь у меня есть вторые наборы данных с теми же...
58 просмотров
schedule 28.07.2023

Биннинг, а затем объединение бинов с минимальным количеством наблюдений?
Допустим, я создаю некоторые данные, а затем создаю ячейки разных размеров: from __future__ import division x = np.random.rand(1,20) new, = np.digitize(x,np.arange(1,x.shape[1]+1)/100) new_series = pd.Series(new) print(new_series.value_counts())...
786 просмотров
schedule 02.06.2023

Объединение равной ширины и равной глубины с использованием scipy
Я привел несколько примеров биннинга с равным средним значением, используя scipy , но мне интересно, можно ли использовать библиотеку для биннинга с равной шириной или глубиной. На самом деле я нормально использую другие библиотеки, не только...
1741 просмотров
schedule 08.06.2023

Автоматически собирать длинный список чисел в Excel?
Извините, я искал справедливо немного и нигде не нашел. У меня есть столбец значений от 0 вверх (например, 0, 0,1, 0,3, 0,456, 0,9, 1,34, 2,76,3 и т. д.) в excel, и я хочу искать столбец и автоматически выбирать и выполнять операции со всеми...
2380 просмотров
schedule 29.05.2022

Почасовая и месячная диаграмма для данных о глубине в R
Я пытаюсь сделать диаграммы на глубине движения 3 рыб. Один из графиков я хочу, чтобы он был почасовым, с осью X, идущей от 0 до 25 часов, а другой - как месячный. Как мне делать почасовые или месячные интервалы глубины, чтобы затем делать...
327 просмотров
schedule 27.03.2023

После объединения столбца фрейма данных, как создать новый фрейм данных для подсчета количества элементов в каждом бине?
Скажем, у меня есть кадр данных, df : >>> df Age Score 19 1 20 2 24 3 19 2 24 3 24 1 24 3 20 1 19 1 20 3 22 2 22 1 Я хочу создать новый фрейм данных, который содержит Age и...
747 просмотров
schedule 03.08.2023

При использовании вырезания в фрейме данных pandas для его бинирования, почему биннинг не выполняется должным образом?
У меня есть кадр данных, который я хочу разбить (т.е. сгруппировать в поддиапазоны) по одному столбцу и взять среднее значение второго столбца для каждого из ящиков: import pandas as pd import numpy as np data = pd.DataFrame(columns=['Score',...
449 просмотров
schedule 15.06.2022

Биннинг данных и вычисление MAE для каждого бункера в Python
У меня есть два массива: Obs=([]) abs_error=([]) Я хочу использовать Obs для определения бункеров. Например, где Obs от 1 до 2, bin abs_error в bin # 1. Затем, где Obs равно от 2 до 3, bin abs_error в bin # 2. и Т. Д. После того, как у...
278 просмотров
schedule 13.07.2023

Proc hpbin с минимальной долей на бин
Я использую Proc HPBIN для разделения своих данных на равные сегменты, т. е. каждый сегмент имеет равную долю общего диапазона переменной. Моя проблема заключается в том, что у меня очень искаженные данные с большим диапазоном. Почти все мои...
644 просмотров
schedule 06.01.2023