Вопросы по теме 'binning'
сколько бинов с учетом некоторых данных
Мне нужно построить некоторые данные, используя гистограммы. Мои данные находятся между [0,1], без больших концентраций в какой-либо конкретной точке.
Каково хорошее соотношение между количеством выборок и количеством ячеек (одинаковой длины)?
603 просмотров
schedule
28.06.2022
Бинирование списка в python
Прежде всего, я хотел бы сказать, что я новичок в python, и этот код был создан с учетом советов и предложений пользователей на stackoverflow. Код показан ниже:
f = open('E:\Python27\WASP DATA\Sample Data.txt',"r")
num=0
line = f.readlines()
X =...
4527 просмотров
schedule
19.02.2023
Доступно ли объединение в стиле cut () в dplyr?
Есть ли способ сделать что-то вроде функции cut() для объединения числовых значений в dplyr таблицу? Я работаю над большой таблицей postgres и в настоящее время могу либо написать оператор case в sql с самого начала, либо вывести неагрегированные...
20862 просмотров
schedule
26.01.2023
Создание гистограммы со средними значениями биннинга
Я делаю две гистограммы, используя скользящие средние и биннинг. Я получил скользящее среднее из 18 тыс. точек данных, большинство из которых имеют 0 значений, используя Excel.
Это то, что я хотел сделать с помощью R
"Скользящая средняя"
Я...
1082 просмотров
schedule
01.09.2022
Сгруппируйте/бин/базовые данные в R и получите количество значений на ведро и сумму значений на ведро
Я хочу ведро/группу/бин данные:
C1 C2 C3
49488.01172 0.0512 54000
268221.1563 0.0128 34399
34775.96094 0.0128 54444
13046.98047 0.07241 61000
2121699.75 0.00453 78921
71155.09375 0.0181 13794...
32298 просмотров
schedule
25.03.2023
Поиск всех возможных комбинаций корзин
У меня есть 100 000 наблюдений с переменной age в диапазоне 18-80. Я хочу найти X корзины на основе переменной age . Диапазоны бинов не должны перекрываться и вместе должны охватывать весь интервал. Например, с X = 4 возможной комбинацией...
290 просмотров
schedule
26.10.2022
Как сделать логарифмический биннинг на гистограмме?
Я ищу метод логарифмического бинирования некоторых наборов данных. У нас есть данные со значениями в диапазоне от _min до _max (число с плавающей запятой >= 0), и пользователь должен иметь возможность указать различное количество ячеек...
1886 просмотров
schedule
20.10.2022
Получите 2D-таблицу (6x6) для кадра данных, содержащего две непрерывные переменные, путем объединения
Я пытаюсь разделить наблюдения во фрейме данных на 36 групп на основе двух непрерывных переменных. Точнее говоря, я пытаюсь разбить каждую из двух переменных на шесть групп, а затем сгруппировать наблюдения в одну из 36 различных возможных групп....
42 просмотров
schedule
14.11.2022
используя Spark: объединение столбца 1 и поиск среднего значения столбца 2 на основе ячеек столбца 1
Я изучаю apache spark и язык scala. Так что помогите, пожалуйста. Я получаю 3 столбца ( c1 , c2 и c3 ) от запроса cassandra и получаю его в кадре данных в коде scala. Я должен bin(размер ячейки = 3) (статистика, как на гистограмме) c1 и...
554 просмотров
schedule
06.08.2023
r бин равные децили
У меня есть набор данных, содержащий более 6000 наблюдений, каждая запись имеет оценку от 0 до 100. Ниже приведен образец:
+-----+-------+
| uID | score |
+-----+-------+
| 1 | 77 |
| 2 | 61 |
| 3 | 74 |
| 4 | 47 |
| 5 |...
6208 просмотров
schedule
15.08.2022
Нерегулярный биннинг p2 python pandas
У меня есть один небольшой дополнительный вопрос о биннинге в python pandas.
У меня есть кадр данных, подобный следующему:
df =
variable test_score
-1 52.0
1 53.0
4 54.0
6 64.0
6 64.0...
182 просмотров
schedule
16.11.2022
Как использовать метод биннинга для определения входящей точки, к какому бину принадлежит?
У меня есть небольшой запрос. У меня есть два набора данных. Например, в одном наборе данных я выполнил биннинг и рассчитал среднее значение и стандартное значение вместе с групповым биннингом. Теперь у меня есть вторые наборы данных с теми же...
58 просмотров
schedule
28.07.2023
Биннинг, а затем объединение бинов с минимальным количеством наблюдений?
Допустим, я создаю некоторые данные, а затем создаю ячейки разных размеров:
from __future__ import division
x = np.random.rand(1,20)
new, = np.digitize(x,np.arange(1,x.shape[1]+1)/100)
new_series = pd.Series(new)
print(new_series.value_counts())...
786 просмотров
schedule
02.06.2023
Объединение равной ширины и равной глубины с использованием scipy
Я привел несколько примеров биннинга с равным средним значением, используя scipy , но мне интересно, можно ли использовать библиотеку для биннинга с равной шириной или глубиной.
На самом деле я нормально использую другие библиотеки, не только...
1741 просмотров
schedule
08.06.2023
Автоматически собирать длинный список чисел в Excel?
Извините, я искал справедливо немного и нигде не нашел. У меня есть столбец значений от 0 вверх (например, 0, 0,1, 0,3, 0,456, 0,9, 1,34, 2,76,3 и т. д.) в excel, и я хочу искать столбец и автоматически выбирать и выполнять операции со всеми...
2380 просмотров
schedule
29.05.2022
Почасовая и месячная диаграмма для данных о глубине в R
Я пытаюсь сделать диаграммы на глубине движения 3 рыб. Один из графиков я хочу, чтобы он был почасовым, с осью X, идущей от 0 до 25 часов, а другой - как месячный. Как мне делать почасовые или месячные интервалы глубины, чтобы затем делать...
327 просмотров
schedule
27.03.2023
После объединения столбца фрейма данных, как создать новый фрейм данных для подсчета количества элементов в каждом бине?
Скажем, у меня есть кадр данных, df :
>>> df
Age Score
19 1
20 2
24 3
19 2
24 3
24 1
24 3
20 1
19 1
20 3
22 2
22 1
Я хочу создать новый фрейм данных, который содержит Age и...
747 просмотров
schedule
03.08.2023
При использовании вырезания в фрейме данных pandas для его бинирования, почему биннинг не выполняется должным образом?
У меня есть кадр данных, который я хочу разбить (т.е. сгруппировать в поддиапазоны) по одному столбцу и взять среднее значение второго столбца для каждого из ящиков:
import pandas as pd
import numpy as np
data = pd.DataFrame(columns=['Score',...
449 просмотров
schedule
15.06.2022
Биннинг данных и вычисление MAE для каждого бункера в Python
У меня есть два массива:
Obs=([])
abs_error=([])
Я хочу использовать Obs для определения бункеров. Например, где Obs от 1 до 2, bin abs_error в bin # 1. Затем, где Obs равно от 2 до 3, bin abs_error в bin # 2. и Т. Д.
После того, как у...
278 просмотров
schedule
13.07.2023
Proc hpbin с минимальной долей на бин
Я использую Proc HPBIN для разделения своих данных на равные сегменты, т. е. каждый сегмент имеет равную долю общего диапазона переменной.
Моя проблема заключается в том, что у меня очень искаженные данные с большим диапазоном. Почти все мои...
644 просмотров
schedule
06.01.2023