Публикации по теме 'resampling'


Повторная выборка Bootstrap
Начальная загрузка Bootstrap — чрезвычайно мощный статистический инструмент, который можно использовать в тех случаях, когда доступных данных гораздо меньше. Другими словами, оценка различных statistic сомнительна из-за низкого уровня данных. Элегантность Bootstrap проявляется в том, что его можно легко применить к различным методам статистического обучения, таким как подбор линейной регрессии. Каждый набор данных начальной загрузки содержит n наблюдений, отобранных с заменой..

Вопросы по теме 'resampling'

повторная выборка серии точек
у меня есть массив точек в 3D (представьте себе траекторию мяча) с X выборками. теперь я хочу передискретизировать эти точки, чтобы у меня был новый массив с позициями с выборками y. y может быть больше или меньше x, но не меньше 1. Всегда будет...
1320 просмотров
schedule 23.09.2022

Самая быстрая и эффективная процедура повышения частоты дискретизации для аудио в Java
Мне нужно преобразовать аудиосэмплы из 11025 и 22050 в 44100; Я ищу самую быструю и лучшую процедуру преобразования звука. Я требую, чтобы ответ был дан на чистой Java, без необходимости использования внешних процедур или библиотек. Источник...
1726 просмотров

HTML5 Canvas: есть ли способ изменить размер изображения с помощью повторной выборки ближайшего соседа?
У меня есть JS, который манипулирует изображениями. Я хочу иметь пиксельную графику, поэтому мне пришлось увеличивать исходные изображения в графическом редакторе. Но я думаю, что было бы неплохо проделать все манипуляции с маленьким изображением, а...
10011 просмотров
schedule 23.10.2022

Использование повторной выборки для выравнивания нескольких временных рядов в pandas
Вот код установки: import pandas from datetime import datetime a_values = [1728, 1635, 1733] a_index = [datetime(2011, 10, 31), datetime(2012, 1, 31), datetime(2012, 4, 30)] a = pandas.Series(data=a_values, index=a_index) aa_values = [6419,...
5263 просмотров
schedule 04.05.2023

Случайная подвыборка в R
Я новичок в R, поэтому мой вопрос может быть очень простым. У меня есть 40 участков с обилием зоопланктона. Мои данные выглядят так (столбцы — численность видов, а строки — сайты) 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0...
13335 просмотров
schedule 12.02.2023

Как создать растровый кирпич с растрами разной степени?
Я новичок в R , поэтому это очень простой вопрос, но я боролся с ним и не мог найти решение, которое сработало. Я хочу создать растровый кирпич из нескольких изображений Landsat той же области. Они были загружены в формате HDF-EOS , и я...
13290 просмотров
schedule 03.09.2022

Коэффициенты повторной выборки слишком велики
У меня есть большой вектор записанных данных, которые мне нужно передискретизировать. Проблема, с которой я сталкиваюсь, заключается в том, что при использовании resample я получаю следующую ошибку: ??? Ошибка при использовании ==> upfirdn...
1354 просмотров
schedule 01.12.2022

Просмотр выбранного образца для каждой репликации в цикле начальной загрузки
Предположим, следующая простая процедура начальной загрузки: x <- c(20,54,18,65,87,49,45,94,22,15,16,15,84,55,44,13,16,65,48,98,74,56,97,11,25,43,32,74,45,19,56,874,3,56,89,12,28,71,93) n <- length(x) nBoot <- 5; mn <-...
65 просмотров

Pandas df.resample (): укажите порог NaN для расчета среднего
Я хочу передискретизировать кадр данных pandas с почасовой на годовую/ежедневную частоту с помощью метода how=mean . Однако, конечно, некоторые почасовые данные отсутствуют в течение года. Как я могу установить порог для отношения разрешенных NaN...
1790 просмотров
schedule 22.05.2022

Как объяснить замену передискретизации чрезвычайно хорошими и идеальными результатами?
У меня чрезвычайно несбалансированные данные (100: 1), где 1 часть - это мой заинтересованный (меньшинство) класс. Я слышал о передискретизации (среди других методов) как о способе «обработки» несбалансированных данных. Итак, что я сделал, так это...
140 просмотров

Как применить повторную выборку и группировку одновременно с Pandas?
Моя цель - добавить строки в pandas, чтобы заменить отсутствующие данные предыдущими данными и одновременно выполнить повторную выборку дат. Мои данные содержат разные идентификаторы продуктов, и я должен каждый раз выполнять groupBy, потому что я...
164 просмотров

Свинья: как передискретизировать данные временных рядов?
У меня есть очень большой набор данных, который я обрабатываю с помощью Pig . Данные содержат timestamp (до второй частоты), и я хотел бы агрегировать свои данные с минутной частотой (подсчитывая, сколько наблюдений за минуту, усредняя другие...
65 просмотров
schedule 11.03.2024

Как создать цикл для повторения процедуры случайной выборки в R
Я написал код на R для выборки без замены из 3 отдельных векторов (list1, list2, list3). Я отбираю 10 раз из списка 1, 20 раз из списка 2 и 30 раз из списка 3. Затем я объединяю 3 списка случайных выборок и проверяю, сколько раз я выбирал одну и ту...
3239 просмотров
schedule 18.04.2022

Pandas — повторная выборка минутного интервала нерегуляризованных данных за 3-часовой интервал и замена отсутствующих данных данными за определенный период времени.
У меня есть нерегулируемые данные с интервалом в одну минуту, например: Date Vel Dir 14-11-2001 17:55:00 14.1 35 14-11-2001 17:56:00 10.4 52 14-11-2001 17:57:00 14.8 19 14-11-2001 18:04:00 11.4 54 14-11-2001 18:05:00...
757 просмотров
schedule 26.02.2023

Передискретизация с заменой на кластер
Я хочу нарисовать кластеры (определяемые переменной id ) с заменой из набора данных, и, в отличие от ранее отвеченных вопросов, я хочу, чтобы кластеры, которые выбираются K раз, повторяли каждое наблюдение K раз. То есть я выполняю загрузку...
255 просмотров
schedule 30.04.2022

Выборка из столбцов ys, сложенных по значениям x в R (предоставляется визуальное представление)
Фон У меня есть две переменные с именами x и y (см. код R под картинкой). Когда я plot(x, y) , я получаю график верхней строки (см. ниже). y значения располагаются поверх каждого x значения. Вопрос Мне интересно, ПОЧЕМУ, когда я...
36 просмотров
schedule 26.10.2022

Повышение частоты дискретизации даты и времени — ValueError: невозможно переиндексировать неуникальный индекс с помощью метода или ограничения
Я получаю сообщение об ошибке ниже, когда пытаюсь увеличить частоту дискретизации... import pandas as pd from datetime import date df1=pd.read_csv("C:/Codes/test.csv") df1['Date'] = pd.to_datetime(df1['Date']) df1 = df1.set_index(['Date']) df2 =...
2330 просмотров
schedule 28.06.2022

повторная выборка данных на основе определенной переменной
У меня есть большой набор данных, как показано ниже. Из данных я хочу случайным образом выполнить выборку на основе идентификатора. Поскольку данные имеют 5 идентификаторов, я хотел бы выбрать 5 идентификаторов с заменой и создать новый набор данных...
59 просмотров
schedule 01.08.2022

Ресэмплинг Panda - Get Mean for a freq. Промежуток времени
У меня есть df с отметкой времени как INDEX ( dtype='datetime64[ns] ) и соответствующими значениями для 1Y : values Timestamp 2014-01-01 00:00:00 20.155100 2014-01-01 00:15:00 7.586481 2014-01-01 00:30:00 73.115602...
29 просмотров
schedule 12.11.2022

Повторная выборка временных рядов Pandas, чтобы дата указывала 1-е число каждого месяца
У меня есть временной ряд Pandas, где Date указывает последний день каждого месяца. Я хотел бы изменить его так, чтобы он содержал первый день каждого месяца. Например, вместо «2018-08-31» будет «2018-08-01» и так далее для всех дат. С этой целью...
47 просмотров
schedule 24.05.2024