Статистика: оценка средневзвешенной температуры населения США на основе более 100 ежедневных измерений на станциях в аэропортах.

Недавно я подписался на получение ключа разработчика для Census API (http://www.census.gov/developers/) и будет использовать класс-оболочку Python для доступа к базе данных Census.

У меня также есть доступ к потоку данных о среднесуточной температуре и прогнозах от более чем 100 станций аэропортов, разбросанных по всей территории США (эти станции в значительной степени репрезентативны для населения США, поскольку они расположены в крупных городах). С минимальными предположениями, как лучше всего нанести на карту все население Соединенных Штатов на набор из более чем 100 аэропортов, чтобы я мог получить средневзвешенную температуру населения? Это, вероятно, повлечет за собой какую-то функцию расстояния/климата. Какие нюансы следует учитывать при этом?


person jenny    schedule 12.08.2014    source источник
comment
Этот вопрос не относится к теме StackOverflow, поскольку сам по себе он не является конкретным вопросом программирования. Это больше вопрос алгоритма. После того, как вы определили свой алгоритм, если вы застряли на его реализации в Python, тогда этот вопрос будет уместен для StackOverflow.   -  person Cory Kramer    schedule 12.08.2014
comment
Должен ли я опубликовать это в переполнении математического стека?   -  person jenny    schedule 12.08.2014
comment
Я бы сказал, вероятно, Программисты StackExchange   -  person Cory Kramer    schedule 12.08.2014


Ответы (1)


(1) Похоже, вам нужно что-то похожее на тесселяцию Вороного, но вместо этого построенную на регионах с почтовым индексом непрерывного пространства. По сути, вам нужно назначить каждый регион с почтовым индексом «ближайшему» аэропорту, а затем взвесить наблюдения аэропорта по доле населения во всех близлежащих почтовых индексах. (Я предполагаю, что данные переписи организованы по почтовым индексам.) Я говорю «ближайший» в кавычках, потому что это можно рассматривать по-разному; например расстояние до географического центра региона, расстояние до населенного пункта региона, время в пути от центра до аэропорта и, возможно, другие. Вероятно, вы можете использовать алгоритм грубой силы для присвоения почтовых индексов аэропортам: просто просмотрите все почтовые индексы и найдите аэропорт, который является «ближайшим» в выбранном вами смысле. Это может быть медленно, но вам нужно сделать это только один раз (ну, один раз для каждого определения «ближайшего»).

(2) Вы можете получить больше откликов на этот вопрос на CrossValidated.

person Robert Dodier    schedule 12.08.2014
comment
Спасибо, я опубликую свой вопрос, чтобы получить больше информации. Спасибо, что нашли время ответить на мой вопрос. - person jenny; 13.08.2014