Республиканец или демократ?

Предположим, вы хотите изучить модель прогнозирования следующих выборов в США, используя экономические и политические показатели вместо данных опросов.

Вы загружаете на Альфа+Омега файл excel или csv с вашими данными.

Для этого примера мы использовали данные из следующих источников.

Прежде всего, убедитесь, что в вашем файле есть столбец с названием, относящимся к тому, что вы ищете. Если вы ищете «партию-победительницу» на выборах 2020 года, вы должны загрузить файл со столбцом с названием «партия-победитель» (и соответствующие данные). Чтобы предсказание сработало, вам нужно искать результат в одной ячейке в столбце «выигравшая сторона».

Примечание. Мы хотим спрогнозировать результаты выборов на 2020 год. В загружаемом файле не должно быть ячеек/данных за 2020 год, потому что это именно то, что мы просим сделать у алгоритма: проверить данные за более ранние годы, чтобы предсказать 2020 год.

Остальные данные в строке нужно найти или оценить. Например, каким будет ВВП на душу населения в 2020 году.

Теперь у нас есть модель прогнозирования, и мы готовы прогнозировать, и, как вы видите, есть несколько вкладок, которые необходимо заполнить. В качестве «года» мы поставим 2020, но нам также нужны DGP на душу населения, наивысшее и минимальное одобрение. В случае, если у нас нет конкретных значений, нам нужно поставить оценку.

Как только у нас есть то, что нам нужно, чтобы предсказать победившую партию на 2020 год, мы нажимаем «Предсказать «выигрышную партию».

И победителем становится…

Вы получили свой результат, но..

Чтобы иметь надежную модель прогнозирования, вам необходимо иметь Excel/CSV с большим количеством данных, то есть не менее 100 строк с информацией. Почему? Представьте алгоритм предсказания рецепта в роли повара:

Когда вы даете хорошие ингредиенты (данные) повару (алгоритм рецепта предсказания A+Ω), чтобы приготовить вкусную еду (иметь хороший результат предсказания), обязательным условием является то, что повар приготовил много раз в жизни (это строки в вашем файле, то есть каждая строка — это когда-то приготовленная еда и насколько она была вкусной). Для каждого блюда нужны определенные ингредиенты, и, в конце концов, тот, кто попробует еду, сможет сказать, насколько она была вкусной. Теперь, если вы дадите двум поварам (два рецепта предсказания) и первый повар за свою жизнь приготовил 100 блюд, а второй только десять блюд, то представьте, кто с большей вероятностью приготовит лучшую еду?

Рецепт A+Ω, который можно предсказать даже с меньшим количеством данных, просто небезопасен. Журналисту нужно будет оценить результат.

В случае приведенного выше примера выборов американского президента в идеале нам нужны данные за 100 выборов (не 100 президентов), ВВП и наименьшее/наивысшее одобрение за последние 100 выборов (а не только за 100 лет).

Если бы у нас были вышеуказанные данные, результат прогноза был бы более надежным. Более того, моделирование данных очень важно. Структура столбцов должна содержать данные, которые взаимосвязаны и имеют отношение к тому, что мы хотим предсказать (команда Alpha+Omega может помочь вам с этой задачей).

Журналист, использующий рецепт прогноза, должен понимать, что если он хочет надежный прогноз, ему нужно иметь как можно больше данных. Но опять же, даже если журналист найдет данные и снова запустит рецепт, совсем не обязательно, что рецепт будет работать лучше. Странный? Нет! Это точно так же, как если бы журналист посвятил много времени расследованию и НЕ нашел нужных доказательств/результатов. Затем необходимо решить, следует ли искать дополнительные источники или остановиться. Если он/она решит поискать больше улик, он больше не уверен, что найдет что-нибудь. Но если он не будет искать дальше, то точно ничего не найдет.

То же самое и с рецептом предсказания!

Примечание. Эта статья была изменена 21 декабря 2020 г.