Введение

Наконец-то вышел Pokemon Go. Как и каждый 90-футовый ребенок (и как большой поклонник серии), я провел значительное количество времени, ловя наших любимых цифровых существ. Тем не менее, помимо того, что я тратил время автономной работы и проводил пальцем по экрану, как маньяк, я также потратил некоторое время (в основном во время зарядки телефона), записывая некоторые данные о внутриигровых событиях. Целью этого было статистическое рассмотрение закономерностей и поведения игры по мере продвижения игрока в игре.

В этом анализе я представлю с помощью нескольких изображений, таблиц и статистических моделей, как игра вознаграждает вас по мере повышения уровня, как увеличивается боевая мощь (CP) покемонов, а также интересные отношения нашли CP и очки жизни (HP) покемонов.

Примечание. Если вам нужно быстрое чтение и интересуют более сложные темы, я предлагаю начать или просто прочитать последний раздел под названием «Drowzees, Pidgeys, CP и HP».

Данные

В течение девяти дней — с 12 по 19 июля — я аннотировал в основном всех своих уловов покемонов и предметы, полученные с покестопов, всего 297 покемонов и 271 покестопов. посетил. Для тех из вас, кто не знаком с игрой, Pokestop — это внутриигровая локация, основанная на реальном месте, где игрок может получить случайное количество предметов. Например, Pokestop X может дать мне 3 случайных предмета, а Pokestop Y — 5.

Хочу отметить, что количество пойманных покемонов и посещенных покестопов меняется в течение дня, другими словами, вы увидите, что в некоторые дни у меня было больше активности, чем в другие. Это означает, что мои данные смещены в сторону нескольких дней.

Также в начале эксперимента мой уровень игрока был 9, а в конце 18.

Покемон

Первый раздел этого отчета посвящен 297 захваченным покемонам. В следующей таблице приведены сводные данные по уловам за день, наиболее частые пойманные покемоны и некоторые основные статистические данные о СР.

Как упоминалось во введении, игровое время сильно различается в течение девяти дней. 17-го числа, судя по всему, серверы были отключены, потому что у меня всего 5 пойманных покемонов. Однако на следующий день я вернулся к делу и получил в общей сложности 42 покемона.

13 июля было днем ​​наибольшей активности; всего было захвачено 57.
С другой стороны, 17 июля был печальным днем. Было поймано всего пять покемонов.

Теперь, когда я показал общее количество пойманных покемонов, я перейду к отображению того, сколько было поймано каждого вида.

Drowzee кажется самым распространенным (или одним из самых распространенных) покемонов в моем городе, потому что за эти дни я поймал в общей сложности 59, или 19,86%, если это по сравнению с остальными. За Drowzee следует 54 Pidgey (18,18%), а на третьей позиции Rattata с общим количеством захватов 41 (13,80%). ). На другой стороне спектра есть один Бидрил, Мрак, Голбат, Джигглипафф, Какуна, Нидоран ♂, Пиджеот, Псайдак, Шеллдер, Снорлакс и Волторб.

Давайте переключим наше внимание на боевую мощь (CP) захваченных покемонов.
Сводка данных, показанных ранее, показывает, что самый слабый покемон
имел CP 10, а самым сильным был могучий Снорлакс. с CP 878. Но какие значения находятся между самым слабым и самым сильным покемоном? Давайте взглянем.

Следующий график представляет собой коробчатую диаграмму CP. Самая важная деталь в этом заключается в том, что он показывает, что данные искажены вправо, а это означает, что большинство наблюдений находятся в нижней части данных. Точки вверху — это выбросы или покемоны, чей CP более чем в 1,5 раза превышает третий квартиль, что составляет 238,0.

На рисунке ниже показано подробное представление CP для каждого покемона с аннотациями самых высоких из них. Как показано на диаграмме и в сводке, мы видим, что большинство точек находятся ниже отметки 250.

Одной из моих целей в этом разделе было увидеть, есть ли значительное увеличение CP в последние дни. Итак, я взглянул на КП за девять дней и построил их несколькими способами.

Глядя на это, я не могу сказать многого, кроме двух основных выбросов: Snorlax CP 878 и Kingler CP 771.

На следующей гистограмме показано среднее значение CP за девять дней. Важной деталью этого графика является то, что он показывает, что в последние два дня наблюдается незначительное увеличение CP по сравнению с другими днями. Тем не менее, я не могу подтвердить, что это связано с моим прогрессом в качестве игрока или просто с чистой удачей, потому что данные ограничены, а также потому, что в последний день я поймал Kingler CP 771, который мог быть ответственным за искажение данных.

Бонусные графики: боевая мощь всех захваченных покемонов и стандартное отклонение (в дополнение к графику средней полосы) CP, сгруппированные по дням.

Предметы

Отойдя от темы покемонов, в этом разделе я сосредоточусь
на теме предметов. Как упоминалось в начале, за девять дней эксперимента я набрал 271 покестоп, что привело к значительному количеству предметов — эта часть как раз об этих предметах. Каково общее количество предметов? Как они менялись со временем? Как они распределяются? Это мои основные вопросы.

Общее количество предметов, полученных через Pokestop, составило 886, в среднем 3,27 предметов на Pokestop. В следующей таблице я представлю частоту этих предметов, их процентное содержание и некоторые основные свойства набора данных, касающиеся количества предметов, присуждаемых на каждом Pokestop.

Согласно данным, представленным в предыдущей таблице, Poke Balls были наиболее распространенным предметом, полученным на Pokestops, с итоговым счетчиком 546 или 61,62%, в среднем 2 за остановку, в среднем 2,02. , и максимум 5, что означает, что с одного Pokestop выпало 5 Poke Balls. С другой стороны, Hyper Potion был наименее распространенным предметом; только 7 из них были приобретены (0,79%). Особенностью этих данных является тот факт, что медиана всех элементов, кроме Poke Ball, была равна 0. Это показано на двухблочном графике ниже; на графике Poke Ball мы можем ясно видеть жирную линию, которая указывает медиану, однако вторая показывает, что данные сильно смещены вправо.

Одна конкретная деталь, которую я хотел исследовать, заключалась в уменьшении количества
зелий, приобретаемых в результате повышения уровня, потому что я предполагал, что это число будет уменьшаться по мере разблокировки новых предметов (супер- и гиперзелье). .

Приведенная выше таблица и график показали, что «каким-то образом» мое предположение оказалось верным, потому что после первого дня (за исключением третьего) процент зелий уменьшился, а количество супер- и гиперзелий увеличено. Однако я бы не назвал это окончательным выводом из-за небольшой выборки данных.

Последняя визуализация, касающаяся темы предметов, представляет общее количество предметов, полученных за девять дней.

Дроузи, Пиджи, CP и HP

В Pokemon Go чем выше боевая мощь (CP) покемона, тем выше очки жизни (HP) — это основное наблюдение можно заметить уже в первые минуты игры. Несмотря на то, что я знал это, я хотел увидеть, как именно это работает, поэтому я провел (простую) линейную регрессию, чтобы изучить это поведение, используя CP и HP двух моих самых распространенных покемонов: Drowzee и Pidgey.

С точки зрения непрофессионала, простая линейная регрессия — это статистический подход к моделированию взаимосвязи между зависимой переменной и одной или несколькими независимыми переменными путем подгонки линейного уравнения, которое оценивается на основе данных.

Это уравнение линии линейной регрессии:

Y=a+bX

Где Y — зависимая переменная (то, что мы хотим предсказать), в нашем случае это HP, Xявляется независимой или объясняющей переменной, CP, aявляется точкой пересечения с осью y, а bявляется склон.

Прежде чем продолжить регрессии, я хотел бы заявить, что наблюдаемая корреляция Пирсона между CP и HP для Drowzee составляет 0,974654, а для Pidgey — 0,9796001, почти идеальная положительная корреляция.

Для получения дополнительной информации о линейной регрессии я предлагаю следующую ссылку, а что касается корреляций, эта страница предлагает быстрое и легкое объяснение.

Теперь я представлю результат линейной регрессии для Drowzee.

В верхней части сводки линейной регрессии (таблица выше) указаны остатки. Остатки — это разница между реальным значением переменной и прогнозируемым значением прогноза. Остатки для этой модели хорошие, среднее значение практически равно нулю (-3,688163e-16), стандартное отклонение равно 3,89, а график их плотности формирует нормальное распределение.

Еще одна метрика, показывающая хорошее соответствие, — это p-значение переменной CP. Поскольку p-значения немного сложно понять, и они выходят за рамки этого отчета, просто поверьте мне, когда я говорю, что в этом случае чем меньше число, тем лучше, и в этом конкретном случае p- значение

2e−16

что является действительно небольшим числом.

Последней метрикой, которую я буду использовать для анализа качества модели, является R-квадрат или статистика коэффициента детерминации. Как и p-значение, это значение также сложно понять, поэтому еще раз, пожалуйста, потерпите меня, когда я скажу, что чем ближе оно к 1 (не во всех случаях!), тем оно лучше. В этом случае показатель R-квадрат равен 0,95.

Как насчет перехвата и наклона? Точка пересечения по оси Y составляет 17,70, а наклон 0,12. Таким образом, уравнение линии регрессии имеет вид:

Y = 17.70 + 0.12 * X

Это выглядит так:

Но что это значит и как это влияет на игру?

Это означает, что HP покемона увеличивается вместе с CP, то есть HP пропорционально CP.

Теперь тот же процесс для Pidgey.

С первого взгляда я увидел, что эта модель так же эффективна и похожа на предыдущую. Остатки приемлемые (среднее значение близко к нулю; 1,746848e-16) и стандартное отклонение 2,30. Значение p также действительно близко к нулю, а показатель R-квадрата составляет 0,96.

Уравнение линии регрессии:

Y = 12.04 + 0.14 * X

Вывод

В этом отчете я представил результаты эксперимента, проведенного с использованием персональных данных, собранных в Pokemon Go в течение девяти дней. Анализ начался с обзора лучших покемонов в моем районе, Drowzee и Pidgey, эволюции боевой мощи с течением времени и нескольких статистических данных об этом.

Второй обсуждаемой темой были предметы и то, как они распределяются.

Для последней темы я представил две линейные регрессии для изучения взаимосвязи между боевой мощью и хитпойнтами покемонов. Результаты были вполне удовлетворительными и показали, что между обеими характеристиками действительно существует корреляция и линейная зависимость. Таким образом, я пришел к выводу, что показатель очков жизни пропорционален боевой мощи.

Этот эксперимент был проведен с использованием R. Исходный код и данные доступны на моем Github.

Это все на данный момент! Если у вас есть какие-либо предложения, идеи или дополнительные данные, которыми вы хотели бы
поделиться, сделайте это. Кроме того, если вы обнаружите опечатку или ошибку в анализе, не стесняйтесь сообщить мне об этом.

Спасибо за чтение.