Открытие основных мотивов в данных о новом коронавирусе (2019-nCov) из карантина 1.0 в Индии.

Премьер-министр Индии Нарендра Моди объявил о продлении общенационального карантина до 3 мая для борьбы с распространением нового коронавируса. Премьер-министр в своем обращении к Индии во вторник начал с похвалы усилиям индийцев в борьбе с новым коронавирусом. COVID-19 распространяется быстро, но Индия активно борется с коронавирусом.

Индия сообщила о 10 815 подтвержденных случаях заболевания по состоянию на последний день блокировки 1.0, при этом 353 случая смерти и тенденции, свидетельствующие о высоком приросте за последние несколько дней.

«Мы ввели 21-дневную изоляцию, когда у нас было 550 случаев, и Индия получила огромную выгоду от 21-дневной блокировки в борьбе с пандемией и добавила, что страна лучше справилась с ситуацией с ограниченными ресурсами». : Премьер-министр Нарендра Моди

Так, 95% от общего числа случаев зарегистрировано во время общенационального карантина с частотой ~ 600–800 новых случаев в день из 32 из 36 штатов Индии и союзной территории Индии. Все эти цифры и тенденции не объясняют гипотезу о том, что «Индия получила огромную выгоду от 21-дневки».

Вспышка COVID-19 началась поздно в Индии, и скорость распространения пока намного ниже, чем во многих развитых странах на том же этапе. Индия заявляет о строгом контроле над распространением вируса с ограниченными ресурсами по сравнению с другими развитыми странами.

Индия отличается от любой развитой страны с точки зрения населения, медицинских учреждений, разнообразия и самой большой ежедневной заработной платы по всей стране. Таким образом, сравнение может быть неправильным подходом, поэтому я буду придерживаться данных о nCov в Индии и найду положительный взгляд на них со дня первого случая до настоящего времени.

Кривая траектории общего числа случаев заболевания и смертей не дает никаких оснований гарантировать, что Индия войдет в безопасную зону. Ежедневное количество сюжетов дает представление о том, что происходит. Но что на самом деле мы хотим узнать из этого пояснительного аналитического отчета: Распространяется ли вирус быстрее и в Индии? Замедляется ли прогрессирование вспышки с возрастом? что происходит на уровне штатов, есть ли сходство между разными штатами?

С самого начала вспышки коронавируса я слежу за глобальным и индийским COVID-19 и всегда стараюсь увидеть мотивационную сторону данных. В математическом выражении вторая производная суточного номера траектории, представленная нам СМИ и экспертом. Опыт анализа данных, оптимистичный настрой и поиск чего-то мотивирующего в источнике паники помогают мне подходить к данным с другой точки зрения и разрабатывать гипотезу из заявления премьер-министра «Действительно ли Индия получила огромные выгоды от 21-го день самоизоляции». Чтобы ответить на этот вопрос, мы рассмотрим следующую серию из трех вопросов:

1. Является ли скорость распространения вируса экспоненциальной для Индии?

Одно слово становится популярным после того, как сам COVID-19 стал экспоненциальным, и в начале этой пандемии было опубликовано много статей, объясняющих этот термин. Якобы выглядящая экспоненциальная кривая на самом деле является экспоненциальной? Чтобы понять это, существует простой статистический подход, который заключается в понимании схемы распределения набора данных. Следуя правильной математической формуле и подходу к анализу данных, мы сможем понять наилучшее соответствие распределения и определить, является ли оно экспоненциальным или чем-то еще. Здесь мы имеем дело с временными рядами, и каждое изменение значения будет зависеть от независимой переменной время.

Математическое уравнение для представления событий временного ряда.

у = функция (время) + ошибка

Новый случай = Всего случаев (t) — Всего случаев (t-1)

Давайте найдем лучшие математические функции для оценки общего числа подтвержденных случаев(y). Я составляю уравнение и наношу три основных метода распределения: линейный, логистический и экспоненциальный, чтобы увидеть, какой из них больше всего соответствует фактическому общему количеству подтвержденных случаев nCov в Индии.

Фактический общий подтвержденный случай не совсем соответствует экспоненциальному росту и его хорошему показателю. Судя по текущим данным, Индии не угрожает экспоненциальная угроза. График построен на основе следующих статистических допущений и уравнений.

  • Линейное уравнение: f(x) = a + bx ; b: изменение скорости между t и t-1, сохраняющее максимальное количество новых случаев за один день за все время в Индии, набор данных covid-19 ~ 1400
  • Логистическое уравнение:f(x) = c/1+e^(-x-b)/a ; a:скорость заражения, b:максимальное количество случаев заражения в день '21', c:приблизительное общее число на конец '30k '
  • Экспоненциальное уравнение:f(x) = a + b**x ; b:максимальная скорость изменения общего числа подтвержденных случаев до настоящего времени за один день.

Помните, что экспоненциальная скорость действительно выглядит мило в начале вспышки. Но для данных Индии это было более ~ 70 дней с момента первого случая, и Индия по-прежнему поддерживает более низкий уровень заражения, чем экспоненциальный. Мы можем быть более конкретными, используя статистический подход, такой как тест соответствия хи-квадрат, чтобы проверить, какой тип распределения подходит больше всего. Я сравнил несколько общих алгоритмов распределения и вот результат.

Данные больше всего соответствуют распределению Пирсона3, но недалеко от экспоненциального. Если Индия продолжит соответствовать этому распределению, мы можем ожидать внезапного снижения числа ежедневно регистрируемых случаев очень скоро, как показано на графике ниже.

2. Поддерживает ли коронавирус разнообразие Индии?

Индия с населением более 1,3 миллиарда человек, 28 штатами, 8 союзными территориями и тысячами округов является страной «Единства в разнообразии». География, архитектура, культура, еда и обычаи Индии различаются от места к месту внутри страны. Демонстрирует ли распространение COVID-19 разнообразие в Индии?

day_of_case: день с первого случая для каждого штата. Нажмите на ссылку, чтобы поиграть с живой визуализацией из основного источника.

Первый случай в Индии был зарегистрирован в Керале около 70 дней назад, и они активно контролировали распространение в течение последних 20 дней, но такие штаты, как Махараштра, Мадхья-Прадеш и Гуджарат, сообщили о высоких показателях за гораздо меньшее время, чем в Керале. На первый взгляд ясно, что в разных штатах случаи COVID-19 различаются. Для проверки я собрал данные из нескольких источников о демографии штатов, истории поездок за 2018 год и медицинских учреждениях, чтобы применить различные статистические методы, чтобы найти корреляцию с распространением коронавируса в штатах и ​​связать их в группу с кластерами.

Есть некоторые интересные данные о корреляции характеристик, такие как иностранный турист в 2018 году (FTV18), городское население штатов (urb_pop), День с момента первого случая (day_of_cases), Общенациональная блокировка (LockdownType_National), Количество государственных больниц/коек и области штатов тесно связаны с общим числом подтвержденных случаев COVID-19 в Индии. Затем, используя эти функции, мы можем определить кластеры и сопоставить состояния с их наиболее подходящим кластером, чтобы понять поведение распространения по состояниям.

Я помещаю все 32 затронутых штата в два кластера после нескольких итераций, и в результате мы видим, что Уттар-Прадеш, Западная Бенгалия, Бихар с небольшим числом общих случаев принадлежат в один кластер с Махараштрой, но Дели, Теленгана, Керала находятся в другом кластере, несмотря на большое количество случаев. Одним из факторов, определяющих результат, является то, сколько дней требуется, чтобы состояние достигло определенного количества случаев.

кластер-1 Желтый:['Керала', 'Теленгана', 'Дели', 'Харьяна', 'Ладакх', 'Джамму и Кашмир', 'Пенджаб', 'Уттаракханд', 'Одиша' , «Пудучерри», «Чандигарх», «Чхаттисгарх», «Химачал-Прадеш», «Манипур», «Мизорам», «Андаманские и Никобарские острова», «Гоа», «Джаркханд», «Ассам», «Аруначал-Прадеш», «Трипура», «Нагаленд», «Мегхалая»]

кластер-2 Синий:['Раджастхан', 'Уттар-Прадеш', 'Тамилнад', 'Махараштра',
'Карнатака', 'Андхра-Прадеш', 'Западная Бенгалия', ' Гуджарат»,
«Мадхья-Прадеш», «Бихар»]

Далее мы можем увидеть, каков временной ряд случаев по обоим кластерам. С первой недели до последнего дня Lockdown 1.0 и выше.

Кластер-2, безусловно, вызывает беспокойство, поскольку за последние три недели к нему добавилось более 60% новых случаев. Общее количество штатов в кластере 2 составляет всего 10, из этих трех основных штатов наиболее обеспокоены Махараштра, Тамил Наду и Гуджарат. состояния и требуют особого внимания. В кластере-1 Дели находится на вершине с наибольшим количеством случаев до сих пор, как и в других штатах из этого кластера, мы можем ожидать снижения ежедневного числа новых случаев в Дели в ближайшее время.

3. Удовлетворительно ли Индия проводит испытания образцов?

Гендиректор ВОЗ четкое замечание: С огнем не потушишь с завязанными глазами. И мы не сможем остановить эту пандемию, если не будем знать, кто заражен. У нас есть простое сообщение для всех стран: тестировать, тестировать, тестировать. Тестируйте каждый подозрительный случай.

Все анализы и данные 2019-nCovd напрямую связаны с количеством тестов, проведенных странами, и мы стали свидетелями внезапного увеличения количества ежедневных случаев во многих странах Европы и США после увеличения выборочного тестирования. . То, как Индия будет проводить тесты в ближайшие несколько недель для такого большого населения, будет играть ключевую роль в борьбе с этой пандемией.

В попытке расширить тестирование правительство планирует расширить тестирование в кластере. В результате за последние 3 дня действие ежедневного теста на экспресс-тестирование увеличилось примерно на 50% по сравнению с предыдущим средним ежедневным тестом на образец, а ежедневные положительные случаи оставались стабильными на уровне около ~1000. Керала подает пример другим штатам Индии и всего мира, где число новых случаев не только сократилось до однозначного числа, но и достигнут самый высокий уровень выздоровления.

Эксперты в области здравоохранения назвали систему раннего выявления в Керале и ее специализированные отделения для лечения Covid основными причинами хорошего уровня выздоровления в штате и контроля новых случаев.

Последние мысли

Анализ был выполнен полностью на основе данных и математики без какого-либо экспертного понимания эпидемии и медицинского фона. В такое время, когда широко распространено замешательство и паника, мы знаем, что социальное дистанцирование, быстрое и жесткое решение, такое как блокировка со стороны правительства, средства быстрого тестирования помогают миру контролировать эту пандемию. Спасибо передовым работникам здравоохранения, полиции страны, правительственным администраторам, которые ставят на карту свою жизнь и борются за нас. Меньшее, что мы можем сделать, чтобы помочь им оставаться дома и оставаться в безопасности. Поскольку число стран, пострадавших от раннего заражения, продолжает уменьшаться, я твердо верю, что ранние действия помогут Индии бороться с коронавирусом, и вскоре мы станем другой стороной ситуации.
Наше поколение никогда раньше не сталкивалось с такой пандемией, и никто или какой-либо научный подход знает, как плохие (или хорошие) вещи получатся отсюда. То, что мы наблюдаем, действительно является событием черного лебедя.

Берегите себя, оставайтесь дома и берегите себя! Молитесь🙏 за 🇮🇳, молитесь 🙏 за 🌏.

Источник данных:MoHFW, ИндияJH CSSE, ICMR, Kaggle, https://data.gov.in

Исходный код на Github