"Машинное обучение"

Машинное обучение для прогнозирования болезни Паркинсона

Руководство по AutoML.

2 процента пожилых людей страдают болезнью Паркинсона - изнурительным нейродегенеративным заболеванием, - но до четверти случаев получают неправильный диагноз «».

Как пишет Mayo Clinic, диагностировать болезнь Паркинсона - непростая задача ². Специального диагностического теста не существует, и обученный невролог должен изучить историю болезни пациента, симптомы и провести неврологическое и физическое обследование, используя такие методы, как сканирование переносчика дофамина, а также анализы крови и визуализационные тесты, чтобы помочь исключить другие расстройства.

Сложность постановки диагноза возрастает в развивающихся странах, где меньше медицинских ресурсов. Как и в случае со многими другими заболеваниями, во время этой пандемии, вероятно, увеличилось количество недиагностированных и нелеченных случаев болезни Паркинсона. Болезнь Паркинсона может даже стать третьей волной пандемии ³.

К счастью, есть более быстрые и простые способы диагностировать болезнь Паркинсона, которые не требуются при интенсивных личных визитах. Пациенты с болезнью Паркинсона обладают характерными голосовыми особенностями, и машинное обучение может использоваться для определения этих характеристик и эффективного скрининга потенциальных пациентов.

(Малые) данные

Болезнь Паркинсона влияет на речь с такими симптомами, как затруднение артикуляции звуков, пониженная громкость и пониженный диапазон высоты звука.

Оксфордский университет собрал 195 записей голоса 31 человека: 23 с болезнью Паркинсона и 8 без. Столбцы включают извлеченные функции, такие как средняя основная частота голоса и измерения вариаций частоты и амплитуды.

Имея всего 195 строк данных, это отличный пример использования небольших данных. Распространенным мифом является то, что ИИ нужны большие данные, и хотя точность глубокой нейронной сети имеет тенденцию повышаться с увеличением объема данных, не все ИИ обязательно требуют больших объемов данных. В другой статье я показал, как набор данных из менее чем 100 строк можно использовать для предсказания политической нестабильности 2020 года.

Анализ

Мы можем загрузить данные как есть в инструмент AutoML Apteo, чтобы создать модель для прогнозирования болезни Паркинсона.

Мы выбираем status в качестве ключевого показателя эффективности, который относится к состоянию здоровья субъекта, 1 означает, что у него болезнь Паркинсона, а 0 означает, что он здоров. Все остальные столбцы используются как атрибуты. В фоновом режиме создается набор моделей машинного обучения для прогнозирования status. Мы также можем увидеть, как каждый атрибут (или различные звуковые функции) влияет на status.

Модель классификации Gradient Boosting автоматически выбирается как наиболее точная модель с перекрестно проверенной оценкой Жаккарда 0,892. Грубо говоря, предсказания модели на 89,2% совпадают с реальностью того, есть ли у пациента болезнь Паркинсона.

Напомним, что частота неправильной классификации болезни Паркинсона составляет до 25%, поэтому модель, которая точно предсказывает болезнь Паркинсона без невролога или личного посещения, и только с учетом голосовых особенностей, довольно невероятна.

На практике

Действительно, наблюдается прогресс в развертывании этих моделей в реальном мире, например, в рамках Инициативы голоса Паркинсона, цель которой - записать 10 000 голосов (примерно в 50 раз больше данных), обещая чрезвычайно высокую точность.

Резюме

Это удивительный пример использования прогнозной аналитики, которая изменит правила игры для людей с болезнью Паркинсона. Даже имея небольшой набор данных, мы можем добиться высокой точности при решении сложной медицинской задачи.