"Машинное обучение"
Машинное обучение для прогнозирования болезни Паркинсона
Руководство по AutoML.
2 процента пожилых людей страдают болезнью Паркинсона - изнурительным нейродегенеративным заболеванием, - но до четверти случаев получают неправильный диагноз «».
Как пишет Mayo Clinic, диагностировать болезнь Паркинсона - непростая задача ². Специального диагностического теста не существует, и обученный невролог должен изучить историю болезни пациента, симптомы и провести неврологическое и физическое обследование, используя такие методы, как сканирование переносчика дофамина, а также анализы крови и визуализационные тесты, чтобы помочь исключить другие расстройства.
Сложность постановки диагноза возрастает в развивающихся странах, где меньше медицинских ресурсов. Как и в случае со многими другими заболеваниями, во время этой пандемии, вероятно, увеличилось количество недиагностированных и нелеченных случаев болезни Паркинсона. Болезнь Паркинсона может даже стать третьей волной пандемии ³.
К счастью, есть более быстрые и простые способы диагностировать болезнь Паркинсона, которые не требуются при интенсивных личных визитах. Пациенты с болезнью Паркинсона обладают характерными голосовыми особенностями, и машинное обучение может использоваться для определения этих характеристик и эффективного скрининга потенциальных пациентов.
(Малые) данные
Болезнь Паркинсона влияет на речь с такими симптомами, как затруднение артикуляции звуков, пониженная громкость и пониженный диапазон высоты звука.
Оксфордский университет собрал 195 записей голоса 31 человека: 23 с болезнью Паркинсона и 8 без. Столбцы включают извлеченные функции, такие как средняя основная частота голоса и измерения вариаций частоты и амплитуды.
Имея всего 195 строк данных, это отличный пример использования небольших данных. Распространенным мифом является то, что ИИ нужны большие данные, и хотя точность глубокой нейронной сети имеет тенденцию повышаться с увеличением объема данных, не все ИИ обязательно требуют больших объемов данных. В другой статье я показал, как набор данных из менее чем 100 строк можно использовать для предсказания политической нестабильности 2020 года.
Анализ
Мы можем загрузить данные как есть в инструмент AutoML Apteo, чтобы создать модель для прогнозирования болезни Паркинсона.
Мы выбираем status
в качестве ключевого показателя эффективности, который относится к состоянию здоровья субъекта, 1
означает, что у него болезнь Паркинсона, а 0
означает, что он здоров. Все остальные столбцы используются как атрибуты. В фоновом режиме создается набор моделей машинного обучения для прогнозирования status
. Мы также можем увидеть, как каждый атрибут (или различные звуковые функции) влияет на status
.
Модель классификации Gradient Boosting автоматически выбирается как наиболее точная модель с перекрестно проверенной оценкой Жаккарда 0,892. Грубо говоря, предсказания модели на 89,2% совпадают с реальностью того, есть ли у пациента болезнь Паркинсона.
Напомним, что частота неправильной классификации болезни Паркинсона составляет до 25%, поэтому модель, которая точно предсказывает болезнь Паркинсона без невролога или личного посещения, и только с учетом голосовых особенностей, довольно невероятна.
На практике
Действительно, наблюдается прогресс в развертывании этих моделей в реальном мире, например, в рамках Инициативы голоса Паркинсона, цель которой - записать 10 000 голосов (примерно в 50 раз больше данных), обещая чрезвычайно высокую точность.
Резюме
Это удивительный пример использования прогнозной аналитики, которая изменит правила игры для людей с болезнью Паркинсона. Даже имея небольшой набор данных, мы можем добиться высокой точности при решении сложной медицинской задачи.