На шаг ближе к диагностике с помощью искусственного интеллекта

С 1950-х годов электрокардиограммы в 12 отведениях остаются неинвазивным золотым стандартом для диагностики и оценки различных сердечно-сосудистых заболеваний, таких как аритмия, сердечные приступы или нарушения сердечной проводимости.

Прежде чем установить окончательный диагноз, врачи придерживаются системного подхода, состоящего из следующих параметров:

  • Темп
  • Ритм
  • Ось
  • Волны (P / QRS / T)
  • Интервалы и продолжительность (PR-QT-ST)
  • Признаки ишемии

Основываясь на этих параметрах, опытные кардиологи могут установить правильный диагноз по записи ЭКГ.

Большинство современных стандартных аппаратов ЭКГ оснащены алгоритмом анализа Marquette ™ 12SL от GE Healthcare, который теоретически должен помочь врачам в интерпретации записей ЭКГ. Алгоритм, разработанный в 1980-х годах, основан исключительно на ручных математических вычислениях.

Из-за низких прогностических возможностей алгоритма Marquette ™ 12SL врачи не склонны доверять интерпретациям, предоставляемым аппаратами ЭКГ.

Наша сверточная нейронная сеть для интерпретации ЭКГ

Врачи используют систематический подход для интерпретации ЭКГ, а не просто спешат с постановкой окончательного диагноза. Мы следовали тому же методу. Поскольку большинство параметров можно рассчитать по трем разным волнам записи ЭКГ, мы начали с разработки алгоритма определения начала и конца P-волн, QRS-комплексов. и зубцы T.

Для разработки этого алгоритма мы использовали INCART-DB (одна из общедоступных баз данных, предоставленных MIT) вместе с образцом базы данных, предоставленным нашим партнером Atrys Health, который был предварительно оцифрован с использованием нашего состояния-оф- современная система оцифровки .

Но сначала ... Нам потребовались некоторые данные для обучения - достаточно простого графического интерфейса на Python!

Используя специально созданный графический интерфейс Python, нам удалось быстро пометить данные из наших двух наборов данных и назначить пять классов всем сегментам наших доступных сигналов ЭКГ:

  • Нет: отметка сегмента сигнала, в котором нет отчетливой волны.
  • P-волна: отмечает начало и конец P-волны.
  • QRS-комплекс: отмечает начало и конец QRS-комплекса.
  • T-волна: отмечает начало и конец T.
  • Экстрасистолия: отметка начала и конца преждевременных сердечных сокращений.

После аннотирования примерно 50 образцов мы обучили нашу первую модель, чтобы ускорить процесс аннотации!

Как видно на рисунке выше, версия 2.0 нашего графического интерфейса аннотаций ЭКГ уже активно предоставляла прогнозы на основе нашей AI-модели. Это позволило нам аннотировать образцы ЭКГ в 3 раза быстрее.

Несколько дней спустя и появилось ровно 399 уникальных отведений ЭКГ, настало время для поиска гиперпараметров!

Гиперпараметры определяют общую архитектуру модели прогнозирования и процедуры обучения. Чтобы найти идеальную комбинацию гиперпараметров, мы обучили более 900 моделей, практикуя как систематическую настройку параметров, так и псевдослучайные испытания. Мы учли лучшие практики машинного обучения и на протяжении всего поиска сохраняли данные, разделенные на наборы для обучения, проверки и тестирования.

Глядя на спектакль

Краткое резюме - мы использовали сигналы из двух баз данных ЭКГ по 12 отведениям и присвоили один из пяти различных классов каждой точке каждого сигнала ЭКГ. Затем мы обучили сверточную нейронную сеть (CNN) автоматизировать процесс маркировки и генерировать интерпретацию ЭКГ на новых образцах ЭКГ.

Наш маркированный набор данных в цифрах:

  • 84 уникальных пациента
  • 399 отведений ЭКГ (содержащих одно из двенадцати отведений ЭКГ: I, II, III, aVF, aVL, aVR, V1, V2, V3, V4, V5, V6)
  • 102 минуты записей ЭКГ

На этапе предварительной обработки мы скорректировали частоты дискретизации сигналов ЭКГ в двух базах данных и приступили к разделению выборок на обучение, тестирование и проверку установить. Чтобы ограничить смещение, мы разделили образцы ЭКГ в соответствии с отведениями ЭКГ, чтобы отведения ЭКГ конкретного пациента присутствовали только в одном наборе.

Были использованы следующие окончательные наборы данных:

  • Обучающая выборка (80%): 290 отведений, что составляет 72,19 минут сигналов ЭКГ.
  • Набор для тестирования (10%): 54 отведения на 16,19 минут сигналов ЭКГ.
  • Проверочный набор (10%): 55 отведений, составляющих 13,73 минуты сигналов ЭКГ.

Отведения некоторых пациентов были удалены на этапе маркировки данных из-за слишком большого шума.

Тренируясь всего на 72 минутах сигналов ЭКГ, мы разработали алгоритм на основе ИИ для обнаружения зубцов P, комплексов QRS и зубцов T, используемых при интерпретации и диагностике ЭКГ!

Для всех вас, аналитиков данных и любителей статистики, вот матрицы путаницы нашей самой эффективной на данный момент модели:

Powerful Medical - исследовательская компания, разрабатывающая медицинские решения для практикующих врачей и больниц.

Используя искусственный интеллект, машинное обучение и инновационное программное обеспечение, наша главная цель - повысить эффективность и точность медицины.

Свяжитесь с нами: [email protected]