ЭКГ - это одномерный сигнал, который является результатом регистрации электрической активности сердца с помощью электрода. Это один из инструментов, который кардиологи используют для диагностики сердечных аномалий и заболеваний.

В этом сообщении в блоге мы собираемся использовать аннотированный набор данных сердечных сокращений, уже предварительно обработанный авторами этой статьи, чтобы посмотреть, сможем ли мы обучить модель обнаружению аномальных сердечных сокращений.

Набор данных

Исходными используемыми наборами данных являются Набор данных об аритмии MIT-BIH и База данных диагностической ЭКГ PTB, которые были предварительно обработаны [1] на основе методологии, описанной в III.A статьи, чтобы в итоге получить образцы одного сердцебиение и нормализованные амплитуды как:

Набор данных MIT-BIH Arrhythmia:

  • Количество категорий: 5
  • Количество образцов: 109446
  • Частота дискретизации: 125 Гц
  • Источник данных: набор данных по аритмии Physionet MIT-BIH.
  • Классы: [’N’: 0, ‘S’: 1, ‘V’: 2, ‘F’: 3, ‘Q’: 4]

База данных диагностической ЭКГ PTB

  • Количество образцов: 14552
  • Количество категорий: 2 (нормальные против аномальных)
  • Частота дискретизации: 125 Гц
  • Источник данных: Диагностическая база данных Physionet PTB.

Опубликованная предварительно обработанная версия набора данных MIT-BIH не соответствует описанию, которое авторы предоставили в своей статье, поскольку первая сильно несбалансирована, а вторая - нет. Это сделало так, что мои результаты нельзя было напрямую сравнивать с их результатами. Я отправил авторам электронное письмо, чтобы разделить их с ними, и обновлю свои результаты, если получу ответ. Аналогичная проблема существует для набора данных PTB.

Модель

Как и в [1], я использую нейронную сеть на основе одномерных сверток, но без остаточных блоков:

Код:

Полученные результаты

Набор данных MIT-BIH Arrhythmia:

  • Точность: 98,5
  • Оценка F1: 91,5

База данных диагностической ЭКГ PTB

  • Точность: 98,3
  • Оценка F1: 98,8

Передача представительств

Поскольку набор данных PTB намного меньше, чем набор данных MIT-BIH, мы можем попробовать и посмотреть, могут ли представления, полученные из набора данных MIT-BIH, обобщить и быть полезными для набора данных PTB и улучшить производительность.

Это можно сделать, загрузив веса, полученные в MIT-BIH, в качестве начальной точки обучения модели PTB.

С нуля :

  • Точность: 98,3
  • Оценка F1: 98,8

Замораживание слоя свертки и обучение полносвязных:

  • Точность: 95,6
  • Оценка F1: 96,9

Тренируем все слои:

  • Точность: 99,2
  • Оценка F1: 99,4

Мы видим, что замораживание первых слоев идет не очень хорошо. Но если мы инициализируем веса с помощью тех, которые изучены в MIT-BIH, и обучим все уровни, мы сможем улучшить производительность по сравнению с обучением с нуля.

Код для воспроизведения результатов доступен по адресу: https://github.com/CVxTz/ECG_Heartbeat_Classification

[1] Мохаммад Качуи, Шаян Фазели, Маджид Саррафзаде - Классификация сердцебиения ЭКГ: глубокое передаваемое представление