ВВЕДЕНИЕ:-

Как хорошо сказано, у каждой медали две стороны, так и в случае с COVID-19. С одной стороны, это остановило реальный мир из-за блокировки, но в то же время оно вывело виртуальный мир на новый уровень. Остановка реального мира вынудила людей перейти в виртуальный мир и найти способы продолжить свою работу. Это создало огромные возможности для мира программных технологий, затрагивающие каждого человека в технической сфере, от разработчиков программного обеспечения до специалистов по обработке и анализу данных. Блокировка COVID-19 вызвала всплеск данных в мире, производящих исключительные 1,14 триллиона МБ в день. Это создало огромные возможности для специалистов по данным и искусственного интеллекта. Одной из других областей, создавших возможности для искусственного интеллекта, была медицина.

Бессимптомный характер COVID-19, как предполагалось, стал серьезной проблемой для беспомощного правительства в обнаружении COVID-позитивных и вынудил их ввести серию блокировок для людей. Метод определения температуры оказался наименее точным из-за бессимптомности в начальной стадии. Исследователи Массачусетского технологического института обнаружили, что здоровые и инфицированные люди по-разному кашляют. Человеческому уху сложно расшифровать разницу между кашлем, но эту задачу можно легко выполнить с помощью искусственного интеллекта.

Признаки, по которым эти модели машинного обучения дифференцируют кашель, по сути называются биомаркерами VOCAL. Это медицинский термин, который относится к неинвазивному методу выявления заболеваний по характеристикам речи/голоса. Техника анализа голоса уже используется для точного обнаружения нескольких смертельных заболеваний, включая обструктивное апноэ во сне, болезнь Паркинсона и расстройство аутистического спектра.10 в качестве примера.

ПРЕИМУЩЕСТВО ПЕРЕД ТРАДИЦИОННЫМИ МЕТОДАМИ:

Традиционные методы температурного скрининга дают весьма неточные результаты из-за бессимптомного характера заболевания в большинстве случаев. Это приводит к угрозе пропуска особей, инкубирующих болезнь. С другой стороны, лабораторные тесты, имеющие строгие лабораторные спецификации, слишком дороги и доступны не всем. Эти тесты также несут в себе угрозу передачи инфекции врачу и медработникам из-за тесного контакта с субъектом. Голосовая модель обеспечивает легкодоступный экран прямой линии, который устраняет ограничения существующих моделей. Люди могут проверить свое здоровье, просто записав звук кашля со своих телефонов на ходу. Это также избавляет страну от необходимости тратить кучу денег на тест-драйвы на коронавирус и в то же время обеспечивает точные практические результаты.

ПИОНЕРЫ В ОБЛАСТИ:

Три основных пионера, работающих в этой области, — это MIT, VOCALIS Health и IISC Bangalore (Project Coswara). Исследователи Массачусетского технологического института собрали более 70 000 записей кашля из разных источников во время блокировки и обучили свою модель на основе ИИ. Большая часть записей кашля была собрана с их онлайн-сайта, что позволяло людям анонимно делиться своими записями кашля. VOCALIS, израильский стартап голосовых технологий, работает в этой области и недавно завершил трехмесячный пилотный голосовой тест в Мумбаи, что дало колоссальную точность 99,2%. В этом году (2021) стартап планирует выйти на другие города. Модель будет доступна людям в виде мобильного приложения, которое они смогут использовать для просмотра в любое время. Пользователь должен был сосчитать от 50 до 70, чтобы отправить образец своего голоса в приложение. Индийский институт Бангалора работал в этой области в рамках ПРОЕКТА COSWARA, проводя свои исследования в лаборатории IISC Leap.

СБОР ДАННЫХ ДЛЯ ОБУЧЕНИЯ:

Основной источник данных для модели подразделяется на три разных источника.

  1. Клинические испытания. Перекодирование COVID-позитивных пациентов и COVID-негативных сотрудников было собрано из нескольких больниц с полного одобрения соответствующего органа.
  2. Веб-сайт: основным источником записи для проекта стал специально выделенный веб-сайт, где пользователь Интернета может отправить свою запись, записав свой кашель со своего мобильного телефона. Пользователь может выполнить эту задачу анонимно, не раскрывая никакой личной информации.
  3. Видео YOUTUBE: Третьим основным источником является видео YOUTUBE, где был проведен активный поиск для фильтрации интервью пациентов с положительным результатом на COVID.

Записи, собранные из этих источников, включали записи, различающиеся во всех диапазонах, поэтому данные прошли проверку качества, чтобы отфильтровать только высококачественный и желаемый звук. Обученный персонал прослушал все записи и вручную удалил некачественный звук, чтобы получить точный набор данных. Каждая запись в наборе данных была дискретизирована до частоты 44,1 кГц и нормализована в диапазоне от -1 до 1. Затем записи были сохранены в формате .wav (полная форма .wav — Waveform, по сути, это формат аудиофайла, такой как . mp3, разработанный IBM и Microsoft для хранения аудиозаписи в сжатом виде)

ОБУЧЕНИЕ МОДЕЛИ:

После того, как набор данных был готов, он был разделен на множество обучающих и тестовых наборов данных, в результате чего для каждого анализа были созданы разные наборы данных. Для каждого анализа аудиофайлы подвергались процессу извлечения признаков, основанному на методах обучения и адаптации, которые затем использовались для обучения различных моделей обработки данных. Для процесса оценки модели был проведен проверочный тест из взаимоисключающего набора тестов. Для оценки различных моделей классификации использовался метод 10-кратной перекрестной проверки. Затем результаты моделей оценивали по средней площади под ROC-кривой (AUC).

ВЫВОД:

Исследования в этой области направлены на светлое будущее в области распознавания речи и привлекают крупные инвестиции со стороны технологических гигантов мира. Успех модели распознавания голоса COVID станет прорывом не только в области искусственного интеллекта, но и в области медицины, помогая миллионам врачей быть в безопасности и давая людям простую практическую модель, которую они могут использовать в любое время. .

ДОРОГА ВПЕРЕДИ:

Собрать набор данных для отдельного человека оказалось непросто, но нам удалось собрать достаточно большой набор данных из некоторых онлайн-источников. Итак, в следующей статье мы построим модель распознавания голоса COVID из доступных ресурсов.

ИСПОЛЬЗОВАННАЯ ЛИТЕРАТУРА:-

[1] Дж. ЧУ, Модель искусственного интеллекта выявляет бессимптомные инфекции Covid-19 с помощью кашля, записанного мобильным телефоном (2020 г.), https://news.mit.edu/

[2] Vocalis Health, VOCALIS CHECK COVID-19 — Белая книга, https://vocalishealth.com/vocalis-health-products/vocalischeck

[3] М. Скуделлари, ИИ распознает COVID-19 по звуку кашля, https://spectrum.ieee.org/the-human-os/artificial-intelligence/medical-ai/ai-recognizes-covid- 19-в-звуке-кашля