Преимущества ИИ для здравоохранения широко обсуждались в последние годы, вплоть до возможности замены врачей-людей искусственным интеллектом в будущем.

И такие обсуждения, и текущие проекты, основанные на искусственном интеллекте, показывают, что искусственный интеллект можно использовать в здравоохранении несколькими способами:

  • ИИ может изучать особенности большого объема медицинских данных, а затем использовать полученные данные для оказания помощи клинической практике в дизайне лечения или оценке риска;
  • Система искусственного интеллекта может извлекать полезную информацию из большого количества пациентов, чтобы помочь сделать выводы в реальном времени для предупреждения о рисках для здоровья и прогнозирования результатов для здоровья;
  • AI может выполнять повторяющиеся задания, такие как анализ тестов, рентгеновские снимки, компьютерная томография или ввод данных;
  • Системы искусственного интеллекта могут помочь уменьшить диагностические и терапевтические ошибки, которые неизбежны в клинической практике человека;
  • ИИ может помочь врачам, предоставляя новейшую медицинскую информацию из журналов, учебников и клинических практик для надлежащего ухода за пациентами;
  • ИИ может управлять медицинскими записями и анализировать производительность как отдельного учреждения, так и всей системы здравоохранения;
  • ИИ может помочь в разработке точной медицины и новых лекарств, основанных на более быстрой обработке мутаций и связей с болезнями;
  • AI может предоставлять цифровые консультации и услуги по мониторингу состояния здоровья - вплоть до «цифровых медсестер» или «медицинских роботов».

Несмотря на разнообразие применений ИИ в клинических исследованиях и медицинских услугах, они делятся на две основные категории: анализ структурированных данных, включая изображения, гены и биомаркеры, и анализ неструктурированных данных , например заметки, медицинские журналы или опросы пациентов, чтобы дополнить структурированные данные. Первый подход основан на алгоритмах машинного обучения и глубокого обучения, а второй основан на специализированных практиках обработки естественного языка.

Алгоритмы машинного обучения

Алгоритмы машинного обучения в основном извлекают особенности из данных, такие как «характеристики» пациентов и интересующие их медицинские результаты.

Долгое время в искусственном интеллекте в здравоохранении преобладала логистическая регрессия, самый простой и распространенный алгоритм, когда необходимо классифицировать вещи. Это было легко использовать, быстро закончить и легко интерпретировать. Однако в последние годы ситуация изменилась, и SVM и нейронные сети вышли на первое место.

Машина опорных векторов

Машины опорных векторов (SVM) могут использоваться для классификации и регрессии, но этот алгоритм в основном используется в задачах классификации, которые требуют разделения набора данных на два класса с помощью гиперплоскости. Цель состоит в том, чтобы выбрать гиперплоскость с максимально возможным запасом или расстоянием между гиперплоскостью и любой точкой в ​​обучающем наборе, чтобы новые данные можно было правильно классифицировать. Опорные векторы - это точки данных, которые наиболее близки к гиперплоскости и которые, если их удалить, изменили бы ее положение. В SVM определение параметров модели представляет собой задачу выпуклой оптимизации, поэтому решение всегда является глобальным оптимумом.

SVM широко используются в клинических исследованиях, например, для выявления биомаркеров визуализации, для диагностики рака или неврологических заболеваний и в целом для классификации данных из несбалансированных наборов данных или наборов данных с пропущенными значениями.

Нейронные сети

В нейронных сетях связи между результатом и входными переменными изображаются с помощью комбинаций скрытых слоев заранее определенных функционалов. Цель состоит в том, чтобы оценить веса на основе входных данных и данных результатов таким образом, чтобы минимизировать среднюю ошибку между результатом и их прогнозами.

Нейронные сети успешно применяются в различных областях медицины, таких как диагностические системы, биохимический анализ, анализ изображений и разработка лекарств, с учебным примером предсказания рака груди по маммографическим изображениям.

Логистическая регрессия

Логистическая регрессия - один из основных и до сих пор популярных многомерных алгоритмов моделирования дихотомических результатов. Логистическая регрессия используется для получения отношения шансов, когда присутствует более одной независимой переменной. Процедура аналогична множественной линейной регрессии, за исключением того, что переменная ответа является биномиальной. Он показывает влияние каждой переменной на отношение шансов наблюдаемого интересующего события. В отличие от линейной регрессии, она позволяет избежать смешанных эффектов, анализируя связь всех переменных вместе.

В здравоохранении логистическая регрессия широко используется для решения задач классификации и прогнозирования вероятности определенного события, что делает ее ценным инструментом для оценки риска заболевания и улучшения медицинских решений.

Обработка естественного языка

В сфере здравоохранения большая часть клинической информации представлена ​​в форме повествовательного текста, такого как физический осмотр, отчеты клинических лабораторий, оперативные записи и выписки, которые неструктурированы и непонятны для компьютерной программы без специальных методов обработки текста. Обработка естественного языка решает эти проблемы, поскольку она определяет серию релевантных для заболевания ключевых слов в клинических заметках на основе исторических баз данных, которые после проверки вводят и обогащают структурированные данные для поддержки принятия клинических решений.

TF-IDF

Базовый алгоритм для извлечения ключевых слов, TF-IDF означает обратную частоту терминов в документе. Вес TF-IDF - это статистическая мера важности слова для документа в коллекции или корпусе. Важность увеличивается пропорционально тому, сколько раз слово появляется в документе, но компенсируется частотой появления слова в корпусе.

В здравоохранении TF-IDF используется для обнаружения сходства пациентов в обсервационных исследованиях, а также для выявления корреляций болезней из медицинских отчетов и поиска последовательных закономерностей в базах данных.

Наивный байесовский

Наивный байесовский классификатор - это базовый метод категоризации текста, проблема оценки документов как принадлежащих к той или иной категории. Наивный байесовский классификатор предполагает, что наличие определенной функции в классе не связано с наличием какой-либо другой функции. Даже если эти характеристики взаимозависимы, все эти свойства независимо друг от друга повышают вероятность принадлежности к определенной категории.

Он остается одним из самых эффективных и действенных алгоритмов классификации и успешно применяется для решения многих медицинских проблем, таких как классификация медицинских отчетов и журнальных статей.

Слово Векторы

Считается прорывом в НЛП, словесных векторах или word2vec, это группа связанных моделей, которые используются для создания встраивания слов. По своей сути, модели word2vec представляют собой неглубокие двухслойные нейронные сети, которые реконструируют лингвистические контексты слов. Word2vec создает многомерное векторное пространство из текста, где каждому уникальному слову соответствует вектор. Векторы слов располагаются в векторном пространстве таким образом, чтобы слова, имеющие общий контекст, располагались в непосредственной близости друг от друга.

Словесные векторы используются для биомедицинской языковой обработки, включая поиск сходства, стандартизацию медицинских терминов и обнаружение новых аспектов болезней.

Глубокое обучение

Глубокое обучение - это расширение классической техники нейронных сетей, которое, проще говоря, представляет собой многослойную нейронную сеть. Обладая большими возможностями по сравнению с классическими алгоритмами машинного обучения, Deep Learning может исследовать более сложные нелинейные закономерности в данных. Будучи конвейером модулей, каждый из которых можно обучить, Deep Learning представляет собой масштабируемый подход, который, среди прочего, может выполнять автоматическое извлечение функций из необработанных данных.

В медицинских приложениях алгоритмы глубокого обучения успешно решают задачи как машинного обучения, так и обработки естественного языка. Обычно используемые алгоритмы глубокого обучения включают в себя сверточную нейронную сеть (CNN), рекуррентную нейронную сеть, сеть глубоких убеждений и многослойный перцептрон, причем CNN лидируют в гонке с 2016 года.

Сверточная нейронная сеть

CNN была разработана для обработки многомерных данных или данных с большим количеством характеристик, таких как изображения. Изначально, как было предложено LeCun, входными данными для CNN были нормализованные значения пикселей на изображениях. Сверточные сети были вдохновлены биологическими процессами в том смысле, что паттерн связи между нейронами напоминает организацию зрительной коры головного мозга животных, при этом отдельные корковые нейроны реагируют на стимулы только в ограниченной области рецептивного поля. Однако рецептивные поля разных нейронов частично перекрываются, так что они покрывают все поле зрения. Затем CNN передает значения пикселей в изображении путем взвешивания в сверточных слоях и выборки в слоях подвыборки поочередно. Конечный результат - это рекурсивная функция взвешенных входных значений.

Недавно CNN была успешно внедрена в области медицины для помощи в диагностике заболеваний, таких как рак кожи или катаракта.

Рекуррентная нейронная сеть

Вторые по популярности в здравоохранении, RNN представляют собой нейронные сети, использующие последовательную информацию. RNN называются повторяющимися, потому что они выполняют одну и ту же задачу для каждого элемента последовательности, а результат зависит от предыдущих вычислений. У RNN есть «память», которая фиксирует информацию о том, что было вычислено на несколько шагов назад (подробнее об этом позже).

Чрезвычайно популярные в НЛП, RNN также являются мощным методом прогнозирования клинических событий.

До недавнего времени приложения искусственного интеллекта в здравоохранении в основном касались нескольких типов заболеваний: самые распространенные из них - рак, заболевания нервной системы и сердечно-сосудистые заболевания. В настоящее время достижения в области ИИ и НЛП, и особенно разработка алгоритмов глубокого обучения, превратили отрасль здравоохранения в использование методов ИИ во многих сферах, от управления потоками данных до открытия лекарств.