Как специалисты по обработке данных и практики машинного обучения, мы можем решать интересные проблемы через призму работы с данными. Как аналитик данных, по крайней мере, для меня эта линза может быть довольно однонаправленной - до такой степени, что иногда кажется, что мы не используем правильные данные для решения нашего текущего проекта.

Я провожу исследования в области машинного обучения нейродегенеративных заболеваний, таких как болезнь Альцгеймера и Паркинсона, с использованием изображений мозга, и мы обычно используем один метод визуализации (известный как один тип или форма визуализации).

Существует множество форм визуализации, от магнитно-резонансной томографии (МРТ) до компьютерной томографии, диффузионной тензорной визуализации (DTI) и функциональной МРТ. Список можно продолжить, и он будет продолжать расти по мере развития технологий визуализации, позволяющих врачам видеть такие вещи, как отложения железа, амилоидные бляшки или переносчики дофамина в головном мозге, которые могут быть потенциальными биомаркерами для лучшего понимания этих заболеваний.

Помимо этих методов визуализации, есть и другие типы медицинских данных, которые я потенциально мог бы использовать - данные электронных медицинских карт (сочетание структурированных и неструктурированных), клиническая диагностика с помощью конкретных кодов (более структурированных) и генетические данные (структурированные, но дико многомерный).

Как вы понимаете, становится все более популярным множество типов данных, к которым у меня лично нет доступа: носимые данные, данные социальных сетей, социально-экономические данные и т. Д.

Это огромное количество данных ошеломляет, несколько тревожно, но определенно представляет собой интересную проблему для нашего типа.

Есть много исследователей, использующих эти уникальные типы данных, в том числе наша группа. Если мы начнем с визуализации, мы знаем, что глубокое обучение сделало большие успехи в компьютерном зрении. Если мы посмотрим на клинические заметки, глубокое обучение определенно улучшилось благодаря обработке естественного языка.

Но удалось ли нашему сообществу по-настоящему понять, что значит иметь мультимодальный подход? Конечно, мы можем загружать каждый тип данных отдельно через их собственную сеть, объединять выходные данные и пропускать их через плотный слой для прогнозирования классификации.

Просто поэкспериментируйте и посмотрите, что происходит сейчас, как правило.

Но справедливо ли это для данных? Я так не думаю. Я также не думаю, что мы сможем лучше понять, как эти данные взаимосвязаны или коррелированы или как они группируются по группам в зависимости от различных переменных.

Нам нужны более эффективные методы для более эффективного извлечения полезной, действенной информации, когда мы объединяем вместе уникально важные типы данных, чтобы гарантировать, что мы проводим аналитический анализ, а не решаем следующую проблему, стоящую перед нами.

Нам нужно понять, как разные изменяющиеся области мозга соотносятся с разными генетическими точками. Или почему человек, использующий какой-то сленг или язык, с большей вероятностью впадет в депрессию. Нам необходимо понять, как социальные детерминанты здоровья на детальном уровне влияют на более крупную и сложную систему, которой является наш мозг, и наоборот.

Нам нужен настоящий мультимодальный подход к машинному обучению, особенно если мы собираемся использовать эти инструменты, чтобы изменить нашу жизнь.

Спасибо за чтение.