Спустя почти 50 лет после выхода культового фильма «2001: Космическая одиссея» пробирающие до мурашек слова: «Прости, Дэйв, я не могу этого сделать». жить дальше. Произнесенные печально известным антропоморфизированным компьютером HAL 9000, характеристики — и потенциальные опасности — кажущейся ущербной машины с искусственным интеллектом даже сегодня остаются активной темой для беспокойства среди величайших умов 21-го века.

К сожалению, из-за того, что точные взаимосвязи между традиционной статистикой, машинным обучением и искусственным интеллектом активно обсуждаются, легко оправдать машинное обучение тем, что оно все еще является «экспериментальным». Правда в том, что истоки и применение машинного обучения восходят к 1980-м годам почти на 40 лет — его концепции и практика более тесно связаны с традиционной статистикой, чем с искусственным интеллектом.

Нижняя линия? Маловероятно, что вы когда-нибудь услышите, как ваш ЭМК скажет: «Извините, доктор, я не могу этого сделать». Тем не менее, машинное обучение уже имеет потенциал для одновременного снижения затрат на предоставление более качественной медицинской помощи и одновременного улучшения навязчивых требований, предъявляемых к медицинским работникам во всей существующей экосистеме.

Сегодня машинное обучение используется в коммерческих целях для обнаружения мошенничества, игр, распознавания голоса, поисковых систем, таких как Google, и, конечно же, медицинской диагностики. На самом деле, хотя статистика и машинное обучение родились из разных наук и используют совершенно разные словари, они просто являются двумя важными инструментами в более широкой области информатики.

Помимо искусственного интеллекта (извините, HAL), и машинное обучение, и традиционная статистика преследуют одну и ту же цель. По словам статистика Ларри Вассермана, обе они озабочены тем, как мы учимся на данных. Какие именно инструменты мы в конечном итоге используем, зависит как от данных, которые мы изучаем, так и от того, что мы (если даже знаем) пытаемся извлечь из них уроки.

Недавнее смещение внимания к машинному обучению обусловлено значительным увеличением масштабов и объема данных, которые мы собираем и храним. В то время как возможности обработки и хранения данных современных компьютеров продолжают расти, даже самые передовые возможности традиционного статистического анализа для некоторых из новейших массивных библиотек данных приближаются к невозможности.

В статистике цель состоит в том, чтобы найти отношение участников к определенному результату на основе данных, которые на него повлияли. В наборах данных, содержащих тысячи влияющих факторов или точек данных, этот тип анализа может стать чрезвычайно громоздким, если вообще возможен. В то время как эволюция квантовых вычислений может, в конечном счете, вдохнуть новую жизнь в более традиционные подходы к анализу массивных наборов данных высокой размерности, машинное обучение в настоящее время представляет собой один из наиболее эффективных и многообещающих инструментов в арсенале специалиста по данным.

Машинное обучение используется для прогнозирования результатов, где часто точное описание (или даже понимание) взаимосвязи между данными «спрятано» в сильно взаимосвязанных сетях, определяемых обобщенными алгоритмами, взвешенными по результатам, основанным на наблюдениях. «Скрытый» здесь относится к взаимосвязи данных, способствующих прогнозируемому результату, а НЕ к самим данным.

В массивных и многомерных наборах данных машинное обучение позволяет процессу «игнорировать» — или, по крайней мере, не формулировать — взаимосвязь входящих данных. Следует отметить, что именно взвешенные отношения между этими данными (продукт ввода, предоставленного алгоритму машинного обучения для его обучения) фактически «скрыты». Поначалу этот термин может показаться немного нервирующим аналитику и, конечно, статистику. Однако в этом случае мы скрываем не процесс, а наблюдаемую математическую взаимосвязь экземпляров (данных), полученную в результате обучения модели.

Результатом является ряд инструментов, которые могут быть применены к невероятно широкому и, в некоторых случаях, неопределенным проблемам — в отличие от четко определенного разнообразия статистики — чтобы делать более точные прогнозы и быстрее на основе больших наборов сложных данных, где индивидуальные корреляции неизвестный.

И машинное обучение, и статистика побуждают нас записывать и делиться тем, что мы видим. Таким образом, машинное обучение похоже на взгляд «глазами» ребенка, а статистика — на мудрый взгляд на опыт.

Несмотря на всю шумиху, врачи и медицинские работники не должны удивляться, узнав, что их самые ранние открытия, сделанные с помощью этих новых инструментов машинного обучения, с такой же вероятностью покажут, как они могут лучше обслуживать своих пациентов посредством планирования и предотвращения больничных повторных обращений. -прием, чем, например, найти лекарство от простуды.

Машинное обучение само по себе не является инновационным. Как, впрочем, и статистика.

На данный момент инновации остаются одним из величайших даров человеческого сознания и, возможно, будущим ИИ.