Лучше зажечь свечу, чем проклинать алгоритм

Нас все чаще окружают интеллектуальные устройства и системы со встроенным интеллектом, позволяющим предугадывать наши потребности. Если вы разговаривали с системой распознавания голоса при звонке в службу поддержки клиентов, сканировали ваше лицо при въезде в США из-за границы или просили Alexa или Siri сообщить вам прогноз погоды, вы взаимодействовали с искусственным интеллектом, или AI

Хотя нам нравится удобство интеллектуальных устройств и систем, они также вызывают озабоченность у пользователей, поскольку А.И. проявляется во все большей и большей части нашей жизненной деятельности: на работе, дома, в школе, в торговле и на досуге. Даже редакции становятся мишенью для А.И. И они фильтруются до мобильных устройств, которые мы постоянно носим с собой. Просто спросите Siri.

Мы хотели бы предположить, что интеллектуальные системы в этих системах созданы специалистами, тщательно протестированы и проверены перед выпуском для повседневного использования. Но можем ли мы сделать такое предположение? Как журналистов, нас просят сообщать о событиях, влияющих на повседневную жизнь людей. Однако, как отмечает А. технологии стремительно развиваются, журналисты часто остаются наедине с остальными. Пора репортерам спросить разработчиков умных систем, что в этом искусственном интеллекте. мы переходим к большему количеству наших жизней.

Об А. и журналисты

Термин «искусственный интеллект» охватывает ряд различных технологий, включая обработку естественного языка, компьютерное зрение и распознавание голоса для восприятия и понимания сигналов и стимулов из окружающего мира. Хотя некоторые из этих достижений разрабатывались десятилетиями, их распространение в нашу повседневную жизнь стало результатом повсеместной доступности огромных вычислительных мощностей, распространения мобильных устройств и появления облачных вычислений для хранения огромных объемов данных.

Но, пожалуй, самые впечатляющие достижения в области искусственного интеллекта. находятся в машинном обучении. Благодаря машинному обучению интеллектуальные системы становятся еще умнее, поскольку в них используются данные, с которыми они сталкиваются.

Теперь системы не только запоминают данные, с которыми они сталкиваются, они учатся и становятся более осведомленными на основе этих данных, причем во многих случаях более эффективно и предсказуемо, чем люди. Можно утверждать, что удобства, обеспечиваемые машинным обучением, нивелируются создаваемой ими неуверенностью в отношении роли людей во все более интеллектуальном мире технологий.

И мы, вероятно, увидим в нашей жизни еще больше систем с поддержкой искусственного интеллекта. Хотя точного подсчета количества интеллектуальных систем и устройств нет, недавний сборник венчурных инвестиций дает нам довольно хорошее представление о тенденции. Эти данные, проведенные аналитической компанией GlobalData, показывают резкий рост венчурных сделок и фондов в начинающих компаниях, разрабатывающих искусственный интеллект. систем только за последний год, благодаря чему A.I. одна из горячих целей венчурного капитала. (Данные за первый квартал 2019 года показывают замедление венчурных инвестиций в искусственный интеллект по сравнению с прошлогодними бурными темпами.)

Дело не в том, что журналисты не обращают внимания на все это, но фокус был довольно узким, например, на потенциальных эффектах искусственного интеллекта. по вакансиям. И я тоже признаю себя виновным в написании подобных историй. Фактически, другое недавнее исследование показывает, что компании используют искусственный интеллект. системы, которые хороши для бизнеса, не обязательно для сокращения рабочих мест. Это исследование, проведенное компанией Statista для Ассоциации потребительских технологий, показывает лучшие бизнес-приложения A.I. лучше обнаруживают угрозы безопасности и улучшают обслуживание клиентов, функции, напрямую связанные с выживанием предприятия.

Лучшая история об А. состоит в том, чтобы изучить, что делают умные системы, как они это делают и хорошо ли они это делают. Другими словами, зажгите свечу внутри черного ящика, а не жалуйтесь на темноту. Чтобы зажечь эту свечу, полезно знать, какие вопросы задавать, и мы рассмотрим эти вопросы здесь.

Об алгоритмах

Основа машинного обучения - это алгоритмы с логикой, лежащей в основе компьютерного кода, который обрабатывает информацию с помощью интеллектуального устройства или системы. Алгоритмы - это набор правил и процессов для выполнения задачи, обычно представленный в виде математической формулы или логики. Они могут быть простыми, как формула для расчета процентных платежей по ссуде, или более сложными, чтобы учесть множество факторов и условий.

В машинном обучении алгоритмы приобретают особое качество: они корректируют свои правила, процессы и вычисления по мере поступления новых данных. Многие алгоритмы, используемые в машинном обучении, основаны на байесовской статистике, названной в честь Томаса Байеса, британского священнослужителя и философа 18 века, чья теорема привела к вычислениям, предсказывающим вероятность наступления результата на основе других связанных вероятностей. И в этих расчетах, чем больше данных используется для расчета результата, тем надежнее прогноз. Нейт Сильвер, основатель FiveThirtyEight, помог популяризировать байесовскую статистику при проведении избирательных опросов и предсказывать исход спортивных событий даже во время игр.

Чтобы машины могли обучаться с помощью этих алгоритмов, им нужны данные и их много. Чем больше данных обнаружено и поглощено алгоритмом, и чем более разнообразны условия, выраженные в этих данных, тем более точными должны быть прогнозы и тем более уверенно они могут быть применены к более широким группам населения. Разработчики систем машинного обучения пишут свои алгоритмы, а затем часто тренируют процедуры с данными из крупномасштабных баз данных. После ввода в эксплуатацию эти алгоритмы продолжают учиться на данных, с которыми они сталкиваются, и становятся более точными в своих результатах.

Хотя идея алгоритмов довольно проста, они могут, как отмечалось ранее, стать довольно сложными. Тем не менее, руководители предприятий, политики и рядовые граждане используют алгоритмы машинного обучения, чтобы принимать больше решений, чем когда-либо, что зависит от точности и надежности их расчетов. Мы можем доверять математикам и инженерам, которые пишут алгоритмы, или настаивать на мерах предосторожности для проверки их точности и надежности.

Зачем нужно проверять алгоритмы? У нас есть горький опыт финансового кризиса 2007–2008 годов. Среди причин наихудшего экономического спада с 1930-х годов были сложные финансовые инструменты, разновидность производных финансовых инструментов, называемых обеспеченные долговые обязательства, которые объединяют другие активы, такие как ипотечные ссуды и облигации, и переупаковывают их как отдельные инвестиции.

Многие обеспеченные долговые обязательства были довольно подробными и сложными, требующими математических формул и компьютерной логики, выраженной в алгоритмах, для точного определения результатов и управления рисками. Перед крахом многие инвестиционные фирмы Уолл-стрит нанимали обученных физиков и математиков, называемых «квантами», для написания этих алгоритмов, и сложность алгоритмов часто маскировала лежащую в основе рискованность ипотечных ссуд, составляющих пакет, продаваемый инвесторам.

Когда основные субстандартные кредиты в пакете испортились, обеспеченные долговые обязательства, построенные на этом шатком фундаменте, рухнули вместе с ними. И из-за своей сложности инвестиционные банки, такие как Bear Stearns и Lehman Brothers, которые владели этими ценными бумагами и тоже обанкротились, не могли объяснить, почему. (В 2008 году я вел статью о ученых, нанятых квантами в разделе карьеры журнала Science.)

Зажигание свечи

Как могут репортеры, особенно те, у кого нет опыта в математике и статистике, а это касается многих современных журналистов, узнать, что находится в этих алгоритмах машинного обучения? Задавая правильные вопросы: о проблеме, которую стремится решить алгоритм, о процессе, использованном для написания алгоритма, и его практическом опыте. Если задуматься, репортеры обычно задают одни и те же вопросы политикам, руководителям предприятий, артистам и звездам спорта. Теперь нам нужно спросить их также и у А.И. системные разработчики.

Начнем с основных фактов об алгоритме:

1. В чем проблема A.I. системное решение?

2. Какой алгоритм расчета помогает решить эту проблему?

3. Каковы источники данных для обучения алгоритма?

4. Что изучает алгоритм при работе с данными?

Следующая группа вопросов касается качества и надежности алгоритмов. Конечно, это может быть непростой вопрос, поскольку немногие люди, кроме специалистов по обработке данных, обладают технической подготовкой для оценки математических или логических расчетов алгоритма.

В этом нам помогает статья В. Николсона Прайса, профессора права из Мичиганского университета, опубликованная в журнале Science Translational Medicine в декабре 2018 года Большие данные и медицинские алгоритмы черного ящика. . Николсон предлагает стратегию, чтобы помочь пользователям алгоритмов машинного обучения в области медицины понять, что в них заложено.

Прайс предлагает ряд вопросов разработчикам систем машинного обучения, чтобы помочь регулирующим органам медицинских систем, таким как Управление по санитарному надзору за качеством пищевых продуктов и медикаментов, разобраться с искусственным интеллектом. (FDA в апреле 2019 года объявило о своем намерении создать нормативную базу для медицинских алгоритмов.) Но стратегия Прайса по пониманию внутренней части медицинских черных ящиков также может быть применена к другим алгоритмам машинного обучения с такими вопросами, как:

5. Был ли алгоритм рассмотрен независимо, или код и базы данных, используемые для обучения алгоритма, доступны для независимых рецензентов?

6. Был ли алгоритм запущен на наборах данных, отличных от тех, которые использовались для обучения, для проверки первоначальных результатов?

7. Какова репутация алгоритма с реальными данными?

Пример вопросов, используемых с реальным алгоритмом

Вот пример применения этих вопросов к алгоритму здравоохранения, о котором Science & Enterprise сообщила в марте 2019 года. Команда исследователей-медиков и специалистов по обработке данных из Стэнфордского университета и Техниона, ведущего научно-технического института Израиля, написала машинный: алгоритм обучения для расчета показателя здоровья иммунной системы человека, опубликованный в журнале Nature Medicine. Активизация иммунной системы быстро становится ключевым механизмом новых методов лечения многих заболеваний, особенно рака. Но эти новые методы лечения нуждаются в хорошо функционирующей иммунной системе пациента, чтобы работать эффективно.

Команда под руководством Марка Дэвиса из Стэнфорда и Шая Шен-Орра из Техниона написала алгоритм для расчета того, что они называют иммунным возрастом. Иммунная система человека со временем постепенно снижается, но только хронологический возраст является в лучшем случае приблизительным показателем того, подходит ли лечение, задействующее иммунную систему. Поэтому Дэвис, Шен-Орр и его коллеги разработали этот алгоритм для вычисления иммунного возраста человека, который, по их словам, обеспечивает более чувствительную и надежную меру здоровья иммунной системы.

Давайте применим наши 7 вопросов к этому алгоритму.

1. В чем проблема A.I. решение системы?
Система удовлетворяет потребность в более точном измерении здоровья иммунной системы, чтобы определить, подходят ли человеку методы лечения, которые задействуют иммунную систему.

2. Какой алгоритм расчета помогает решить эту проблему?
Алгоритм рассчитывает индекс, называемый иммунным возрастом, который рассчитывается на основе широкого диапазона показателей общего состояния и состояния иммунной системы.

3. Каковы источники данных для обучения алгоритма?
Исследователи наблюдали за 135 здоровыми людьми в течение 9 лет, периодически измеряя различные показатели иммунной системы: гены, экспрессируемые в образцах цельной крови, ответы клеток на передачу сигналов. ферменты, называемые цитокинами, выделяемые клетками иммунной системы, и характерные черты определенных подмножеств клеток в организме.

4. Что изучает алгоритм при обнаружении данных?
Алгоритм узнает больше о состоянии иммунной системы человека с течением времени и меняет свой расчет иммунного здоровья по мере того, как человек стареет.

5. Был ли алгоритм рассмотрен независимо, или код и базы данных, используемые для обучения алгоритма, доступны для независимых рецензентов?
Исследователи предоставляют данные и исходный код независимым исследователям.

6. Был ли алгоритм запущен на наборах данных, отличных от тех, которые использовались для обучения, чтобы проверить первоначальные результаты?
Команда проверила свой алгоритм на данных о состоянии здоровья из выборки из 2000 участников Фрамингемского исследования сердца. знаковое продолжающееся обследование сердечно-сосудистой системы и общего состояния здоровья более 15 000 человек в городе Фрамингем, штат Массачусетс, которое началось в 1948 году. Исследователи говорят, что их алгоритм иммунного возраста точно предсказал уровень смертности в тех случаях, которые они выбрали.

7. Каков послужной список алгоритма с реальными данными?
Статья Nature Medicine была опубликована в марте 2019 года, поэтому по состоянию на апрель 2019 года было мало шансов для реального мира контрольная работа. Однако алгоритм иммунного возраста - это больше, чем академическое упражнение. Компания CytoReason в Тель-Авиве, соучредителем которой является Шен-Орр, лицензирует интеллектуальную собственность Техниона для моделирования поведения клеток для открытия лекарств и планирования клинических испытаний. Опыт компании с алгоритмом иммунного возраста может дать ответ на этот вопрос, а также предоставить новые данные для уточнения алгоритма по мере появления более разнообразных популяций.

Дополнительные вопросы: что, если компания заявляет, что ее алгоритм является проприетарным?

Компании, предлагающие услуги с алгоритмами машинного обучения, могут заявить, что их алгоритмы являются коммерческой тайной и не могут быть разглашены. Алгоритм иммунного возраста, используемый здесь в качестве примера, может предложить несколько способов обойти это утверждение. Вот еще вопросы, которые нужно задать:

Основан ли алгоритм компании на академических исследованиях? Если да, более ранняя версия может быть опубликована в журнале, например в статье Стэнфордского Техниона в Nature Medicine. Компания может дополнять или уточнять расчеты, но опубликованные исследования могут дать хорошую оценку последней версии.

Финансируется ли алгоритм компании или лежащие в его основе исследования правительством США? Национальные институты здравоохранения были одним из спонсоров алгоритма иммунного возраста. Объявления о финансировании от федеральных агентств являются общедоступными документами и доступны для поиска в Интернете. Здесь есть ссылки на базы данных финансируемых исследований…
- Национальные институты здравоохранения
- Национальный научный фонд
- Медицинские исследования Министерства обороны
- DARPA проекты искусственного интеллекта

Запатентован ли алгоритм или компания подала заявку на патент? Если алгоритм имеет решающее значение для успеха компании, то компания или академическое учреждение, у которого они лицензировали технологию, вероятно, подали заявку на патент на защиту интеллектуальной собственности. Поиск в патентных базах данных, подобных тем, которые предоставлены США. Патентное ведомство »или сторонние базы данных могут предоставить текст патента. Опять же, патент может не предоставлять все новейшие функции алгоритма, но он может дать хорошее представление о его работе.