Учебник для знакомства с шумным миром науки о данных.

Введение: шумиха вокруг ИИ

Несколько месяцев назад я недавно закончила магистратуру и подумала, что было бы неплохо написать отчет о том, что я узнал.

Признаться, меня привлек этот мастер отчасти из-за большого ажиотажа вокруг него. Такой огромный ажиотаж должен был разочаровать, а некоторых уже разочаровал. Это особенно верно для тех, кто возлагает грандиозные надежды на то, чего может достичь искусственный интеллект (ИИ); или если вы смотрите «Черное зеркало», что оно может разрушить. Итак, это мое небольшое размышление/бред/проповедь предназначено для тех, кто очарован, но не понимает ИИ. Искусственный интеллект и машинное обучение. Что верно? Что неверно? Давайте разберемся! Являетесь ли вы просто любопытным зрителем или руководителем, которому нужно больше информации об ИИ для управления им, я расскажу вам о ландшафте науки о данных.

Начнем с хайпа. Хотя это и не невозможно, большинство футуристических заявлений о сверхъестественно человекоподобных машинах и автономных вещах, безусловно, далеко. Современный уровень техники сегодня слишком ограничен. Итак, позвольте мне поразмыслить и объяснить историю науки о данных и шумихи, ее природу и ограничения, а также практическое применение. Последняя часть невероятно полезна. Хотя машинное обучение (ML) не дожило до своей массовой шумихи, оно по-прежнему является мощным инструментом с приложениями, которые раскрывают огромную ценность. Просто послушайте различные оценки известных консультантов. PWC утверждает, что к 2030 году ИИ добавит мировой экономике 16 триллионов долларов. McKinsey говорит, что это будет 13 триллионов долларов. Это как иметь еще один Китай в мире.

Прежде чем углубиться в это, я хочу поделиться своим профилем. Как я уже упоминал, я только что закончил магистратуру в области бизнес-аналитики и интеллектуальных услуг, где я специализировался на бизнес-аналитике. По сути, как аналитик бизнес-аналитики, я чувак между бизнесменами и учеными данных. Я могу говорить на обоих языках, хотя и не могу претендовать на звание самого специализированного парня в комнате. Я не могу сказать, что я самый сообразительный финансист или самый умный специалист по данным. Вместо этого у меня есть широта знаний. Я по-прежнему могу кодировать модели машинного обучения (в R) и обрабатывать данные, одновременно будучи в состоянии понимать разговоры о бизнесе, экономике, дизайне услуг и т. д. (мой бакалавр был в области экономики и экономики бизнеса, где я специализируюсь на экономике и управлении информацией). Я все еще выпускник бизнес-школы. Моя сила заключается в понимании конвейера проектов данных и в том, как заставить их работать в бизнес-приложениях. Я получил степень бакалавра и магистра в Маастрихтском университете в Нидерландах, который гордится тем, что является бизнес-школой, аккредитованной Тройной Короной. Это означает, что ему удалось получить все три самые влиятельные организации по аккредитации бизнес-школ.

Теперь к хайпу. Ажиотаж вокруг ИИ не нов. По сути, это третья волна, первая была еще в 50-е годы. Схема всегда одна и та же: концепция становится популярной, люди слишком много спекулируют, затем осознают реальность и отключаются. Исторически сложилось так, что мы слишком оптимистично относимся к нашим технологиям и слишком упрощенно относимся к тому, что считается интеллектом.

Первое начало было в 1948 году, когда Алан Тьюринг создал первую программу, которая может играть в шахматы. В 1955 году впервые появился термин ИИ, а в 1958 году Фрэнк Розенблатт представил первую нейронную сеть — персептрон. Шумиха нарастала настолько, что даже американский флот был слишком взволнован. Они начали представлять себе компьютер, который может ходить, говорить, видеть, писать, воспроизводить себя и осознавать свое собственное существование. досягаемости, а эти ребята думали, что смогут добиться этого за два десятка лет, макс. Хотя им удалось создать первого чат-бота (ELIZA) и робота, способного к навигации, область в конечном итоге разочаровала, и к семидесятым годам ажиотаж исчез.

Восьмидесятые ненадолго возродили интерес, в основном из-за безумия вокруг стремительного роста японских технологий. Однако этот возобновившийся интерес длился не одно десятилетие.

Затем в 1996 году маленький компьютер под названием Deep Blue побеждает гроссмейстера в шахматы. Это положит начало снежному кому третьего ажиотажа вокруг ИИ, который сейчас находится в процессе угасания. Однако на этот раз у нас было достаточно причин для волнения, поскольку мы увидели настоящие демонстрации ИИ. В 2009 году Waymo стала первой фирмой, создавшей прототип беспилотного автомобиля (самоуправляемые автомобили — один из самых горячих источников ажиотажа вокруг ИИ. Подробнее об этом позже). К 2010 году компьютер Watson победил чемпиона в Jeopardy. 2011 вышел с Siri. В 2012 году мы видим скачки в области распознавания изображений. В 2016 году AlphaGo выиграла матч по го у гроссмейстера. И это только громкие дела. Десятилетия 2000-х и 2010-х породили множество приложений для ИИ.

Однако, будучи людьми, мы снова стали слишком оптимистичными (или слишком жадными?). Нам нужны были автомобили, которые управляют сами собой, и голосовые помощники, способные вести обычный разговор. Не то чтобы в этом нет ничего плохого. На самом деле такое мышление стимулирует инновации. Проблема начинается, когда люди и инвесторы слишком увлекаются шумихой. На создателей будет оказываться давление, чтобы поддерживать их интерес, делая громкие заявления, чтобы им не стало скучно и не закончился капитал. Это может нанести ущерб стабильному потоку финансирования, необходимому для создания чего-то стоящего. Это также имеет значение для руководителей, которые постоянно слышат о преимуществах науки о данных, но на самом деле не понимают, что это значит, что приводит к туманным ожиданиям. Это может привести к бесцельным инвестициям.

К счастью, ажиотаж утихает, поскольку фирмы, которые вкладывали деньги в проекты данных, терпят неудачу. Реальность такова, что ценность, раскрываемая данными, не будет иметь одинакового влияния на разные фирмы и отрасли. Я верю, что руководители все еще понимают силу данных, несмотря на угасающую шумиху. Во-первых, сейчас довольно стандартно (это означает, что вы уже отстали, если у вас его нет) использовать рекомендательные системы на основе машинного обучения для любого интернет-магазина или приложения для социальных сетей. Кроме того, люди все еще находят новые применения систем ИИ, от врачей, ищущих применение для диагностики заболеваний, до правительств (к лучшему или к худшему), применяющих его к выплатам по социальному обеспечению (Нидерланды), государственному надзору (Китай) и, возможно, больше.

Но давайте более подробно рассмотрим, почему именно шумиха привела к досадному краху великих мечтаний об ИИ. Чтобы понять почему, нужно знать, как правильно использовать силу данных.

Во время написания этого размышления я, видимо, стал слишком разговорчивым, чтобы мой черновик занимал 17 страниц. Это слишком долго, поэтому мне придется разделить это еще на две части: одна исследует природу моделей машинного обучения, а другая исследует природу бизнеса. Изучение машинного обучения разделено на три основные части: данные, модель и аппаратное обеспечение. Там я расскажу о том, что на самом деле происходит за шумным миром науки о данных. Он предназначен для объяснения концепций таким образом, чтобы любой мог понять идею. Считайте это учебником по науке о данных. Исследование, касающееся бизнеса, касается того, как правильно думать о проектах данных в деловом смысле. В нем перечислены советы, которые я узнал, чтобы быть полезными, когда дело доходит до применения данных к операциям и услугам. Я также добавил раздел, в котором обсуждается этическая ответственность, возникающая при работе с данными.

Поэтому, пожалуйста, не стесняйтесь читать по ссылкам ниже!

Природа машинного обучения

Природа бизнеса

Первоначально опубликовано на http://hardypm.wordpress.com 3 декабря 2020 г.