Разговоры ИИ с поля

Я имел удовольствие работать с Шиладжей Рамачандрой в здании Facebook *8 до запуска умного динамика, продукта Portal. Я был очень впечатлен ее знаниями и лидерством в области умной камеры. Умная камера Portal — это камера с поддержкой искусственного интеллекта, которая распознает людей и может направлять фокус, когда пользователи перемещаются вокруг фокусного объектива. Подумайте об опыте видеозвонков кинематографического качества практически без каких-либо усилий со стороны пользователя!

Расшифровка нашего разговора:

Карен: Хорошо, отлично. Итак, для начала, я хочу поблагодарить вас за то, что поговорили со мной сегодня! Мне действительно любопытно понять, что вас интересует в ИИ? Расскажите мне о своих мыслях о том, что вам нравится в этом пространстве и что вы считаете особенно интересным.

Шиладжа: Да. Спасибо, что устроили этот звонок, чтобы мы могли поболтать!

Итак, отвечая на ваш вопрос, когда я работал в Yahoo — на самом деле более 10 лет назад — я как бы случайно увлекся ИИ/машинным обучением. Думаю, это было мое первое знакомство с ним. Было очень интересно увидеть, сколько различных способов мы можем показать результаты поиска пользователям, а также другие функции, такие как использование алгоритмов для спонсируемых поисковых списков и представление их пользователям. Это все в основном машинное обучение, потому что люди что-то вводят, а ваша цель — показать наиболее релевантные результаты. Было увлекательно видеть, что вы можете обрабатывать столько данных и придумывать эти алгоритмы машинного обучения. Итак, это было мое первое настоящее знакомство с ИИ.

Шиладжа: Позже, когда я перешел на Netflix, все это было связано с другим взглядом на ИИ. Так что речь шла о том, чтобы мы показывали пользователям более полезные фильмы и шоу, основываясь на множестве различных аспектов, на основе времени суток, на основе того, какой сегодня день недели, потому что люди склонны смотреть мультфильмы, и на самом деле беззаботные вещи субботним утром. Так зачем тебе, Охотник за разумом, показывать что-то сверхмощное субботним утром? Просто неприятно даже видеть такие вещи субботним утром, когда вы готовы что-то посмотреть, пока едите хлопья.

Мы, инженеры, никогда не сможем сесть и написать код, который удовлетворит 100 миллионам пользователей. Вместо этого именно здесь начинает проявляться настоящая сила ИИ.

Второй частью этого является аппаратное обеспечение, и только возможности того, что мы можем вычислить, увеличивается в геометрической прогрессии. Когда я пошел в школу, все это было теорией. Это были такие вещи, которые вы могли только вообразить, которые мы не могли на самом деле запрограммировать. Мы ничего не могли с этим поделать, кроме исследований и теории.

Шиладжа: Теперь, когда аппаратное обеспечение ускорилось, а затраты одновременно снизились, внезапно все это стало возможным. Поэтому так увлекательно видеть, как раньше, то, что раньше занимало неделю, мы делаем в режиме реального времени, с точки зрения результатов, показываем идеальные рекомендации и все такое.

Карен: Да, это отличный момент. Это определенно требует среды, которая позволяет выполнять вычисления и обработку.

Шиладжа: Да.

Карен: Аппаратное обеспечение играет огромную роль.

Шиладжа: Да.

Карен: Мы говорили о вашей увлекательной работе в Yahoo и Netflix, но я познакомилась с вами в Facebook и хотела бы услышать о вашей работе там и о том, как она связана к ИИ.

Шиладжа: Да, с Facebook я впервые работал над другим аспектом ИИ. Там, где раньше это классифицировалось как машинное обучение, там больше статистическое машинное обучение — подход «если-иначе», по большей части. В Facebook продукт использовал более глубокие нейронные сети, которые теперь больше похожи на ваши многомерные матричные вычисления, которые действительно стали возможными благодаря огромному количеству недорогой вычислительной мощности.

Теперь это позволяет обрабатывать изображения и видео в режиме реального времени, что было почти неслыханно 10 лет назад, а затем делать прогнозы на основе этого. Именно таким был мой опыт в Facebook, где вы смотрите видео в реальном времени и пытаетесь предсказать, кто находится на сцене и что они собираются делать дальше. И затем мы пытаемся сделать что-то на основе этой информации, что в данном случае заключалось в том, чтобы убедиться, что мы захватываем нужного человека, подставляем нужных людей, а также фиксируем все детали для создания кинематографического видеозвонка.

Таким образом, Facebook был действительно прекрасным примером того, как мы впервые взяли глубокое обучение и превратили его в продукт. Таким образом, для конечного пользователя это было почти искусством, где в конце концов мы вполне могли бы снять фильм. Например, если бы вы снимали реалити-шоу, это было бы самое красивое реалити-шоу, потому что без оператора оно просто следило бы, масштабировало, панорамировало и снимало все нужные вещи в нужное время.

Карен: Это потрясающе. Мне нравится эта ссылка. Это так хорошо.

Шиладжа: Да, это было такое прекрасное сочетание науки и искусства, которое сошлось воедино, и не совсем научно-фантастическое. волшебные очки или что-то в этом роде. Вам не нужно было ничего делать. Это просто случилось, и я думаю, что это было очень полезно, чтобы быть в состоянии сделать это. Я думаю, что одна из ссылок, как сказал бы Джейсон, один из моих коллег (Джейсон Харрисон), звучала так: Бабушка может использовать это, и ей не нужно ничего делать.

Карен: Да, именно так. Я знаю, это один из моих любимых продуктов, которые я видел, используя то, о чем вы говорили, это глубокое обучение, чтобы действительно превратить опыт. Думаю, конечный результат говорит сам за себя. Это просто прекрасный пример ИИ в продукте, который может использовать бабушка. Так что да, это действительно удивительно. И, как вы сказали, это определенно кинематографический опыт, и это замечательно.

Таким образом, я знаю, что иногда может быть очень сложно внедрить множество этих алгоритмов в продукт и заставить его работать 100% времени, и тому подобное. Что, по вашему мнению, можно улучшить?

Шиладжа: Таким образом, с чисто технической точки зрения, это всегда будет развивающаяся область на основе существующих продуктов или незначительных расширений уже существующих продуктов. Будь то с компьютерным зрением, многие фотографии сейчас на смартфонах — это компьютерное зрение, где они анализируют изображения в режиме реального времени и устраняют размытие, и это вещи, которые кажутся естественными, и, конечно, есть тем более очевидно, что происходит компьютерное зрение. Есть накладывающиеся фильтры, дающие вам кроличьи уши и все такое, что будет развиваться.

Это всегда будет развивающаяся форма, когда они будут пытаться добиться точности, близкой к 100%, но что-то где-то всегда будет терпеть неудачу. Такова природа ИИ прямо сейчас, и любой, кто думает, что сможет решить эту проблему на 100%, нас еще не достиг. И если кто-то утверждает, что опыт точен на 100%, я бы воспринял это с долей скептицизма, потому что что-то в этом утверждении не так.

Так что на самом деле, для всех продуктов, над которыми я работал, в каждой компании, в которой я участвовал, важным моментом во всем, что касалось машинного обучения и ИИ, было: «Это где-то у кого-то потерпит неудачу, и что мы должны делать?» делать, когда это не удается?» Это всегда было частью плана. Это как: «Это провалится. Даже не предполагайте. Даже не думайте, что это будет работать на 100% все время». В отличие от традиционного программирования, где вы знаете, что есть только пять способов добиться результата, с ИИ их миллион. Нет, как сотни миллионов способов. Так что где-то у кого-то это потерпит неудачу, и в конце концов он все равно должен быть изящным продуктом. Все проекты, над которыми я работал, всегда основывались на этом предположении.

С точки зрения развития в будущем, по мере появления новых вариантов использования, я думаю, было бы интересно посмотреть, насколько ИИ приближается к прогнозам и оказывается прав в 100% случаев. Думаю, если дойдет до 99%, например, в беспилотных автомобилях, будет интересно. Я думаю, что это будет следующий большой рубеж с точки зрения реального продвижения ИИ, с точки зрения вопроса: «Насколько близко мы должны быть к 100% точности?» Такие компании, как Tesla, уже приводят веские аргументы в пользу точки зрения: «Люди вызывают несчастные случаи, так почему бы ИИ не взять верх?» Ну, это один из способов взглянуть на это. Это с чисто технической точки зрения. Но ИИ с человеческой и этической точки зрения очень интересен. Я думаю, что это одна из вещей, на которых я специально сосредоточился в Facebook, потому что здесь мы пытались создать продукт, который просто должен был работать для всех. И нет никакого стандарта, определенного как такового.

Шиладжа: В последнее время было много разговоров, больше о рекламе и прочем, но с точки зрения компьютерного зрения, где это должно работать для всех. Цвет вашей кожи не должен мешать вам получить хороший опыт в разных условиях освещения. Как человек со светлой кожей под сверхбелым светом, компьютер вас не видит. Это правда, потому что вы не можете видеть… Свет есть свет, и он будет делать то, что должен… И точно так же для человека с более темной кожей в темных условиях компьютер не может… Изображение для компьютера — это, по сути, один пустой экран. Но тем не менее, наша технология должна быть достаточно развита, чтобы не различать, чтобы иметь возможность производить одинаковый эффект, один и тот же продукт для всех. И если вы думаете, что мы не можем, то, возможно, нам не следует отправлять эти продукты. И я думаю, что это разговор, который следует вести с точки зрения развития ИИ в будущем.

Шиладжа: Итак, теперь у нас есть ИИ, который больше похож на этот. И я действительно надеюсь с точки зрения… Я смотрю на это, в первую очередь, как мужчины будут строить… Как будто это по-прежнему преимущественно мужская индустрия по многим причинам. Но когда он исследует приложения, которые в основном ориентированы на женщин, например, приложение для примерки макияжа, они по-прежнему ориентированы на демографическую группу, на которой оно основано, а именно на белых мужчинах. Это правда. Как бы ужасно это ни звучало. Так что это буквально похоже на то, что они тестируют на более светлой коже. И так создается все приложение, его ИИ обучается на данных, то есть на вещах, с которыми люди знакомы. И я думаю, что это будет большой сдвиг, когда речь больше не идет о вещах, с которыми вы знакомы, а вам просто нужно взглянуть на корпус, который похож на матрицу, для которой ваша задача должна быть решена. Я думаю, что это большой сдвиг в сознании, который должен произойти.

Шиладжа: Например, когда я смотрю на приложения для примерки макияжа, они великолепны, потому что мне даже не нужно выходить на улицу. В смысле, я хотел делать покупки дома, просто дай мне все. И это похоже на: «Ну, это просто должно работать для моего тона кожи». И поэтому я ясно вижу разницу в том, что это большое улучшение и эволюция, которые действительно должны произойти, прежде чем появится ИИ.

Шиладжа: И то же измерение затем идет к… Оттенок кожи один, но это также затем превращается в размеры людей, потому что дети отличаются от взрослых. Вроде их пропорции совсем другие, чем у взрослых. Так мы тренируемся на пропорциях тела и пропорциях лица взрослых, а у детей, например, пропорции головы и тела — это одно и то же. Представьте, что ваша голова почти равна размеру вашего тела, потому что младенцы именно такие длинные и растут примерно до двух-трех лет. И после этого твоя голова меньше одной трети размера твоего тела. Так что для компьютера он должен знать все эти вещи. Как будто мы не усваиваем это как человеческие существа, но именно поэтому то, что работает для взрослых, не будет работать для… По мере того, как люди становятся меньше в размерах.

Шиладжа: То есть это должно работать для всех, когда вы создаете общие продукты, или мы должны иметь возможность сказать: «Нет, это работает только для определенных типов людей. Все остальные, идите разбирайтесь со своими вещами. Вы не думаете, что это самое лучшее, но, по крайней мере, это нужно называть таковым.

Карен: Это действительно отличный отзыв. Последнее, что я хотел бы обсудить с вами, — какие статьи, блоги, подкасты или книги вы рекомендуете? Что вы читаете или к каким организациям вы рекомендуете присоединиться или подписаться?

Шиладжа: Если говорить на высоком уровне, то Массачусетский технологический институт выпускает отличный информационный бюллетень по искусственному интеллекту, который основан на исследованиях и поступает из их лабораторий. Это отличный источник, потому что он поучителен, и они собирают информацию из нескольких университетов, так что это отличный способ посмотреть, что академические круги делают в отношении ИИ на всех доступных уровнях.

Недавно вышла пара замечательных книг, особенно написанных Кай-Фу Ли, который раньше работал в Microsoft, а затем вернулся в Китай, потому что правда в том, что Китай действительно доминирует в этой области. Мы не должны даже оспаривать это в данный момент. Китай применил совершенно иной подход к ИИ по сравнению с остальным миром, и они удвоили его.

Шиладжа: Книга Кай-Фу Ли Сверхдержавы ИИ: Китай, Силиконовая долина и новый мировой порядок очень интересна, потому что в ней показано, как Китай смотрит на проблемы, которые США и остальной мир, на самом деле не сильно сосредоточены. Например, они рассматривают, как можно использовать ИИ для стареющего населения с точки зрения возможности предсказывать здоровье и потребности. Потенциальное использование ИИ с точки зрения роботов, которые будут помогать вам по дому, и подобные вещи, которые будут перенесены, чтобы помочь всем остальным. Так что было интересно посмотреть, с их точки зрения, над чем они работают.

Карен: Да, определенно. Я знаю, что у меня есть книга Кай-Фу Ли, и я видел его на CBS 60 Minutes, и вы правы. Существует много данных, много перебора чисел с точки зрения ИИ в Китае. Мне любопытно посмотреть, каковы различия в том, какой ИИ разрабатывается в США, в Китае и в Африке. Какие технологии выйдут на первый план? Собираются ли США играть более творческую роль, или это похоже на наш ландшафт распознавания лиц, здесь он сильно отличается от Китая.

Шиладжа: Согласен, так что тут куча всего, а также мнения научных кругов по сравнению с отраслевыми. Если вы хотите понять базовые технологии и то, о чем идет речь, курс Эндрю Нг на Coursera — действительно хорошее место, чтобы разобраться во всем.

Шиладжа: Кроме того, есть ряд исследований, которые финансирует Disney. Конечно, есть обычные игроки, такие как Facebook, Amazon, Apple и Google, которые публикуют документы о том, что они делают и как они создают новые продукты. Я особенно нахожу Дисней интересным, потому что у них уже есть много ИИ в их тематических парках. На самом деле они намного опережают многие компании, и они делают потрясающие вещи, потому что они также используют множество технологий в своих фильмах, в своей 3D-анимации. На самом деле они финансируют множество исследований и университетов, но они также уже используют эти инструменты ИИ. На самом деле я слежу за их каналом на YouTube, где они публикуют много своих исследований.

Карен: О, круто. Я на самом деле этого не знал. Я слышал о материалах Coursera, и на самом деле я даже не думал о тематических парках Диснея в качестве ориентира для ИИ. Я так рада, что задала тебе этот вопрос.

Шиладжа: Да, они делают очень крутые вещи.

Карен: Я думаю, мы многое рассмотрели, но если говорить об уникальных продуктах и ИИ, которые уже используются, что вы думаете о разнообразии ИИ?

Шиладжа: я думаю, что с точки зрения разнообразия внутри ИИ, это одна из проблем, где это является более серьезной проблемой в том смысле, что на ее устранение потребуется время, но исправление дробовика заключается в том, чтобы убедиться, что, как минимум, данные функционально и точно репрезентативны.

Даже если конвейер для привлечения более разнообразных экспертов в эту область займет больше времени, на самом деле чрезвычайно важно обеспечить репрезентативность данных. Нет причин, по которым это нельзя исправить в краткосрочной перспективе. В большинстве случаев это просто сбор данных брут-кодом, который нужно делать, и нет никаких оправданий тому, чтобы не делать этого при создании алгоритмов для продуктов.

Карен: Точно. Что ж, я знаю, что мы с вами еще поговорим, надеюсь, скоро, и вы расскажете мне еще кое-что обо всех забавных вещах, над которыми вы работаете.

У вас есть эта удивительная перспектива. И поэтому я очень, очень благодарен за возможность поделиться этим со всеми.

В заключение большое спасибо Шиладже за то, что она согласилась обсудить с нами свой опыт женщины, работающей в сфере технологий и продуктов ИИ.

Опыт Шиладжи уникален и высоко ценится, и я благодарен ей за потраченное время и готовность поделиться своими взглядами.

Упомянутые статьи/книги/ресурсы:

https://www.amazon.com/AI-Superpowers-China-Silicon-Valley/dp/132854639X

https://www.coursera.org/courses?query=machine%20learning%20andrew%20ng

https://www.technologyreview.com/artificial-intelligence/

Разговоры ИИ с поля

Разговоры ИИ с поля

Упомянутые статьи/книги/ресурсы:

Вопросы по теме