Эта статья была первоначально написана Jakub Czakon и размещена в блоге Neptune.

Некоторое время назад у меня была возможность взять интервью у великого исследователя искусственного интеллекта и главного научного сотрудника по искусственному интеллекту в Линдере, Араша Ажанда.

Мы говорили о:

  • Технология искусственного интеллекта, стоящая за его работой в Lindera
  • Его карьерный путь
  • Каково быть ученым, ориентированным на исследования
  • Как стать хорошим лидером
  • Почему важно подходить к исследованиям ИИ с точки зрения бизнеса

Вот полное видео нашего разговора:

Вы можете посмотреть видео, чтобы увидеть необработанный контент.

Вот, с другой стороны, краткое изложение нашего разговора. Далее следует не стенограмма 1–1, а скорее очищенная, структурированная и перефразированная ее версия.

Чем вы занимаетесь в Lindera и что строите вместе со своей командой?

Что мы делаем в Lindera, с точки зрения искусственного интеллекта, так это используем эти очень интересные и новые методы, которые называются технологиями искусственного интеллекта в медицинских технологиях. Наша основная цель — использовать алгоритмы компьютерного зрения для обнаружения человеческих скелетов с целью анализа ходьбы. Итак, мы берем видео пожилых людей и извлекаем из этих двухмерных видеоизображений скелет в трехмерном пространстве, а затем пытаемся рассчитать параметры ходьбы. Например, длина шага, время шага, скорость ходьбы. Это потому, что мы знаем, с медицинской точки зрения, что эти параметры особенно важны для оценки медицинских расстройств, таких как распространенность падений пожилых людей.

Можете ли вы рассказать нам немного больше о том, как это работает?

Конечно. Базовая технология на самом деле достаточно универсальна. Это не конкретно для какого-либо заболевания или группы заболеваний. Он просто снимает видео и извлекает координаты суставов. Представьте, что у вас есть человеческий скелет, у вас есть отдельные суставы, такие как колено, лодыжка, плечо и т. д., и вы хотите получить координаты этих суставов во времени. Например, когда у вас есть суставы стопы с течением времени, когда люди ходят, вы можете использовать эти координаты для расчета других параметров. Так что оттуда, это просто универсальный.

Вы можете использовать эту технологию для ухода за пожилыми людьми, вы можете использовать ее для спорта, вы можете использовать ее для реабилитации. Ограничений нет, это довольно универсально.

В его основе лежит этот трекер скелетов, а кроме того, мы можем просто создать инструмент, который берет эти координаты, вычисляет некоторые другие вещи и дает рекомендации людям. Например, когда мы обнаруживаем, что у человека что-то не так с походкой, то можем просто рассчитать какие-то параметры и порекомендовать конкретную физиотерапию. Таким образом, инструменты извлечения параметров и рекомендаций построены на основе этой базовой технологии.

Насколько велика ваша команда и как вы организованы?

Вся команда в Линдере на данный момент составляет около 30 человек. Он состоит из нескольких отдельных команд.

  • У нас есть команда по продажам вместе с генеральным и финансовым директором, которые пытаются продвигать технологии наших продуктов для клиентов.
  • У нас есть команда по работе с клиентами. Ключевые члены команды по работе с клиентами приходят к клиентам, представляют продукты на месте клиента, предоставляют помощь и обслуживание и пытаются получить их отзывы, чтобы мы могли улучшить наш продукт.
  • Затем у нас есть ИТ-команда, которая разрабатывает интерфейсную и серверную системы, а также приложение. И затем в основе лежит наука о данных, которая на самом деле является моей областью ответственности.
  • Моя команда на данный момент, вместе со мной, состоит из шести человек, и мы разрабатываем эти основные технологии искусственного интеллекта. Разрабатываем алгоритмы алгоритмов компьютерного зрения, рекомендации, а также расчет параметров походки.

Наше основное внимание в науке о данных сосредоточено как на исследованиях, так и на разработках.

Когда я сравниваю ее с другими отраслевыми компаниями и с моим временем в университете, я бы сказал, что наука о данных в Lindera гораздо больше ориентирована на исследования, чем в других компаниях. Это означает, что у нас обычно нет технологии или того, что стоит за технологией с самого начала. Перед этим мы должны выяснить, что там есть, мы должны прочитать публикацию, чтобы исследовать передний край исследований и попытаться извлечь важные для нас знания. А затем решить, какая часть этого может быть использована для нас, и как мы могли бы развить это в наших системах.

Каким был ваш путь к этому моменту? Как вы стали специалистом по данным и, в конце концов, главным исследователем?

Мое образование связано с физикой. Я бы сказал, что мой интерес к физике начался с моего любопытства понять природу, понять, каковы скрытые причины природных явлений. И как раз перед тем, как я начал учиться, я очень интересовался вселенной и космологией. Еще в школе я прочитал много книг по космологии и хотел пойти на астрофизику. Это была моя ранняя, скажем так, любовь. И, в конце концов, я начал изучать физику. Это был очень хороший шаг, потому что у нас был очень хороший факультет астрофизики, а также очень хороший профессор. Мы просто проводили исследования с очень философской точки зрения. И это тоже мне было очень интересно.

В конце концов, во время учебы в университете меня больше заинтересовала биофизика и самоорганизация сложных биологических систем.

И мне было очень любопытно понять, как, например, эти очень сложные системы в биологии, такие как мы, люди, или даже более мелкие существа, такие как насекомые, способны управлять этим хаосом вокруг.

Как они способны жить в этой хаотичной системе, получать энергию и превращать ее в живую. Этот принцип самоорганизации и биологической системы был очень интересен. Итак, я действительно занялся этой областью и защитил кандидатскую диссертацию в области статистической физики. Я сосредоточился на сложных системах и попытался понять формирование паттернов в этих сложных системах. Вы везде найдете сложные системы — какие-то универсальные узоры, спиральные волны. Спиралевидные волны можно найти, например, в человеческом мозгу, человеческом сердце, а также в колониях насекомых, которые пытаются организовать насекомых с помощью волн. И волны эти в основном спиралевидные. И во время работы над диссертацией я изучал формирование этих спиралевидных волн в химических системах, чтобы попытаться понять это оттуда и понять это специально для других систем.

И как вы перешли от этого к работе в Lindera?

Я защитил докторскую диссертацию, а затем в течение двух лет работал над докторской диссертацией. А в постдоке я провел очень интересное исследование образования кристаллов, которые не являются органическими (то есть не живыми системами), но все же напоминают кристаллы живых систем. Они имеют кривизну, но остаются неорганическими. Я провел несколько экспериментов и моделирования на этих кристаллах. А пока я просто думал о том, чем буду заниматься в будущем. Пойду ли я в академию? Или я выйду из академии и пойду в промышленность? И моим решением было пойти в индустрию, потому что я увидел больше возможностей для проведения исследований. Меня очень заинтересовала тематика искусственного интеллекта.

Одной из систем, которая заинтересовала меня, может быть, больше всего, был человеческий мозг.

Поэтому мне было очень любопытно понять, как возникает сознание в человеческом мозгу. Как мы можем просто выводить знания из мира с помощью этого органа? С другой стороны, в последние годы я заинтересовался искусственным интеллектом, на который в некотором смысле повлияла нейронаука. Я предполагаю, что моя главная мотивация для работы в отрасли — это понимание связи между оригинальной нейронаукой и ИИ.

Вы нашли ссылку или только вдохновение?

Сначала я нашел вдохновение, но все больше и больше последних исследований, в том числе в области общего искусственного интеллекта, пытаются найти мост между этими двумя играми. Так что все началось с вдохновения, но теперь все больше и больше людей видят, что искусственные нейронные сети вдохновлены специализированными алгоритмами для обнаружения закономерностей и данных. Но она не говорит нам о причинно-следственных связях, связях между этими разными явлениями.

Поэтому все больше и больше людей пытаются объединить эти искусственные нейронные сети с другими областями исследований ИИ.

Одним из примеров другой области исследований ИИ могут быть вероятностные модели. Существует отдельная область байесовской гипотезы мозга в нейронауке, которая строится на том принципе, что мозг в некотором смысле является своего рода великой байесовской машиной, которая через органы чувств получает входные данные из окружающей среды и пытается моделировать это. вход во внутренние модели. Так что мы просто пытаемся соответствовать тому, что видим или слышим.

Над чем вы работали, когда ушли из университета?

Когда я закончил университет, я сначала начал работать специалистом по данным в другой компании. И моя повседневная работа сводилась к прогнозному моделированию, аналитическому моделированию в области электронного спорта. У киберспортивных команд есть чемпионаты, и продукты компании Dojo Madness, где я работал специалистом по данным, должны были разрабатывать модели для прогнозирования результатов киберспортивных игр. Через какое-то время я просто ушел оттуда и начал работать здесь, в Lindera. Это было к ноябрю 2018 года. Я покинул университет к апрелю 2018 года. Тогда я сразу начал заниматься в Dojo Madness, а в ноябре — в Линдере.

Я начал работать в Lindera, потому что работа с данными здесь, в Lindera, гораздо больше напоминает мою работу в университете.

Это скорее чтение научных публикаций в этой области, чтобы эффективно извлекать знания и понимать их. Просто чтобы сразу увидеть, в каком направлении мы можем двигаться с этими научными знаниями, которые там есть, и как их использовать для нас.

Как выглядит ваш обычный день?

Одна часть наверняка, чтение новых исследований. Поэтому я разработал своего рода систему, в которой я собираю исследовательские работы и составляю план их прочтения. Затем я эффективно извлекаю из этого знания и записываю своего рода документацию того, что я узнал.

Является ли это своего рода общекомандной стратегией?

Мы делаем всю разработку в стиле Канбан. У нас есть билеты на классическую разработку, и мы начали делать это в каком-то смысле и для исследовательской части. Члены моей команды, которые также занимаются исследованиями, стараются читать и тестировать все, что есть в какой-то конкретной статье, и составлять документацию. Мы пишем это прямо в этих канбан-тикетах. Таким образом, мы можем увидеть, в каком состоянии находятся исследования, что некоторые из нас уже выяснили, в каких областях нам не следует идти дальше.

Это наша идея на данный момент, и мы итеративно развиваем этот метод. Мы должны пересматривать ее каждую неделю, смотреть, работает ли она, и когда она действительно работает, как мы могли бы использовать эту технологию.

Каковы другие важные аспекты вашей повседневной деятельности?

Другая важная часть — это, конечно, развитие. Когда мы решили пойти дальше в одной конкретной области, мы обнаружили, что этот документ хорош и многообещающ, и мы должны развивать его. Мы проверяем, есть ли там код, и кто-то из команды тестирует этот код, пытается его разработать, исследовать полученные результаты и документировать их. И тогда это служит своего рода первым доказательством того или иного инструмента или алгоритма. Позже мы можем решить, поместим ли мы его в нашу производственную систему. Это область прикладной разработки, и я тоже в ней. Поэтому я в основном занимаюсь исследованиями, но также стараюсь разрабатывать определенные области и код.

Для главных должностей по науке о данных огромная часть работы связана с общением с бизнесом и обеспечением людей инфраструктурой, доступом к данным или юридической информации. Это и ваш случай?

да. Я работал штатным специалистом по данным в Lindera в течение одного года, а после этого у меня был своего рода переходный период (2–3 месяца) до главного ИИ. За это время я постепенно отошел от этой части работы, связанной с исследованиями и разработками. Я постепенно передал свои задачи в этих областях членам моей команды и взял на себя общее стратегическое развитие и коммуникацию. Так что я своего рода связующее звено между командой специалистов по данным, бизнесом и клиентами.

Я своего рода связующее звено между командой специалистов по обработке и анализу данных, бизнесом и клиентами.

Было ли что-то неожиданное для вас при переходе от роли специалиста по данным к управляющему специалисту по данным?

Интересно то, что это не было неожиданностью для меня, потому что я пришел из области физики, где большинство людей получают докторскую степень в некоторых исследовательских группах. Вы, естественно, в какой-то момент занимаетесь там каким-то управлением. Вы должны консультировать и управлять, например, магистрантами и другими студентами, которые также пытаются развивать исследовательские идеи. С этой точки зрения для меня это было не ново. И что также помогло мне, так это год назад в Lindera, когда я работал специалистом по данным и получил много советов от бывшего начальника и высшего руководства.

Перед тем, как я занял этот главный пост, я чувствовал какое-то беспокойство, мне было интересно, как это будет продолжаться и смогу ли я это сделать. Но с того момента, как я вмешался, внутри меня и моего мозга произошел своего рода переключатель, и я знал, что могу это сделать.

У меня возникло ощущение, что мне и моему персонажу идеально подходит руководство этой командой, консультирование, выслушивание их идей и понимание их сильных сторон.

Чтобы понять, как я могу использовать их сильные стороны для науки о данных и Lindera.

Как вы помогаете людям совершенствоваться в некоторых областях? Как вы поощряете людей быть лучшими в себе?

Есть два направления — soft skills и hard skills. Интересно то, что у меня сложилось впечатление, что более нужные навыки — это soft skills. Потому что сложные навыки, такие как исследовательские способности, а также навыки разработки и программирования, являются своего рода мастерством. То, чему ты учишься за время в университете, а после, это просто мастерство, которым ты должен заниматься какое-то время. Тогда вы можете это сделать. Для руководящей должности гибкие навыки являются важной частью. Например, умение внимательно слушать.

Вы должны слушать членов команды и видеть, как они передают идею, как они сообщают эти идеи изо дня в день и что они чувствуют, когда сообщают об этом. Заставьте их чувствовать себя ценными. Дайте им возможность и пространство для развития идей и донести их до вас. Вы ловите идеи, а затем пытаетесь интегрировать их в общую стратегию вашей команды, а также компании. Итак, у вас есть конкретные ключевые цели компании. Вы сами решаете, в какой сфере вам развиваться.

Дайте вашей команде пространство для разработки идей и доведения их до вас.

Кроме того, вы должны заметить, что этот член команды очень сосредоточен на исследованиях. Он или она отлично разбирается в исследованиях и любит читать статьи и извлекать знания. Хороший лидер сразу за вами, а также проталкивает свои знания в команду.

Есть ли другие навыки, которые, по вашему мнению, имеют решающее значение для роли лидера в этом очень исследовательском мире науки о данных?

Как обычный специалист по данным, вы выполняете свои задачи ежедневно или еженедельно, заканчиваете их, а затем документируете свое решение, и все в порядке. Но с позиции лидера вы должны привнести еще и какую-то способность к предвидению. Есть требования от клиентов и бизнеса. Таким образом, у вас есть временные рамки, чтобы доставить вещи клиенту. Вы должны быть в состоянии понять, в чем сила вашей команды, что они могут сделать, если это временное окно выполнимо. Это, пожалуй, одна из самых сложных вещей, и я не могу точно сказать, что я на ней. Так что время покажет, правильно ли я поступил.

Мы называем это своего рода интеллектом принятия решений, который является новой дисциплиной в области науки о данных (некоторые называют это машинным обучением++ или наукой о данных++), которая просто смотрит на все вещи с другой точки зрения.

Вместо того, чтобы ставить данные и ИИ на первое место, нужно начинать с таких вопросов, как «В чем проблема и какие решения должны быть приняты со стороны бизнеса и клиентов?»

Какие вещи, по вашему мнению, сейчас были решающими для вас, чтобы научиться прогрессировать в этой области?

Я думаю, что главное — это коммуникативная часть. Когда вы учитесь в университете, вы в основном отвечаете за свою работу. Ты можешь целый год проводить какие-то исследования, а потом писать об этом, и тогда у тебя не будет других обязанностей. Однако в большинстве компаний вам приходится ежедневно учиться сообщать о лучших решениях и идеях.

Когда я начинал как специалист по данным, как перфекционист, я неделю занимался исследованием, чтобы решить одну конкретную проблему, потому что у меня сложилось впечатление, что я должен это сделать. Но, в конце концов, это не было серьезной проблемой. Я потерял много времени на микро-исследования и микро-улучшения, в то время как основные вещи были не такими. Мне просто нужно было заставить себя расставить приоритеты в работе.

Как вы подошли к этому?

Книги были полезны — я читал несколько книг об Agile-программировании, некоторые о том, как расставлять приоритеты в задачах. Но я думаю, что больше всего мне помогло общение с другими людьми, у которых был такой опыт. Мне пришлось избавиться от этого беспокойства, связанного с мыслью, что я должен быть совершенным, и начать просить о помощи. Звучит очень тривиально, но это, пожалуй, одна из самых сложных вещей. Помня, что я не обязан решать все проблемы в одиночку.

А также, с точки зрения руководства, очень важно создать у вашей команды впечатление, что они всегда могут прийти к вам или другим членам команды и попросить о помощи. Рецепт катастрофы — когда в команде есть некая конкурентная среда. Поэтому вы должны показать своей команде, что все они могут работать вместе.

Есть ли у вас какая-либо методология или система, которая способствует обсуждению и обмену помощью в вашей команде?

Хотя бы раз в месяц, а то и чаще, я стараюсь поговорить с каждым членом команды один на один и спросить, как у них дела с работой, все ли в порядке, есть ли у них проблемы. Я делаю шаг назад и позволяю им говорить. Может быть, также скажите им, если у них есть определенные проблемы, сдерживающие их, кто из членов команды хорош в этом. Чтобы они работали вместе.

Другое дело — передача знаний, как с точки зрения науки о данных, так и с точки зрения Lindera.

Какие три совета вы бы дали специалистам по данным, младшим или обычным, о том, как продвинуться по карьерной лестнице и получить лучший опыт?

  • Во-первых, проанализируйте компанию в целом, а также науку о данных. Внимательно изучите структуру команды. Какой лидер в науке о данных? Дают ли они вам пространство для совершенствования? Есть ли люди, разносторонние в своем опыте? Как они относятся к вам и другим членам команды?
  • Следующий важный совет, который я бы дал специалистам по обработке и анализу данных, таким как я из области математики или физики, пройти интенсивные курсы по сложным навыкам, например специальные курсы по программированию. Свободное владение ремеслом — архитектурный дизайн, а также библиотеки очень помогают. Это как говорить на языке, который позволяет вам лучше общаться с людьми. Когда вы очень хорошо владеете мастерством, у вашего мозга будет свобода творить. Я узнал, например, что, когда у меня не было этого мастерства, я терял много времени и способности к творчеству.
  • Следующий важный совет — также посмотреть на компанию и ее среду обучения. Предоставляют ли они вам пространство для обучения и роста, или это просто то, что я называю, больше инженерии данных, просто проталкивание данных.
  • Наконец, еще один совет, связанный с первым, — проанализируйте структуру команды. Когда в команде есть дата-инженеры, а может быть, и несколько DevOps, это дает специалистам по данным огромную свободу.

Есть ли книги, ресурсы, блоги или подкасты, которые вы бы порекомендовали?

Одна вещь, которую я могу порекомендовать наверняка, вероятно, большинство специалистов по данным, которые на самом деле являются практиками, уже знают об этом, — это блог Medium и блог Towards Data Science (который является частью Medium). С прошлого года я решил заплатить за членство в Medium, и мне это очень нравится. Стараюсь читать интересные статьи о новинках.

Также книги – лично для меня наиболее ценны книги общего характера, а не специализированные. Общие книги по искусственному интеллекту, которые больше касаются философии искусственного интеллекта и нейронауки.

Хорошо сделать шаг назад и почитать что-нибудь еще или сделать что-то еще, прогуляться и послушать музыку, например, а потом вернуться, и вдруг проблема решится сама собой.

Есть ли какое-то сообщение, которое вы хотите оставить нашим слушателям?;

Я думаю, что главное сообщение, которое я могу передать слушателям и зрителям, которые задаются вопросом, стоит ли им идти в область ИИ, заключается в том, что сейчас самое подходящее время, чтобы быть здесь. У меня сложилось впечатление, что в ближайшие год-пять серьезные улучшения произойдут именно в каком-то искусственном общем интеллекте. Сочетание нашего текущего ИИ с другими областями науки приведет к серьезным улучшениям.

Интересные статьи и ресурсы, которыми поделился Араш Ажанд

Вот кое-что о Zero-Shot Learning (ZSL):

  1. Вводная статья о ZSL и его приложениях: https://towardsdatascience.com/applications-of-zero-shot-learning-f65bb232963f Обучение с нулевым выстрелом относится к конкретному варианту использования машинного обучения. (и, следовательно, глубокое обучение), где вы хотите, чтобы модель классифицировала данные на основе очень небольшого количества или даже без помеченного примера, что означает классификацию на лету.
  2. Еще одна статья об одном из последних исследований: https://medium.com/@alitech_2017/from-zero-to-hero-shaking-up-the-field-of-zero-shot-learning-c43208f71332 zero-shot обучение относится к процессу, посредством которого машина учится распознавать объекты на изображении без каких-либо помеченных обучающих данных, помогающих в классификации.
  3. Исследовательская группа Макса Планка, работающая над ZSL, с одними из лучших работ в этой области: https://www.mpi-inf.mpg.de/departments/computer-vision-and-machine-learning/research/zero-shot- обучение/нулевой выстрел-обучение-хорошему-плохому-и-уродливому/
  4. … и одна из их лучших статей:
    https://arxiv.org/pdf/1903.10132.pdf

Введение в область принятия решений (наука о данных плюс плюс):

  1. Вступительная статья Кэсси Козырковой (главный специалист по анализу решений в Google): https://towardsdatascience.com/introduction-to-decision-intelligence-5d147ddab767 Любопытно узнать, что общего между психологией избегания львов в саванне и ответственное руководство ИИ и проблемы проектирования хранилищ данных? Добро пожаловать в систему принятия решений!
  2. Беседа Кэсси Козырьковой на тему: https://www.youtube.com/watch?v=bCjMhZZYlP4
  3. Статья в блоге Кэсси Козырков Что такое наука о данных? https://hackernoon.com/what-on-earth-is-data-science-eb1237d8cb37

Новая теория для лучшего понимания глубокого обучения в нейронных сетях, основанная на классической теории информации Шеннона и названная теорией глубокого обучения «Информационное узкое место»:

  1. Статья в журнале Quanta Magazine об этом: https://www.quantamagazine.org/new-theory-cracks-open-the-black-box-of-deep-learning-20170921/ Новая идея под названием «информационное узкое место помогает объяснить загадочный успех современных алгоритмов искусственного интеллекта, а также может объяснить, как человеческий мозг обучается.
  2. Моя собственная статья в блоге о теории узких мест в информации, недавно написанная как первая статья нашего собственного блога Lindera AI: Взгляд в черный ящик — теоретико-информационный подход к пониманию глубокого обучения. https://www.lindera.de/2020/03/05/a-view-into-the-black-box-an-information-theoretic-approach-to-understand-deep-learning/

Серия очень интересных статей Мануэля Бреннера для СМИ с точки зрения нейронауки:

  1. Статья в блоге Как мы можем учиться у мозга, чтобы узнать, как мозг учится: https://towardsdatascience.com/how-we-can-learn-from-the-brain-to-learn-how-the-brain -узнает-2b81286a1a7b
  2. Статья в блоге Почему интеллект может быть проще, чем мы думаем: https://towardsdatascience.com/why-intelligence-might-be-simpler-than-we-think-1d3d7feb5d34
  3. Статья в блоге Термодинамика свободы воли: https://medium.com/@manuel_brenner/the-thermodynamics-of-free-will-940cacd02401
  4. Статья в блоге Байесовская гипотеза мозга: https://towardsdatascience.com/the-bayesian-brain-hypothesis-35b98847d331
  5. Статья в блоге Геометрия мысли: https://towardsdatascience.com/the-geometry-of-thought-700047775956

И последнее, но не менее важное: работа профессора Карла Фристона.

Возможно, один из самых известных нейробиологов того времени, разработавший принцип свободной энергии как движущую силу человеческого разума и мышления. Некоторые из его работ также были представлены в вышеупомянутых статьях Мануэля Бреннера. Но вот еще одна его статья об Эоне: Математика разума-времени — Сознание — это не вещь, а процесс вывода но-процесс-вывода».

Хотели бы вы прочитать больше интервью с вдохновляющими людьми из индустрии машинного обучения? Проверьте эти сообщения:

Эта статья изначально была написана Jakub Czakon и размещена в блоге Neptune. Там вы можете найти более подробные статьи для специалистов по машинному обучению.