Сегодня наш собеседник - Гириш Палшикар. Гириш - главный научный сотрудник компании TCS Research and Innovation. Его исследовательские интересы лежат в таких областях, как машинное обучение, интеллектуальный анализ данных, обработка естественного языка и интеллектуальный анализ текста, а также теоретическая информатика. За свой огромный исследовательский вклад в 2012 году он был удостоен звания заслуженного ученого TCS.

Гириш также является приглашенным преподавателем Университета Пуны и Инженерного колледжа Пуны. Все подробности о курсах, которые он преподает, можно найти здесь. Гириш также является активным спикером, и многие из его презентаций можно найти здесь. Если вы занимаетесь исследованиями, возможно, вы не захотите пропустить его колоду Как читать исследовательскую работу. Если вы хотите узнать больше о Гирише, обязательно загляните на его сайт в Google.

Я хотел бы от всей души поблагодарить Гириша за то, что он нашел время для этого интервью. Я надеюсь, что это интервью послужит цели для улучшения сообществ специалистов по науке о данных и машинного обучения в целом :)

Интервью с Гиришем Палшикаром, главным научным сотрудником TCS Research and Innovation

Саяк: Привет, Гириш! Спасибо за интервью. Рад видеть вас здесь сегодня.

Гириш: Спасибо, что пригласили меня!

Саяк: Может быть, вы могли бы начать с того, чтобы представиться - какова ваша нынешняя работа и каковы ваши обязанности там?

Гириш: я выпускник ИИТ Бомбея и ИИТ Мадраса. С 1992 года я работаю в TCS Research, Пуна, Индия, где я сейчас главный научный сотрудник и возглавляю группу исследований и разработок в области машинного обучения. В 2012 году мне было присвоено звание Заслуженный ученый TCS. TCS Research - это научно-исследовательская организация в составе Tata Consultancy Services Limited - ведущей и крупной компании-разработчика программного обеспечения в Индии со штатом около 420 000 сотрудников. Опубликовал около 130 публикаций в международных журналах и на конференциях. Я также являюсь приглашенным лектором на факультете компьютерных наук Университета Савитрибай Фуле Пуны и Государственного инженерного колледжа Пуны (COEP). Мои области исследований включают машинное обучение, интеллектуальный анализ данных, интеллектуальный анализ текста, обработку естественного языка и их приложения в различных областях, включая обнаружение мошенничества, управление человеческими ресурсами (HR), образование, юриспруденцию и медицину.

Саяк: 27 долгих лет! Я уверен, что они были веселыми, полезными и интересными одновременно. Мне любопытно узнать, как вы заинтересовались наукой о данных и машинным обучением?

Гириш: я интересовался искусственным интеллектом (ИИ) еще со времен учебы в колледже. Изначально я работал с математической логикой, которая является частью классического искусственного интеллекта старой школы - представление знаний, вывод и т. Д. В то же время меня также интересовали природа и сложность человеческих языков и философия, особенно понимание эпистемологические вопросы: что такое знание? Как мы получаем знания? Как мы подтверждаем и пересматриваем знания? Как мы узнаем, что у нас действительно есть знания? Есть ли пределы тому, что можно знать? Таким образом, это был естественный переход к обработке естественного языка (NLP), которая создает системы, «понимающие» человеческие языки, и к машинному обучению (ML), которое создает алгоритмы, создающие знания! Хотя у машины есть много способов создавать знания, создание знаний из прошлых данных (индуктивное обучение) является наиболее хорошо изученным и наиболее полезным методом. Меня привлекли такие методы машинного обучения, основанные на данных, из-за моего сильного интереса к реальным приложениям ИИ.

Саяк: вопросы, которые вы задаете, действительно очень интересны и постоянно меняются. Кроме того, ваш путь в мире НЛП и машинного обучения имеет огромное значение. Когда вы только начинали заниматься машинным обучением, с какими проблемами вы столкнулись? Как вы их преодолели?

Гириш: было много технологических ограничений: медленное и компактное оборудование, связь с низкой пропускной способностью или неадекватная поддержка языков программирования для проблем AI / NLP / ML. Доступность корпоративных данных была проблемой. К счастью, ML / NLP были новыми, необработанными областями, и большое количество практических проблем просто требовало решений AI. Все, что я сделал, - это нашел и решил многие из них. Было удивительно видеть, как алгоритмы ML / NLP помогли решить многие реальные проблемы способами, которые ранее были непонятны. Исследования как в области НЛП, так и в области машинного обучения развивались очень быстро, и мне посчастливилось быть свидетелем и участвовать в их бурном росте.

Саяк: Интересно! На протяжении всей своей карьеры вы участвовали во многих исследовательских проектах. Хотели бы вы рассказать больше о некоторых из них, которые, по вашему мнению, являются краеугольным камнем?

Гириш: Я работал над многими исследовательскими проектами и опубликовал около 130 научных работ. Учитывая ограниченное пространство, я расскажу только о нескольких проектах («Я» здесь всегда означает «я и моя команда»). Мои исследования основаны на реальных приложениях, в которых ИИ может помочь.

Я серьезно отношусь к мошенничеству, мошенничеству, коррупции и отмыванию денег, потому что они воруют деньги, товары и услуги у людей. Я изучал мошенничества при торговле на рынке акций, такие как циркулярная торговля и манипулирование ценами, и понял, что не существует методов их обнаружения. Поэтому для этой цели я разработал несколько неконтролируемых алгоритмов машинного обучения. Я продолжаю работать над многими такими проблемами.

Я был очарован HR как дисциплиной, которая должна иметь дело с непредсказуемым человеческим поведением в самых разных организационных контекстах. Я понял, что многие HR-задачи не имеют поддержки искусственного интеллекта, что побудило меня разработать программу исследований по созданию алгоритмов ML / NLP для них: ответы на опросы моих сотрудников (текст и данные), чтобы получить представление о проблемах, с которыми они сталкиваются, текст оценки производительности и данные для получения информации для повышения их качества и эффективности, рекомендовать курсы производственного обучения, чтобы помочь сотрудникам повысить квалификацию и, среди прочего, прогнозировать убыль. Опубликовал около 40 статей по HR-аналитике.

Сейчас я работаю над извлечением «знаний» из документов по предметной области, таких как учебники истории, судебные решения, учебники по биомедицине и исследовательские работы. Чтобы дать представление, я построил алгоритмы НЛП, которые автоматически извлекают новое визуальное «сюжетное» представление, скажем, из главы о Наполеоне. Я использую его для нескольких целей, включая помощь студентам в понимании, составление экзаменационных вопросов и проверку ответов.

Саяк: Это действительно потрясающие исследовательские проекты. Все они по-своему полезны и эффективны. Спасибо, что поделились ими, Гириш. Эти области науки о данных и машинного обучения стремительно развиваются. Как вам удается отслеживать последние важные события?

Гириш: чтобы проводить исследования, нужно постоянно читать книги и статьи по мере их выхода. Я также преподаю в COEP и Университете Пуны, что заставляет организовывать материал интересным образом. Я провожу много семинаров и практикумов в рамках программы академического интерфейса TCS. Я также регулярно провожу презентации в нашем внутреннем «журнальном клубе», в каждой из которых обсуждается одна «интересная» исследовательская работа, объясняются детали и ее сильные стороны. Мне очень помогает посещение конференций, экспертных сессий, учебных пособий и даже курсов в Интернете (например, NPTEL).

Саяк: Это довольно исчерпывающая информация. Чтение книг и статей - это определенно то, к чему я могу подключиться в этом аспекте. Будучи практикующим, я часто сталкиваюсь с проблемой изучения новой концепции. Вы бы хотели поделиться своим подходом к этому процессу?

Гириш: для понимания концепций ML / NLP необходим обширный опыт в различных областях математики. Необходимо хорошее понимание вероятностей, статистики, случайных процессов, линейной алгебры, теории информации и кодирования, оптимизации, алгоритмов, теории сложности. Нужно постоянно учиться. Я часто читаю статьи с «прикладной» точкой зрения: как я могу это использовать? Чтение с учетом такого вопроса, рисование собственных диаграмм и наличие удобных примеров, на которых можно опробовать технику, о которой вы читаете, также очень помогают мне.

Саяк: Очень полезная информация, Гириш. Спасибо. Многим студентам очень трудно правильно проводить исследования в интересующей их области. Хотели бы вы поделиться своими мыслями по этому поводу?

Гириш: Сначала получите хотя бы минимальную дозу необходимого фона. Кроме того, имейте в виду приложение для исправления вашего контекста и ваших идей. Сначала напишите определение проблемы на 3–4 страницах, указав предысторию, мотивацию, проблемы, преимущества решения проблемы, формализацию проблемы и т. Д., Не беспокоясь о том, как решить проблему. Прочтите и представьте некоторые основные статьи в этой области. Добавьте 2-страничный обзор литературы, в котором резюмируйте (своими словами) 10–12 наиболее подходящих статей, критикуйте их методы за любые ограничения для решения вашей проблемы. Соберите соответствующие ресурсы (например, наборы данных, общедоступные реализации). Затем разработайте свое собственное решение на бумаге, развивая необходимую теорию, и убедитесь, почему оно работает лучше, чем соответствующие методы. Тщательно планируйте эксперименты и критерии оценки. Все это тщательно задокументируйте и представьте коллегам. Только после этого приступайте к реализации.

Саяк: Это очень полезно. Это определенно очень методично. Есть ли планы по созданию книги?

Гириш: Хм. Дайте-ка подумать.

Саяк: с нетерпением жду возможности прочитать вашу книгу, когда она будет опубликована! Есть какие-нибудь советы новичкам?

Гириш: знайте свои сильные и слабые стороны. Используйте свои сильные стороны. Учитесь + практикуйтесь, чтобы уменьшить свои слабые стороны. Мотивируйте себя более широким и долгосрочным контекстом (или вопросом), который вас сильно интересует. AI для искоренения бедности? AI для уменьшения голода? AI для справедливого общества? AI для уменьшения войн или социальных конфликтов? А я за совершенно новую музыку? Выбери свой бой! Конечно, у таких социальных проблем не будет чисто технологических решений, но ИИ, безусловно, может попытаться помочь. Так будет сделано много интересных открытий.

Саяк: Есть очень интересные и тревожные идеи. Большое спасибо, Гириш, за это интервью и за то, что поделился своими ценными идеями. Я надеюсь, что они будут очень полезны сообществу.

Гириш: Спасибо!

Резюме

Гириш - ветеран отрасли. Проработав в этой области более 25 лет, он обсудил много интересных идей, полезных идей и некоторых серьезных проблем. Рвение Гириша работать в очень сложных и эффективных областях, таких как обнаружение мошенничества, борьба с отмыванием денег и т. Д., Безусловно, очень вдохновляет и заставляет задуматься.

Надеюсь, вам понравилось читать это интервью. Следите за этим местом для следующего, и я надеюсь увидеть вас в ближайшее время. Здесь где можно найти все интервью, сделанные на данный момент.

Если вы хотите узнать обо мне больше, загляните на мой сайт.