Предлагаем вашему вниманию новую статью PlaceKode, созданную Утааном, клубом журналистики и отдыха при ABV - Индийском институте информационных технологий и менеджмента Гвалиора. У нас есть Радж Мехротра, который прошел стажировку, а затем был переведен в Optum и поделился с нами своими советами по развитию необходимых навыков и опытом прохождения собеседований.

Для начала, поздравляю с получением работы, мечта многих. Перейдя прямо к вопросам, каково это быть размещенным в Optum?

Когда вы попадаете в одну из крупнейших медицинских компаний мира, вы чувствуете себя прекрасно, вы действительно получаете некоторые привилегии гордиться этим. Было очень весело знакомиться с техническими отделами отрасли здравоохранения, наблюдать за достижениями и знать, что я играю определенную роль в помощи массам.

Как бы вы оценили свою уверенность в себе и подготовку в день собеседования?

На самом деле в тот же день у меня было интервью для Reliance Jio, и оно прошло хорошо, поэтому я тоже был настроен оптимистично. Еще до этого мне довелось получить предложение от стартапа, так что да, я был довольно уверен в себе и не был таким напряженным, как можно было бы ожидать.

Какой была неделя перед собеседованием? У вас был контрольный список для последней подготовки?

Нет ничего эффективнее рукописных заметок. Я уже довольно давно изучаю машинное обучение, и я подготовил заметки для всего, и я настоятельно рекомендую каждому делать рукописные заметки самостоятельно, делая заметки о том, что они изучали, поскольку просмотр видео требует много времени. времени, и за это время вы сможете пересмотреть другие концепции. Просмотр лекций за день до собеседования для пересмотра теоретических концепций - не лучший вариант.

Я стараюсь пересматривать все алгоритмы и классификации машинного обучения, регрессию, PCA без учителя и SVD, когда у меня есть время. Большинство студентов склонны пропускать части обучения без учителя, заявляя, что это не имеет отношения к собеседованию, но, по моему опыту, это просто заблуждение.

Необходимо иметь полное представление об удобных для новичков концепциях - логистической регрессии, до некоторых более продвинутых - концепциях случайного леса. Важно иметь базовые знания по следующим темам - Компьютерное зрение, НЛП и продвинутые - GAN, генеративные модели, автоэнкодер и т. Д.

Но по моему опыту, это не те вопросы, которые задают все. Это домены, которые вам нужно подготовить, если вы упомянули их в своем резюме.

Не могли бы вы вкратце рассказать нам о процессе собеседования?

Первоначально у них было два раунда собеседования, но некоторым студентам было предоставлено задание как часть процесса собеседования. Мне повезло, что я не подвергался этому.

Первый раунд был телефонным. Это продолжалось около полутора часов. Он спросил почти обо всем, что я упомянул в своем резюме. У меня был опыт работы в качестве стажера в стартапе, где мне нужно было обучить модель классифицировать фрагменты текста по временам их части обработки естественного языка [NLP]. Это началось с того, что я поделился своим опытом, а затем он начал перекрестные вопросы об альтернативных подходах к моей работе и выборе стеков и библиотек, Стэнфордского НЛП и spaCy, которые я использовал.

Я упомянул о моем бакалавре технических наук. Проект (BTP), ориентированный на использование GAN. Он был основан на конкурсе Kaggle. Он пошел узнать об используемом наборе данных, распределении, количестве изображений, их характере - сбалансированном или нет, и в случае последнего, как я удовлетворил требования. Он также спросил о различиях между классификациями с несколькими ярлыками и классификациями.

Различия между многоклассовой и многоклассовой классификациями: https://www.analyticsvidhya.com/blog/2017/08/introduction-to-multi-label-classification/

Он поинтересовался моделями, которые я использовал, а затем продолжил расспрашивать об архитектуре модели, ее оптимизации, используемых мною показателях и показателях f1. Я использовал набор данных IBM, который был доступен на Kaggle. Он продолжал задавать один вопрос за другим.

Какие функции вы использовали и почему? Как вы определили, какие функции важны, а какие нет? Чем вы оправдываете это, если данные дают инсайты, противоположные логически выведенным? Затем он попросил меня создать логистические итерации. Думаю, он хотел знать, разбираюсь ли я в математике. Затем он спросил, как работают виртуальные машины защиты и как выбирается гиперплоскость. Насколько важна скорость обучения? Что произойдет, если его изменить?

Точность против F1-Score: https://medium.com/analytics-vidhya/accuracy-vs-f1-score-6258237beca2

Второй тур был суровым. Это продолжалось почти 2 часа, и интервьюер спросил все, что мог. Любые вопросы, которые он мог сформулировать по пунктам, упомянутым в моем резюме, любой учебной программе, относящейся к GAN или функционированию генераторов и дискриминаторов; как их тренировать поочередно; как GAN используется для генерации / увеличения изображений, архитектура используемого генератора, эффекты увеличения / уменьшения вычислительных уровней в архитектуре.

Генеративные состязательные сети (GAN): https://towardsdatascience.com/understanding-generative-adversarial-networks-gans-cd6e4651a29

Кандидатам в науку о данных можно посоветовать досконально владеть хотя бы одним алгоритмом машинного обучения, потому что вопросы собеседования по машинному обучению, как правило, открыты, например: «Какой ваш любимый алгоритм?». И хотя этот вопрос может показаться наивным, он может испортить ваше интервью, потому что интервьюер выкапывает вопросы глубокой формы из любого ответа, который вы дадите.

Он хотел, чтобы кандидат тоже знал о развертывании, а у меня оказался проект на базе Android, поэтому тема разговора сместилась на это. Затем он спросил меня, как я разверну модель на Android, и судил обо мне по моему мыслительному процессу.

Следующая часть стала для меня неожиданностью, он попросил меня открыть мой профиль Kaggle на моем ноутбуке, экран был общим, и он мог смотреть на него; он пролистал раздел на вкладке «Блокноты» и попросил меня объяснить случайный проект, которого даже не было в моем резюме.

Это был не тот проект, в котором я разбирался, поэтому я просто с самого начала ответил на подробное объяснение, которое он, похоже, оценил. Среди всего этого он просил меня остановиться и объяснить какую-нибудь случайную строчку кода, а затем мы перешли к остальному. Помните, интервьюер может спросить все, что он считает уместным.

Вы только что упомянули, что ему был интересен ваш профиль на Kaggle, и он просмотрел его. По вашему опыту, какую роль в таком сценарии играет статистика в профиле [звание и количество медалей]?

Видите ли, Kaggle для науки о данных - это то же самое, что CodeChef для программирования. Статистика может иметь значение для критериев отбора, но если вы не сможете работать так хорошо, как говорит статистика, вас, тем не менее, отклонят. И в наши дни доверие к таким платформам является спорным, так что да, приятно иметь отличный профиль с множеством медалей на Kaggle, но одного этого недостаточно, чтобы взломать интервью.

Что вы могли бы посоветовать тем, кто хочет преобразовать своего стажера в штатного специалиста?

Большинство людей не понимают, что это во многом зависит от политики компании. Я знаю людей, которые действительно хорошо работали в своих компаниях, но до сих пор не получили PPO. Большинство компаний проводят отдельные собеседования для составления короткого списка стажеров, которым они назначили PPO. И чтобы добиться этого, усердно работайте. Конкуренция только обостряется, и этого уже не избежать. И вторым шагом будет умная работа, управление своим временем и постоянная связь с материалами, относящимися к интервью, в течение стажировки, чтобы вы были лучше подготовлены к собеседованиям с PPO.

Не могли бы вы рассказать нам об интернет-ресурсах, которые вы использовали, и о том, как извлечь из них максимальную пользу?

Начните с курса Эндрю Нг. Просто так делают все. И продолжайте это как минимум до 7 или 8 недели, прежде чем вы решите, что на данный момент закончили с ML. Кроме того, вам нужно будет смотреть его снова и снова, никто не смотрит весь этот контент и не достигает своего рода просветления. Пересмотр не должен вызывать стыда. Когда вы закончите с этим, я рекомендую вам прочитать Введение в статистическое обучение и некоторые главы Практическое машинное обучение с обучением SciKit, Keras и Tensorflow для ссылка. Нужно знать основы теории вероятностей и статистики. Я считаю, что того, что мы изучаем по инженерной математике на обычных уроках в колледже, достаточно.

Введение в статистическое обучение: https://statlearning.com/

Практическое машинное обучение с помощью SciKit, Keras и Tensorflow: https://github.com/yanshengjia/ml-road/blob/master/resources/Hands%20On%20Machine%20Learning%20with%20Scikit%20Learn%20and% 20TensorFlow.pdf

В своем проекте НЛП я в основном полагался на многочисленные сообщения в блогах, которые предлагал поиск в Google. В отношении науки о данных и аналитики Vidhya - это два веб-сайта, которые я предпочитаю. Я узнал о компьютерном зрении из курса специализации по глубокому обучению, доступного на Coursera. Чтение документации также оказывается полезным во многих случаях. В целом, хорошо владеть Python и SQL, алгоритмами машинного обучения и конвейером машинного обучения и, наконец, владеть специальными областями, такими как компьютерное зрение и обработка естественного языка.

Если бы вы назвали три основных вещи, которые вы узнали в ходе стажировки, что бы это было?

Первым будет Разоблачить. Из-за COVID у всех нас были удаленные стажировки, и это немного сгладило кривую обучения. Но, тем не менее, этот набег на корпоративную жизнь учит крошечным деталям того, как эта отрасль работает и выживает.

Второе - Профессиональное мастерство. То, как человек должен вести себя перед коллегами по работе, радикально отличается от привычной нам жизни в общежитии. Эффективное общение, оптимизация вашей работы в соответствии с полученными отзывами, быстрое обучение, чтобы не отставать, идеи, которые вы получаете от своих наставников, - все это создает унизительный опыт.

И последнее, безусловно, будет Повышение уверенности.

Считаете ли вы, что существует разница в количестве возможностей для студентов, заинтересованных в разработке программного обеспечения, и тех, кто занимается наукой о данных и машинным обучением?

Да, есть. Во время сезона стажировки практически не было компаний, ищущих энтузиастов машинного обучения, и лишь немногие предоставляли возможности для работы на полную ставку. Было бы разумно подать заявку за пределами университетского городка, чтобы получить лучшие возможности на определенных должностях, потому что уходить с работы только потому, что в кампусе нет рекрутеров, не совсем имеет смысла. Переключиться после того, как окунулись в корпоративные джунгли, тоже непросто.

Как вы сравниваете себя с версией себя 5-летней давности?

Прошедшее время оправдало бы драматические изменения, которые вы бы увидели во мне, если бы я стояла рядом с версией себя на 5 лет моложе. У меня определенно больше уверенности в себе, и теперь я гораздо более адаптируюсь как в профессиональном, так и в личном плане. Сложно подвести итог, 5 лет, о которых идет речь, были всей моей студенческой жизнью. Воздействие, опыт, рост, который человек ощущает внутри, я бы сказал, что последние 5 лет сформировали меня таким, какой я есть, и я почти уверен, что большинство моих товарищей по команде будут чувствовать то же самое.

Беседовал: Шивам Ядав

Координатор: Рапарти Саи Мадхури