Машинное обучение, Карьера

Мой опыт стажировки по машинному обучению - Часть 1

В этот раз в прошлом году у меня была пара месяцев стажировки по машинному обучению. О своем опыте до стажировки я рассказал в предыдущем посте. В этом посте обсуждается моя первая неделя и некоторые проблемы, с которыми я столкнулся в течение оставшейся части стажировки.

Первая неделя

По моему опыту, первая неделя любой новой роли - это понимание текущих процессов и используемых инструментов. В моем случае инструменты и процессы все еще внедрялись, и не было ничего формального.

Если вы можете спросить об этом перед тем, как начать, я бы порекомендовал вам это сделать! Я предполагаю, что некоторые инструменты и пакеты (которые я перечисляю ниже) могут быть очевидны в ретроспективе, но нет ничего плохого в том, чтобы спросить, не уверены ли вы или хотели бы начать обучение раньше.

Мне дали список вещей, на которые я мог бы начать смотреть и с чем нужно было бы ознакомиться, а также некоторые проектные предложения, с которыми я должен был участвовать. Примеры некоторых инструментов и пакетов: PyTorch, Ray Tune, Dash, Linux и Vim. Мне стало ясно, что еще до того, как я начал знакомиться с этим списком, мне нужно было снова научиться учиться в гораздо более быстрой среде.

На следующей неделе моя коллега по той же команде вернулась из отпуска и поделилась своими записями о своей первой неделе. Это было СУПЕР ценно, я не только узнал, как учатся другие, но и узнал некоторые вещи, которые я пропустил. Мне действительно пришлось сначала перевести заметки моих коллег с испанского на английский, добавив к списку вещей, которые я изучал. Это была испанская компания, и незадолго до начала карантина у меня появилась возможность поехать в Мадрид со своей командой. Так что перевод заметок моего коллеги оказался более полезным, чем я мог подумать в то время.

Команда AI, частью которой я был, состояла только из меня, моего коллеги и моего менеджера в течение первых 6 месяцев. За последние 3 месяца к нам присоединились еще 2 коллеги, и так же, как чтение заметок моего коллеги было очень ценно, так и понимание того, как другие люди вписываются в команду. Например, прочитать всю кодовую базу, чтобы понять или сделать комментарии.

Вызовы

Самая большая проблема, с которой, я уверен, каждый проходит, - это синдром самозванца. Некоторые вещи, которые мои коллеги сделали в течение своей первой недели, должны были быть для меня очевидными, но я чувствовал себя слишком самозванцем, чтобы последовать их примеру. Я всегда думал, что могу оказать лишь небольшое влияние, но на самом деле останавливался только я. Мне было очень полезно учиться у коллег, а участие в таких мероприятиях, как ревью кода, действительно помогло мне преодолеть синдром самозванца.

Я также сыграл жертву эффекта Даннинга-Крюгера, даже после того, как узнал, что это такое. Я определенно компенсировал это, пройдя множество онлайн-курсов, которые были бы полезны ... за исключением того, что я недостаточно применял то, что изучал. В этом мне помогало то, что мой менеджер всегда советовал мне выделять немного времени в течение рабочего дня каждый день для обучения и настраивать учетную запись кодовых войн для британского партнера компании. Это очень весело, и теперь я призываю к этому и других.

Если вы только изучили Python и хотите лучше справляться с этими проблемами, а также пытаетесь их решить и не ждете, я настоятельно рекомендую этот Курс по структурам данных и алгоритмам от Jovian. Этот курс также побуждает вас опробовать задачи на LeetCode.

Таких сайтов очень много, чтобы попрактиковаться в программировании. Я понял, что не успел усвоить основы достаточно рано, но я даже не знал, как поправиться. Мой коллега также упомянул ранее, что нужно проверить HackerRank, еще один веб-сайт для решения проблем, который улучшает ваш код. Было так много вещей, которые нужно было изучить так быстро (машинное обучение, разработка программного обеспечения и спутниковые данные), что я не был уверен, что расставить по приоритетам. Я могу только надеяться, что этот пост поможет кому-то с его путём обучения.

Как упоминалось в моем предыдущем посте, глубочайшей степенью моих знаний в области ML / DL было прохождение двухдневного курса глубокого обучения. В начале стажировки я прыгнул в глубину, пройдя курс fast.ai. Курсы fast.ai потрясающие, и я очень рекомендую, но некоторых проблем, с которыми я столкнулся, можно было бы избежать, если бы я не использовал свой корпоративный ноутбук - что я сделал, чтобы получить доступ к графическому процессору в то время. Теперь доступно гораздо больше доступных опций (например, Google Colab или Kaggle). Мне всегда было комфортно задавать вопросы и просить о помощи, но были определенные сценарии, о которых я даже не думал просить о помощи.

Я хотел загрузить модель PyTorch, но не мог понять, почему это не работает. Когда я в конце концов это сделал, я понял, что этот запрос заблокировал прокси-сервер компании! В зависимости от того, как устроена ваша компания, не всегда можно решить это самостоятельно.

У меня была забавная работа по установке SNAP, на которую у меня ушли месяцы (!), Потому что да, как вы уже догадались, прокси. Не только из-за прокси, но и из-за брандмауэра компании. Было бы очень легко принизить себя в этой ситуации, потому что я долгое время не мог понять, в чем проблема, но иногда нужно просить о помощи (а иногда нужно быть настойчивым 🙂).

В следующем посте я описываю проекты, в которых я участвовал, другие уроки, чем я занимаюсь сейчас, и мои последние замечания.

Вы можете найти меня / подписаться на меня на следующих сайтах: Twitter, LinkedIn и моя страница блога.