Трудные дороги приведут к прекрасным местам. Вопрос в том, стоило ли это путешествие?

Желая лучшего тогда

Где-то в декабре прошлого года мне стало скучно, чем бы я ни занимался на работе. Я был инвестиционным аналитиком в семейном офисе и каждый день не с нетерпением ждал выхода на работу. Не говоря уже о том, что роль была бессмысленной, кроме того, не было никого, кто мог бы дать указания и направление. Вскоре я стал искать, чем заняться дальше, изучая различные варианты, такие как пройти еще один курс, получить степень магистра или просто что-то, что могло бы освежить и снова открыть мой разум. Наличие паршивого босса действительно может привести к деградации мозга, и я не был готов отправиться в круиз и позволить дням проплывать мимо.

У меня был инженерный опыт, прежде чем я перешел в финансы в 2018 году. Я сдал экзамены CFA и FRM и с нетерпением ждал светлого будущего в отрасли. Когда в апреле 2020 года случился карантин из-за пандемии, я прошел онлайн-программу MBA в Quantic. Даже с различными квалификациями и сертификатами мне было трудно получить хорошие должности в финансовой индустрии. На собственном горьком опыте я понял, что сертификаты без соответствующего опыта работы — это просто бумажки, не имеющие никакой ценности. Прохождение большего количества тестов могло только продвинуть меня до сих пор, и я хотел бы иметь более ценные технические навыки, которые я мог бы использовать для повышения ценности и помощи в развитии бизнеса. Я решил попробовать себя в науке о данных, чтобы преодолеть разрыв между финансами и технологиями. Что мне действительно было нужно сейчас, так это практические проекты для создания и демонстрации портфолио.

Учитывая возможность сделать лучше, почему бы и нет?

В декабре 2021 года я наткнулся на General Assembly после поиска различных курсов/стажировок/стажировок, на которых я мог бы углубить свои технические навыки на основе опыта. Я очень хотел перейти на работу, которая была бы более технологичной и специализированной. Магистратура не имела смысла из-за большой продолжительности и высокой стоимости (2 года и 50 тысяч?!) без гарантии получения хорошей работы. GA казался лучшим вариантом и был именно тем, что я искал. Была также карьерная поддержка с соответствующей и применимой учебной программой. Мое решение немного облегчил тот факт, что курс в значительной степени субсидировался государством, чтобы удовлетворить растущий спрос на технических специалистов.

Я выбрал программу Data Science Immersive, так как раньше у меня были некоторые знания по Python. С 2018 года я изучал онлайн-курсы (через Udemy, edX, Coursera и т. д.) по Python и анализу данных, но меня никогда не заставляли применять то, чему я научился. Вскоре полученные знания канули в лету. Никогда не было никакой срочности или давления, чтобы закончить курс, поэтому я часто брал курсы на полпути или сдавался, когда это становилось слишком сложным.

Я чувствовал, что зачисление на курс GA будет держать меня под контролем и удостоверится, что я не сдамся, когда возникнут трудности. Я думаю, вы узнаете больше всего, только если вы в этом заинтересованы, в моем случае оплаты за обучение было достаточно, чтобы я отвечал за свои действия.

Жертвоприношение и приверженность

Курс должен был проходить в течение 6 месяцев (24 недели) с апреля 2022 года. Это был неполный рабочий день, поэтому я работал полный рабочий день днем ​​и посещал вечерние уроки по вторникам и четвергам после работы. Были также уроки полного дня по субботам с 9:30 до 17:00 еженедельно. По будням занятия проводились онлайн, а по субботам мы возвращались в кампус.

До поступления я очень не хотел отказываться от своих будних вечеров и суббот. Мне пришлось бы пропустить свои регулярные футбольные матчи по будням и утренние велосипедные прогулки по выходным, бранчи с друзьями и проводить меньше времени с женой. Оглядываясь назад, можно сказать, что страх был необоснованным, поскольку люди каким-то образом склонны приспосабливаться к нехватке времени, расставляя приоритеты. К счастью, моя жена также очень поддержала меня, когда я пошел на курсы.

В глубине души я знал, что это то, что я должен был сделать. Я не хотел пройти через 2022 год, зная, что может быть, даже не пытаясь.

Начните медленно, а потом боритесь

Итак, апрель пролетел незаметно. Поначалу с этим можно было справиться, так как перед началом занятий GA предложила краткий ускоренный курс Python. Раньше я также использовал Python, поэтому я был знаком с использованием Jupyter Notebook и общих библиотек (Pandas, NumPy, Matplotlib, Seaborn и т. д.). Первые несколько недель я чувствовал себя как переподготовка, но постепенно, когда вводились новые концепции, мне потребовалось некоторое время, чтобы усвоить и переварить информацию.

Помимо уроков, нам поручили отработать лабораторные работы. Первоначально первые несколько лабораторных упражнений были управляемыми. Они стали обузой с каждой новой вещью. Я вспомнил, как долго смотрел на более поздние упражнения, не зная, что печатать. В конце концов, получение решений от более умных одноклассников и поиск ответов в Google помогли мне пройти через это. Лабораторные задания случайны, некоторые из них были легкими и достаточно простыми для выполнения, другие были такими, что вы не хотите смотреть на них дважды. Кроме того, я бы хотел, чтобы лабораторные задания можно было превратить в мини-проекты с руководством для будущих групп студентов.

Товарищи по борьбе спасут вас позже

Говоря об одноклассниках, в моем классе было 18 учеников, включая меня. У нас был разный опыт и разные отрасли, но у всех нас была общая цель: хорошо изучить этот новый предмет, чтобы попытаться улучшить нашу карьеру и поработать над чем-то значимым позже.

Одна из лучших вещей в GA, которую онлайн-курс не может предоставить, — это классная комната. Я не мог этого увидеть в начале, но это стало ясно позже, когда помощь была на расстоянии одного сообщения Slack. Наличие 18 борющихся умов, делающих что-то 18 различными способами, также означало, что вы изучили 18 подходов к решению одной проблемы. Эти люди — одни из самых находчивых и изобретательных людей, которых я когда-либо встречал, и с каждой неделей я становился все более скромным и впечатлялся их упорством.

Я чувствую, что не получил бы такого хорошего опыта от этого курса, если бы не мои одноклассники с таким же мышлением, тонко подталкивающие друг друга к лучшему и адаптирующиеся по ходу дела.

Проекты помогают закрепить ваше обучение

Каждые 4 недели мы должны представить проект. Всего пять проектов. Три проекта основаны на команде, и мы работаем вместе с избранными одноклассниками. Два из них, включая финальный проект Capstone, являются индивидуальными. Проекты охватили множество интересных тем, в том числе прогнозирование цен на жилье, веб-скрапинг из Reddit и прогнозирование появления вируса Западного Нила. Каждый проект предназначен для закрепления того, что вы узнали на уроках, и иногда выходит за рамки учебной программы. Я рассматриваю проекты как неотъемлемую часть создания солидного портфолио в дальнейшем.

Я, конечно, ценю, что проекты существуют как необходимый компонент для завершения и доведения до конца. Это также заставило меня глубже задуматься о том, как я могу улучшить процесс обработки данных. Различные итерации заставили меня лучше очищать данные, исследовать переменные, которые я мог упустить из виду, и настраивать свои модели. Я узнал, что: Первый шаг не всегда должен быть идеальным, поскольку результаты почти всегда отличаются от первоначальных ожиданий. Вы, как правило, раскрываете больше секретов после завершения первого шага. Помимо того, что эти проекты помогли мне чувствовать себя более уверенно, представляя свои выводы, они помогли мне заложить прочную основу для будущих проектов.

Мое единственное желание, чтобы они могли изменить один или два проекта, чтобы они больше повлияли на наше обучение, возможно, связанные с компьютерным зрением или нейронными сетями.

Приближаясь к Долине Отчаяния

Я начал ощущать последствия того, что не мог идти в ногу со временем после второго проекта. Именно в этот момент мы познакомились с незнакомыми темами, такими как наивный байесовский подход, ООП, регулярное выражение и НЛП. Некоторые термины стали настолько длинными, что просто ошеломили меня (например, иерархическая агломеративная кластеризация?). Необходимость понимать и переваривать эти темы неделю за неделей заставляла меня сначала впитывать все, а потом задавать вопросы. Некоторые из этих тем были лишь поверхностно затронуты, поэтому для меня это было полезно знать, но если вам это не нужно, просто оставьте это первым.

Я считаю, что материалы, предоставленные GA, были недостаточными и не самыми эффективными в концепции обучения. Многие из них представлены в формате Jupyter Notebook и представляют собой слайды, содержащие скудную информацию без особых пояснений. Мне пришлось дополнить свое обучение дополнительными видео и материалами для чтения. Statsquest — один из очень хороших сайтов, помогающих упростить концепции.

Даже после завершения курса многие из этих концепций все еще незнакомы, и мне, вероятно, потребуется несколько итераций, чтобы лучше понять все затронутые темы. Большинство тем преподавались индивидуально, поэтому я изо всех сил пытался связать разные понятия вместе от начала до конца. С огромной горой вещей, которые нужно изучить, легко почувствовать себя подавленным и некомпетентным. Я часто беспокоюсь и задаюсь вопросом, смогу ли я когда-нибудь хорошо заниматься наукой о данных. Я могу только посоветовать другим быть губкой, продолжать впитывать и сначала все впитывать.

Последнее препятствие — Capstone

В последние 6 недель курса нам нужно было начать выбирать темы для нашего проекта Capstone. Целью Capstone было использовать все, что мы узнали из курса, для решения проблемы науки о данных. Capstone также был способом продемонстрировать будущим работодателям отрасли, как применять машинное обучение для решения или улучшения бизнес-проблемы. Я был взволнован, так как это был хороший шанс для меня подвести итоги и собрать все строительные блоки вместе.

Я решил заняться чем-то, связанным с финансами, так как не хотел менять отрасль. Моя тема закончилась как «Создание инструмента выбора акций для выбора десяти лучших акций, которые могут превзойти индекс на основе цифр из финансовой отчетности компаний». Короче говоря, после трех недель работы над ним у меня не было четкого представления о том, что делать дальше. Мой проект был в ужасном состоянии, и я не мог показать никаких результатов. Я также думаю, что объем проекта мог быть слишком большим, до такой степени, что я всегда подвергал сомнению свои предположения и пытался сделать его идеальным. «А как насчет риска портфеля? Какая корреляция между акциями? Они из одной отрасли?» После 101 вопроса я был парализован собственными мыслями, а постановка задачи становилась все туманнее и туманнее.

За две недели до подачи проекта. Я пытался настроить, перенастроить постановку задачи, но всегда чувствовал себя невдохновленным и сбитым с толку. Если бы я не понимал свой собственный проект, я не мог бы выступать перед аудиторией, которая должна была догадываться о моей работе. Я провел еще одну неделю, медленно продвигаясь вперед, просматривая множество веб-сайтов и книг в поисках вдохновения для улучшения моего проекта. По мере того, как я добавлял все больше и больше вещей, переизбыток информации заставил меня не знать, как действовать дальше. Я шел не в том направлении. Я должен был упростить вещи, а не усложнять их.

Отчаянные времена, отчаянные меры

За 7 дней до подачи я отчаянно звонил, чтобы сбросить. Я сбросил часы работы за последние три недели и перезапустил. Большинство моих одноклассников к тому времени уже завершили моделирование, и я почувствовал себя плохо и запаниковал, зная, что только начинаю. Это был один из немногих случаев, когда я чувствовал себя совершенно беспомощным.

В поисках идей меня вдохновила статья Bloomberg Игрок, взломавший правила скачек. Это привело меня к интересному процессу поиска фактов, пытающемуся понять скачки в Гонконге. Моя проблема заключалась в том, могут ли модели машинного обучения помочь нам получить прибыль от скачек? Мне понравилось, что проект был осязаемым, простым и понятным, без каких-либо дополнительных сложностей.

Я думал, как очистить набор данных, какие модели использовать, как протестировать свои результаты и, самое главное, как решить проблему науки о данных. Подробнее о том, как я это сделал, будет в другой статье. Я потратил день на очистку данных, моделирование, обратное тестирование, развертывание и создание слайдов. Я никогда не думал, что можно сделать проект за 7 дней, но я был рад, что довел его до конца.

Уроки на вынос от Capstone

В конце концов, я достиг своей цели, объединив все свои блоки Lego в один проект. Я также был безмерно горд собой, что придумал развернутый прототип за 6 часов! Поговорите о вещах, которых вы можете достичь, если приложить достаточно усилий! Это были некоторые из моих самых больших выводов из процесса Capstone.

  1. Убедитесь, что формулировка проблемы очень четкая, и знайте, что вы решаете. Вы почти всегда должны оглянуться на это снова, чтобы быть на правильном пути.
  2. Самые сложные модели не всегда работают наилучшим образом. Иногда просто лучше. Простой набор данных и простая постановка задачи иногда могут дать замечательные и объяснимые результаты!
  3. Начните с малого, затем повторяйте и улучшайте. Не будь слишком амбициозным и стремись к луне! Стремление к совершенству с самого начала может подавить и исказить вашу ясность.

Стоило ли это путешествие?

Конечно! Даже после прохождения курса я чувствую, что это только начало долгого и извилистого пути. Я уверен, что без структурированной манеры курса GA я бы сдался на полпути.

На этом этапе я также должен особо отметить нашего инструктора и ассистентов, которые были очень полезны и терпеливы с нами с самого начала и до самого конца. Побывав с предыдущими группами студентов, они поняли нашу борьбу и трудности на протяжении всего этого пути. Они привносят в класс соответствующий опыт работы и современные отраслевые практики, поэтому их руководство было очень ценным.

Итак, что такое жизнь после GA? Множество. Начнем с того, что поиск карьеры только начался. Поиск новых проектов для экспериментов, изучение новых тем и отслеживание достижений в области технологий — все это часть итеративного процесса.

Я счастлив, что GA привел меня к этому моменту, теперь я должен исследовать и извлечь из этого максимум пользы. Как и жизнь в целом, мне очень понравилось это путешествие, я нашел прекрасные места и друзей по пути, и я с нетерпением жду более голубого неба и лучших вещей впереди!