Я получил огромное количество вопросов в LinkedIn о том, как перейти от нетехнологической отрасли к отрасли науки о данных. Я получил диплом инженера-строителя и смог осуществить этот переход. Кроме того, я тренировал более 500 студентов как офлайн, так и онлайн, поэтому я чувствую, что могу поговорить об этом.

Этот блог будет посвящен следующим темам:

1. Хронология обучения

2. Набор навыков в области науки о данных

3. Заявление

4. Как бороться с неопытностью

5. Создание собственного бренда.

6. Дорожная карта, которую я рекомендую

7. Лучшие ресурсы

Хронология обучения

Первый вопрос, который мне всегда задают, - сколько времени это займет. Я отвечу двумя способами.

1. Предполагая, что вы работающий профессионал - достаточно будет времени между 10–12 часами в неделю в течение непрерывных 18–20 недель. Помните, что последовательность - это ключ, оставаться последовательным может быть большой проблемой, и именно здесь большинство учащихся ломаются.

2. Предположим, вы обучаетесь на дневном отделении. В этом случае у вас нет бремени работать по 6–8 часов в день, и вы можете больше времени уделять обучению. Если вы можете управлять 20+ часами в неделю 10–12 недель, вы должны быть готовы, и если вы выбираете программу тренировок, выберите ту, которая соответствует этому графику.

Набор навыков в области науки о данных

Вот где есть большой пробел в информации для учащихся. Я видел, что 90% курсов по науке о данных, как правило, сосредоточены только на трех вещах, а именно: Python, статистика, алгоритмы (включая ML / DL), хотя это, безусловно, основа для работы в области науки о данных, но нам нужно более. После того, как вас наняли, ваша роль действительно меняется. Для посторонних тег Data Scientists вводит людей в заблуждение и иногда несправедливо предполагает, что речь идет только о прогностических моделях. Вы обнаружите, что я пишу SQL-запросы, работаю в Excel, создаю информационные панели и иногда даже документирую свою работу в слайдах PowerPoint.

Вот список навыков, которые вы должны приобрести перед подачей заявления на работу в области Data Science:

1. Python
2. Статистика и машинное обучение
3. Один инструмент визуализации данных - Power BI / Tableau
4. SQL
5. Доступ как минимум к одной облачной платформе из AWS / Azure / GCP
6. Веб-фреймворки Python, такие как Flask / Django (желательно)

Одна вещь, которую я узнал, работая в отрасли, - это то, что наука о данных - это просто процесс, в котором вы используете данные для увеличения ценности бизнеса. Иногда недостаточно просто придерживаться алгоритмов. Кроме того, анализ, который вы выполняете, не будет находиться на вашем локальном компьютере, он должен быть где-то развернут, поэтому изучите № 5 и № 6 и узнайте, как развертывать / производить свои модели машинного обучения.

Почему я не упомянул R? R - это круто, но Python теперь на световые годы опережает R. Кроме того, из каждых 10 заданий вы обнаружите, что 8 из них потребуют Python. Python - это язык сценариев, который выходит за рамки только науки о данных. Я не могу сказать то же самое о R. Я рекомендую изучить только один из R и Python, и, следовательно, последний будет разумным выбором.

Приложение

Лучший способ чему-то научиться - это реализация. Не ограничивайте свое обучение упражнениями и заданиями в онлайн / офлайн-классах. Убедитесь, что вы создаете полноценный проект, который объясняет рекрутеру вашу способность работать специалистом по данным. Я рекомендую строить сквозной проект, порекомендую один в разделе ресурсов. Избегайте черновых проектов, таких как гигантские наборы данных, прогноз цен на жилье и т. Д.

Когда вы работаете над проектом, всегда помните об этих трех моментах:

1. Какова цель проекта?
2. Какова ваша роль в проекте?
3. Какое влияние ваш проект окажет на бизнес / клиентов / всех, на кого вы работаете?

Как рекрутер я всегда спрашиваю, с какими трудностями сталкивался кандидат и как он их преодолевал.

Пример проекта: https://www.youtube.com/watch?v=MpF9HENQjDo&list=PL2zq7klxX5ASFejJj80ob9ZAnBHdz5O1t

Совет. Если вы просматриваете руководство, просто попробуйте воспроизвести шаги с другим набором данных, а также не забудьте указать фактического создателя. Избегайте плагиата.

Как бороться с неопытностью

Это, безусловно, самая большая проблема, с которой сталкиваются люди. Суровая реальность такова, что есть очень ограниченные компании, которые назначают посвежее. Самый простой путь сегодня - пройти стажировку в любой фирме и получить постоянную работу. Менеджеры предпочтут внутренних стажеров, а не внешних неопытных кандидатов. Вот как я вижу людей, которых нанимают в мою фирму и другие.

Но что делать, если вы уже работаете в сфере, не связанной с наукой о данных или ИТ, с опытом работы более 5 лет или даже меньше?

Все эти годы опыта не будут иметь значения, когда вы пойдете на работу в области Data Science. Поэтому, прежде чем прыгать с корабля, задайте себе следующие два вопроса.

1. Почему вы хотите стать специалистом по данным?
2. Каковы ваши ожидания с точки зрения оплаты, если вы устроитесь на работу на полную ставку?

Переход с одного домена на другой имеет много недостатков, и у вас должны быть для этого веские причины. Я обучал кандидата, который имел 5-летний опыт работы в качестве Java-разработчика и уже зарабатывал около 10 LPA, что очень хорошо с точки зрения индийских стандартов. Когда вы изучаете новый навык, вы начинаете все сначала. Так что не ждите больших цифр.

Я уверен, вы можете связать это с другими профессиями. Если вы футболист и хотите играть в теннис, вам не следует ожидать, что вы сразу же сыграете на одном поле с победителями турнира Большого шлема или заработаете, как они. Наука о данных ничем не отличается.

При этом вы все еще можете попасть в Data Science. Я каждый день слышу истории успеха о людях, которые переходят из областей, не связанных с ИТ, к аналитике и машинному обучению. Я являюсь одним из них. Я был инженером-строителем без опыта программирования, а сейчас работаю специалистом по данным в одной из крупнейших консалтинговых фирм в мире.

Итак, главный вопрос. Если я инженер-строитель с 5+ годами работы напр. как я могу использовать свой опыт?

Шаг 1 - Создайте свой опыт. Разделите его на 3 + 2. Продайте такую ​​историю. «Я работал полный рабочий день ... в течение последних трех лет, а затем я активно занимался аналитикой сырья / подкреплений / топографии и т. Д.»

Шаг 2 - Поддержите его работой с некоторыми соответствующими проектами. Вот несколько примеров.
1. Если вы работаете в сфере транспорта / дороги, проектируя проект, в котором вы пытаетесь спрогнозировать плотность транспортных средств на основе прошлых собранных данных, было бы неплохо.
2. Если вы занимаетесь проектированием конструкций, а затем прогнозируете прочность бетона на сжатие на основе таких характеристик, как цемент, шлак, зола, вода, мелкие заполнители и т. д.

Я могу продолжить с другими примерами, но я надеюсь, что вы уловили суть. А для людей, принадлежащих к любой другой отрасли, цель состоит в том, чтобы показать проект, имеющий отношение к вашей текущей профессии, который можно использовать для повышения эффективности вашего текущего процесса за счет увеличения доходов или ограничения убытков или за счет экономии времени.

Шаг 3 - Свяжитесь с кем-то, кто активно работает в этой области, возможно, с кем-то вроде меня, и попросите их взять у вас интервью. Попросите их задать вопросы по проектам, упомянутым в шаге 2.

Совет. Очистка данных - неотъемлемый аспект Data Science. Поговорите с любым специалистом по данным, и он скажет вам, что 70–80% их времени уходит на структурирование своих данных. Вы всегда можете выразить свою любовь и желание очистить беспорядочные данные.
Это то, что не требует никакого опыта, подходит для новичков и экспертов и, безусловно, будет оценено вашим интервьюером.

Создание собственного бренда

Мы в 2021 году, и каждому человеку или бизнесу необходимо профессиональное присутствие. Вы также должны показать свое присутствие.

LinkedIn - отличный способ начать карьеру. Это дешево и эффективно, если у вас есть стратегия. За последние 3 года я значительно расширил свой собственный бренд на LinkedIn, и люди обращаются ко мне, чтобы узнать, ищу ли я перемен, хочу ли я устроиться на их работу или стать частью их предприятий.

На этой неделе мой профиль в LinkedIn резко вырос, и я также получил приглашения на работу от людей из моей сети.

Я нахожусь в таком месте, где я достаточно уверен, что если я сделаю себя доступным для своей сети, мне позвонит кто-то из моей сети. Это современный способ поиска работы.

Цель состоит в том, чтобы люди узнали вас по вашей работе. Взаимодействуйте с сообществом. Отправляйте запросы на подключение специалистам по данным, которые активно работают в этой области. Будьте вежливы и не подходите к ним случайным образом, чтобы помочь с вашими вопросами или попросить совета.

Примечание. Создание хорошего профиля в LinkedIn требует времени, это не происходит в одночасье, поэтому ключевым моментом является последовательность.

Я также рекомендую всем своим подопечным вести блоги по мере обучения. Письмо - лучший способ подтвердить свои знания. И это также уловка, чтобы привлечь вашего рекрутера к вашей сильной стороне. Интересно, как? Допустим, вы написали 5 блогов по ансамблевому обучению. Скорее всего, вам зададут вопросы об этом же. Проекты и блоги - это первый уровень перекрестного допроса, которого вы можете ожидать от рекрутера, они хотят сначала проверить, уверены ли вы в своей работе, и вы должны быть в состоянии ответить на них, предполагая, что вы должны знать о темах, которые вы ведете в блоге.

Наконец, следите за всеми своими упражнениями и проектами в репозитории GitHub. Это действует как доказательство того, что вы действительно работали над проектом, о котором говорите. Обратите внимание, что обучение будет постепенным, поэтому загрузка в GitHub также должна быть рассчитана по времени.

LinkedIn, Blogpost и GitHub должны быть первыми тремя элементами вашего резюме.

Я рекомендую план действий

Запишитесь на курс. По возможности офлайн. Говорят, если ты взбираешься на гору, лучше делать это с кем-то, кто это уже сделал. Прежде чем выбрать курс, помните о следующих вещах.

1. Профиль тренера - всегда учитесь у тех, кто имеет опыт работы в отрасли.
2. Продолжительность курса - максимум 6 месяцев.
3. Стоимость. Убедитесь, что вы не делаете дыру в кармане.
4. Учебный план - ознакомьтесь с содержанием с кем-нибудь, кто работает в этой области.

Я изучал науку о данных, работая полный рабочий день. Я выбрал курс, который в то время стоил мне 2,25 лаковых рупий (3025 долларов США). В то время ресурсы и учебные пособия были очень ограничены, поэтому я не жалею о своем решении. Но, поскольку я вложил большие средства, я был полон решимости усердно работать и что-то из этого извлечь. Так что я смог оставаться последовательным.

Это слишком большие деньги для тех, кто изучает науку о данных. Я бы рекомендовал не вкладывать больше 30–35 000 индийских рупий (500–550 долларов США) в любой курс.

Лучшие ресурсы

Курсы, которые я рекомендую: просто возьмите один и начните учиться, а не думать о лучшем курсе.
Мой любимый бесплатный курс: следуйте по пути обучения Microsoft, где они иметь короткие модули. Это также подготовит вас к сертификации Microsoft Azure.
Сертификаты, которые я рекомендую: AI 900, DP 100 (сертификаты Microsft Azure)

Каналы YouTube, на которые стоит обратить внимание
Python: https://www.youtube.com/user/schafer5
Pandas и Scikit Learn: Https://www.youtube.com/user/dataschool
Статистика и машинное обучение: https://www.youtube.com/user/joshstarmer
Математика: https://www.youtube.com/channel/UCYO_jab_esuFRV4b17AJtAw
Практическое применение: https://www.youtube.com/channel/ UCwBs8TLOogwyGd0GxHCp-Dw

Наконец, учитывая все вышесказанное, я планирую запустить свой собственный курс Data Science. Я расскажу о Python + ML + Azure + Power BI. Я буду держать партию короткой, ограничивая ее 5–7 людьми, и стараюсь уделять как можно больше индивидуального внимания. Не стесняйтесь обращаться ко мне. Я не могу пообещать вам работу, но могу обещать, что вы поделитесь своим опытом в этой сфере в рамках курса, который я изучил до сих пор.

Удачи. Надеюсь, что чтение этого блога стоило потраченного времени.

Мой LinkedIn: https://www.linkedin.com/in/sreemanta/