Я преподаю науку о данных на уровне магистра и наставляю начинающих специалистов по данным в учебном лагере уже несколько лет. Приятно работать с теми, кто пытается выйти на рынок - я учусь вместе с ними, и это помогает мне развивать свою способность объяснять инструменты, с которыми я работаю каждый день. Также приятно наблюдать за тем, как люди развиваются как начинающие специалисты по данным.

За эти годы я видел достаточно студентов, чтобы понять, кто из них добьется успеха. Я имею в виду «преуспеть» в довольно широком смысле - тех, кто многое извлечет из учебной программы и окажется в хорошем положении, чтобы устроиться на работу в промышленности.

Это чувство не имеет ничего общего с преданностью или каким-то чистым интеллектом. Все связано с навыками, с которыми они начинают свое обучение.

Давайте быстро рассмотрим некоторые технические навыки, которые могут понадобиться специалисту по данным:

  • Кодирование
  • Статистика
  • Машинное обучение
  • Различные специализации (например, инструменты для работы с большими данными, визуализация данных и т. Д.)

Владение хотя бы некоторыми из этих навыков необходимо любому специалисту по данным. Но когда вы только начинаете, один выделяется как особенно важный.

Что отличает начинающих специалистов по данным, которые преуспевают, от тех, кто борется, - это в основном навыки программирования.

Большинство хороших учебных программ по науке о данных включают изучение чего-то абстрактного - теории и математики, лежащих в основе метода, - а затем получение возможности применить это на практике. Внедрение этого на практике означает написание кода, чтобы реализовать то, что вы узнали, или использовать инструмент, который уже реализует это. Применение на практике помогает укрепить понимание концепции.

Если вы боретесь с кодом, претворение концепции в жизнь не поможет. Вместо этого это будет разочаровывать, и все обучение будет сосредоточено на том, как заставить ваш код делать то, что вы хотите. Трудно научиться двум взаимозависимым вещам одновременно: если вы не понимаете код и не понимаете, что он реализует, вы не получите многого от упражнения по кодированию.

Статистическая база также важна, поскольку она обеспечивает контекст и понимание многих концепций машинного обучения, но, на мой взгляд, это далеко не так фундаментально, как кодирование. Хотя математика и статистика помогают повысить уровень сложности, большинство алгоритмов машинного обучения, по сути, довольно интуитивно понятны. Нетрудно описать их так, чтобы было понятно, почему они работают. Если вы можете заставить учащегося понять интуицию, лежащую в основе алгоритма, конкретная математика может подождать, но для того, чтобы действительно понять его, им необходимо иметь возможность написать код, который использует алгоритм.

Если вы не понимаете, что происходит с каким-либо из используемых вами инструментов, вы не улучшите свое понимание теории.

Я не хочу звучать так, будто утверждаю, что другие навыки не важны. Но если бы у меня был кто-то, совершенно наивный в области науки о данных, желающий взломать, я бы посоветовал сначала освоить кодирование. Остальное можно сделать, используя теоретико-практический подход. Но если студент борется с кодом, все остальное тоже будет проблемой.

Другие истории, которые могут вас заинтересовать