Как и многие люди, я стал одержим наукой о данных. Как дисциплина, она имеет корни как в компьютерных науках, так и в математике, что делает ее уникальным инструментом для решения некоторых из самых больших проблем в мире. Однако для многих людей (в том числе и для меня) путешествие в науку о данных обескураживает. Частично это связано с тем, что количество дисциплин, которые предполагается иметь у специалиста по анализу данных, довольно велико. Сильные знания в области статистики, линейной алгебры, программирования, знания предметной области, навыки проектирования (для визуализации данных) и это лишь некоторые из них. Для освоения каждой из этих дисциплин может потребоваться целая жизнь или даже больше. Итак, что вы будете делать, если окажетесь у подножия горы Data Science?

Что ж, есть один подход, который я нашел, чтобы помочь мне в обучении. Это не серебряная пуля, но в нем есть ряд принципов и идей, позаимствованных у лучших специалистов в этой сфере. Это также помогает сообщить о двух вещах, которые следует учитывать каждому в этом путешествии.

  1. Вам не нужно быть экспертом во всем этом
  2. Немногое может помочь

Итак, что такое Data Science Radar? Что ж, это адаптация ThoughtWorks Technology Radar, которая отлично подходит для разбивки областей стека набора навыков Data Science и сосредотачиваясь на каждой части индивидуально, чтобы знать, где развивать свои навыки.

Для каждой части радара вы можете наметить несколько вещей, чтобы узнать, что вы можете придумать, что поможет вам быть более продуктивным в этой области. Области в общих чертах переводятся как:

Математика и статистика: Довольно просто - какие математические и статистические концепции, по мнению некоторых, вам нужны для работы? Какие элементы вы хорошо знаете? На какие из них вы даже не смотрели?

Программирование и базы данных. Вы можете заниматься наукой о данных без этих навыков, но они все больше и больше становятся синонимом мира науки о данных. Вы знаете Python? Р? Можете ли вы получить доступ к данным в разных хранилищах данных? SQL? NoSQL?

Знание предметной области. Опять же, вы можете заниматься наукой о данных и без этого, но если вы хотите быть суперпродуктивным, немного знаний о предметной области, в которой вы работаете, будет иметь большое значение. Можете ли вы без полномочий влиять на клиентов, обладая глубокими знаниями в предметной области? Вы знаете, как сейчас работает отрасль? С какими проблемами он столкнется в следующие 5, 10, 50 лет?

Презентация и визуализация. Отлично разбираться в статистике и программировании - это здорово, но если вы не можете сообщить кому-либо то, что ему нужно знать, то это потенциально пустая трата времени. Знаете ли вы основы работы с данными? Вы знаете, как он изменился за последние 5 лет?

После того, как вы составили список всех этих идей в каждой категории, оцените, на какой шкале вы бы поставили себя по каждой из этих концепций:

  • Незнакомец: никогда не пытался активно изучать эту тему.
  • Знакомые: активно усвоили, но только на высоком уровне.
  • Достаточно: может уверенно говорить об этом понятии, иметь определенные мнения и ценности, связанные с ним.
  • Продуктивно: при наличии проблемы в этой области я мог бы легко стать продуктивным за короткий период времени без необходимости дополнительных исследований.

Даже после достижения продуктивной фазы вы все равно сможете многому научиться, но дело в том, что вы знаете это достаточно, чтобы использовать его в качестве набора навыков, который вы примените в своем следующем проекте.

Вот как могла бы выглядеть каждая из этих областей после выполнения вышеупомянутого упражнения:

И последнее, что, на мой взгляд, помогает начинающим в этой дисциплине: найти людей, на которых вы равняетесь. В этой индустрии так много замечательных компаний и частных лиц - подписывайтесь на них в твиттере, СМИ, блогах или где угодно. Такие люди, как Хэдли Уикхэм, Крис Албон, Кан Нишида, @jakevdp и Рэнди Олсон, являются отличными источниками вдохновение и идеи и многие другие.

Это просто подход, который мне помог - я хотел бы услышать, что помогло вам, а также если у вас есть какие-либо идеи или отзывы, чтобы улучшить это!

Спасибо за прочтение.