Подсказка: машинное обучение не входит в их число.

Не забудьте ПОДПИСАТЬСЯ здесь, чтобы не пропустить новую статью о руководствах по науке о данных, хитростях и советах, жизненных уроках и многом другом!

Когда я впервые начал изучать науку о данных, было так много тем и методов, которые нужно было изучить, что часто казалось невозможным решить, что изучать и в каком порядке.

Оглядываясь назад, я могу с уверенностью сказать, что некоторые навыки, которым я научился, оказались гораздо более практичными и полезными, чем другие. В этой статье я хочу поделиться с вами тремя навыками, которые в конечном итоге ускорили мою карьеру и увеличили мою зарплату на 60% за последний год.

Причина, по которой я отношу большую часть своей заслуги к этим трем навыкам, заключается в том, что эти три навыка позволили мне работать полностью автономно, помогли мне найти идеи и идеи, имеющие невероятную ценность для бизнеса, и дали мне возможность быстрее получать результаты.

С учетом сказанного, давайте погрузимся в это!

1. Создание эффективных конвейеров данных

Что

Разработка конвейера данных относится к разработке конвейеров (или систем), которые очищают и преобразуют входные данные в желаемый результат. В частности, я имею в виду этап преобразования процесса ELT или ETL, на котором данные преобразуются после того, как исходные данные уже получены.

То, как это делается, отличается от компании к компании в зависимости от их технического стека. В моей компании мы используем Airflow для планирования запросов и создания таблиц BigQuery.

Почему

  1. Возможность создавать конвейеры данных поможет вам быстрее создавать модели. В каждой компании, в которой я работал, данные, необходимые для моих моделей, никогда не были идеальными. Либо в существующих таблицах были ошибки (например, повторяющиеся строки), либо существующие таблицы были не в том формате, в котором я хотел их видеть (например, таблица на основе событий, которая должна была быть на уровне пользователя). Имея возможность создавать необходимые мне таблицы без посторонней помощи, я мог создавать модели на месяцы быстрее, чем если бы мне нужно было кого-то ждать. Более быстрое создание моделей означало сокращение большего количества проектов и еще большее улучшение результатов.
  2. Возможность создания конвейеров данных может помочь упростить доступ к данным для бизнес-пользователей. Строить конвейеры полезно не только для себя, но и для других. В своей карьере я нашел возможности, где я мог создавать таблицы, которые были полезны для моих моделей, а также полезны для определенных групп и отделов для целей аналитики и отчетности. Это помогло мне укрепить отношения с другими командами в бизнесе и в конечном итоге улучшило мое взаимопонимание.
  3. Возможность создавать конвейеры данных позволяет разрабатывать новые функции. Создавая конвейеры данных, вы лучше понимаете базовые данные, с которыми работаете. Это помогло мне придумать творческие и эффективные функции, о которых я бы не подумал, если бы не работал так внимательно с данными. И поскольку я смог придумать такие новые функции, производительность моих моделей значительно улучшилась. И это подводит меня к моему следующему навыку…

Не забудьте ПОДПИСАТЬСЯ здесь, чтобы не пропустить новую статью о руководствах по науке о данных, хитростях и советах, жизненных уроках и многом другом!

2. Разработка функций

Что

Проще говоря, разработка функций относится к созданию новых функций, которые еще не доступны в явном виде. Например, если бы у меня были даты рождения моих пользователей, я мог бы создать новую функцию под названием «возраст», используя даты рождения пользователей.

Почему

  1. Разработка функций позволяет значительно повысить производительность моделей. По моему опыту, фактором номер один, определившим силу моих моделей, была способность создавать функции с высокой предсказательной силой. В конечном итоге это привело к лучшему прогнозированию и лучшему таргетингу.
  2. Разработка надежных функций поможет вам лучше понять данные и бизнес в целом. Разрабатывая соответствующие функции с высокой прогностической силой, вы можете лучше понять связи между различными переменными, что поможет вам лучше понять, что движет бизнесом.

3. Глубокие погружения

Что

Глубокий анализ — это обширное исследование или анализ интересующего вопроса или темы.

Он может носить исследовательский или исследовательский характер. Исследовательский анализ погружения отвечает на такие вопросы, как «Почему продажи упали на 25% в прошлом месяце?» в то время как исследовательское глубокое погружение может ответить на вопрос вроде «коррелирует ли более высокий уровень вовлеченности в приложение с более прибыльными пользователями?»

Почему

  1. Глубокий анализ позволяет обнаружить золотые возможности. Под «золотыми возможностями» я подразумеваю вещи, которые не очевидны сразу, но оказывают значительное влияние на бизнес. Это то, что замечают руководители и за что их хвалят ;)
  2. Глубокий анализ позволяет лучше понять продукты и данные, с которыми вы работаете. Поскольку вы работаете непосредственно с данными, вы часто достигаете высочайшего уровня знаний в соответствующей области. Это делает вас более осведомленным и более ценным.
  3. Глубокий анализ помогает вам делать меньше ошибок и делает вашу работу более тщательной. Глубокие погружения — это непросто. Особенно тяжело, когда ты не знаешь того, чего не знаешь. Тем не менее, способность выполнять тщательные глубокие погружения сделает вас лучшим работником в целом. Это улучшит вашу любознательность, сделает вас более дотошным и поможет вам узнать больше в целом.

Спасибо за прочтение!

Не забудьте ПОДПИСАТЬСЯ здесь, чтобы не пропустить новую статью о руководствах по науке о данных, хитростях и советах, жизненных уроках и многом другом!

Не знаете, что читать дальше? Я подобрал для вас еще одну статью:



и еще один:



- Теренс Шин