Подсказка: машинное обучение не входит в их число.
Не забудьте ПОДПИСАТЬСЯ здесь, чтобы не пропустить новую статью о руководствах по науке о данных, хитростях и советах, жизненных уроках и многом другом!
Когда я впервые начал изучать науку о данных, было так много тем и методов, которые нужно было изучить, что часто казалось невозможным решить, что изучать и в каком порядке.
Оглядываясь назад, я могу с уверенностью сказать, что некоторые навыки, которым я научился, оказались гораздо более практичными и полезными, чем другие. В этой статье я хочу поделиться с вами тремя навыками, которые в конечном итоге ускорили мою карьеру и увеличили мою зарплату на 60% за последний год.
Причина, по которой я отношу большую часть своей заслуги к этим трем навыкам, заключается в том, что эти три навыка позволили мне работать полностью автономно, помогли мне найти идеи и идеи, имеющие невероятную ценность для бизнеса, и дали мне возможность быстрее получать результаты.
С учетом сказанного, давайте погрузимся в это!
1. Создание эффективных конвейеров данных
Что
Разработка конвейера данных относится к разработке конвейеров (или систем), которые очищают и преобразуют входные данные в желаемый результат. В частности, я имею в виду этап преобразования процесса ELT или ETL, на котором данные преобразуются после того, как исходные данные уже получены.
То, как это делается, отличается от компании к компании в зависимости от их технического стека. В моей компании мы используем Airflow для планирования запросов и создания таблиц BigQuery.
Почему
- Возможность создавать конвейеры данных поможет вам быстрее создавать модели. В каждой компании, в которой я работал, данные, необходимые для моих моделей, никогда не были идеальными. Либо в существующих таблицах были ошибки (например, повторяющиеся строки), либо существующие таблицы были не в том формате, в котором я хотел их видеть (например, таблица на основе событий, которая должна была быть на уровне пользователя). Имея возможность создавать необходимые мне таблицы без посторонней помощи, я мог создавать модели на месяцы быстрее, чем если бы мне нужно было кого-то ждать. Более быстрое создание моделей означало сокращение большего количества проектов и еще большее улучшение результатов.
- Возможность создания конвейеров данных может помочь упростить доступ к данным для бизнес-пользователей. Строить конвейеры полезно не только для себя, но и для других. В своей карьере я нашел возможности, где я мог создавать таблицы, которые были полезны для моих моделей, а также полезны для определенных групп и отделов для целей аналитики и отчетности. Это помогло мне укрепить отношения с другими командами в бизнесе и в конечном итоге улучшило мое взаимопонимание.
- Возможность создавать конвейеры данных позволяет разрабатывать новые функции. Создавая конвейеры данных, вы лучше понимаете базовые данные, с которыми работаете. Это помогло мне придумать творческие и эффективные функции, о которых я бы не подумал, если бы не работал так внимательно с данными. И поскольку я смог придумать такие новые функции, производительность моих моделей значительно улучшилась. И это подводит меня к моему следующему навыку…
Не забудьте ПОДПИСАТЬСЯ здесь, чтобы не пропустить новую статью о руководствах по науке о данных, хитростях и советах, жизненных уроках и многом другом!
2. Разработка функций
Что
Проще говоря, разработка функций относится к созданию новых функций, которые еще не доступны в явном виде. Например, если бы у меня были даты рождения моих пользователей, я мог бы создать новую функцию под названием «возраст», используя даты рождения пользователей.
Почему
- Разработка функций позволяет значительно повысить производительность моделей. По моему опыту, фактором номер один, определившим силу моих моделей, была способность создавать функции с высокой предсказательной силой. В конечном итоге это привело к лучшему прогнозированию и лучшему таргетингу.
- Разработка надежных функций поможет вам лучше понять данные и бизнес в целом. Разрабатывая соответствующие функции с высокой прогностической силой, вы можете лучше понять связи между различными переменными, что поможет вам лучше понять, что движет бизнесом.
3. Глубокие погружения
Что
Глубокий анализ — это обширное исследование или анализ интересующего вопроса или темы.
Он может носить исследовательский или исследовательский характер. Исследовательский анализ погружения отвечает на такие вопросы, как «Почему продажи упали на 25% в прошлом месяце?» в то время как исследовательское глубокое погружение может ответить на вопрос вроде «коррелирует ли более высокий уровень вовлеченности в приложение с более прибыльными пользователями?»
Почему
- Глубокий анализ позволяет обнаружить золотые возможности. Под «золотыми возможностями» я подразумеваю вещи, которые не очевидны сразу, но оказывают значительное влияние на бизнес. Это то, что замечают руководители и за что их хвалят ;)
- Глубокий анализ позволяет лучше понять продукты и данные, с которыми вы работаете. Поскольку вы работаете непосредственно с данными, вы часто достигаете высочайшего уровня знаний в соответствующей области. Это делает вас более осведомленным и более ценным.
- Глубокий анализ помогает вам делать меньше ошибок и делает вашу работу более тщательной. Глубокие погружения — это непросто. Особенно тяжело, когда ты не знаешь того, чего не знаешь. Тем не менее, способность выполнять тщательные глубокие погружения сделает вас лучшим работником в целом. Это улучшит вашу любознательность, сделает вас более дотошным и поможет вам узнать больше в целом.
Спасибо за прочтение!
Не забудьте ПОДПИСАТЬСЯ здесь, чтобы не пропустить новую статью о руководствах по науке о данных, хитростях и советах, жизненных уроках и многом другом!
Не знаете, что читать дальше? Я подобрал для вас еще одну статью:
и еще один:
- Теренс Шин
- Если вам понравилось, ПОДПИСАТЬСЯ на мой канал для получения эксклюзивного контента!
- Аналогичным образом вы также можете СЛЕДУЙТЕ за мной на Medium
- Подпишитесь на мою личную рассылку
- Подпишитесь на меня в LinkedIn для получения другого контента