Мнение

Почему я сосредотачиваюсь на этих пяти концепциях науки о данных в 2021 году

И почему ты тоже должен

Вступление

Давай будем настоящими. 2020 год был не лучшим годом. Так почему бы не потратить остаток этого года на планирование следующего? По мере приближения 2021 года я хотел спланировать наперед и подумать о том, чему я хочу научиться в следующем году, чтобы стать лучшим специалистом по данным.

Ниже я выделил пять областей, которые, как я считаю, помогут мне стать в десять раз более ценным, чем сейчас. Для каждой области я объяснил, почему я решил посвятить свое время ее изучению, и ресурсы, которые я планирую использовать, чтобы помочь мне.

С учетом сказанного, давайте погрузимся в это!

1. Развертывание модели

Почему?

Становится все более важным, чтобы специалисты по данным не только знали, как создавать модели, но и как их развертывать. Фактически, сейчас для многих объявлений о вакансиях требуется некоторый опыт в развертывании моделей.

Причина, по которой так важно научиться развертывать модели, заключается в том, что ценность модели зависит от ее простоты использования и простоты интерпретации. И поэтому возможность развернуть его таким образом, чтобы каждый мог взаимодействовать, будет чрезвычайно полезен.

Модель хороша настолько, насколько хороша ее способность использовать и интерпретировать.

Я все еще новичок в этой области (должен признать!), Но я считаю, что есть несколько инструментов, которые можно использовать для развертывания таких моделей, как Docker, Heroku, Streamlit и Airflow, поэтому я хочу изучить различные варианты и сравнить где они считают нужным.

Как?

Подобно тому, как я начал изучать машинное обучение, я не знаю того, чего не знаю. Поэтому сначала я собираюсь просмотреть множество разных ресурсов. Скорее всего, я начну с Docker, поскольку он, кажется, наиболее широко используется для развертывания.

Ниже приведены некоторые исходные ресурсы, через которые я планирую пройти:

2. Глубокое обучение

Почему?

Глубокое обучение - не новая тема. Он существует уже некоторое время, так почему я хочу сосредоточиться на нем в этом году?

Его актуальность растет. Глубокое обучение значительно улучшилось за последние несколько лет - методы глубокого обучения были усовершенствованы, эффективность алгоритмов глубокого обучения повысилась, а в Интернете стало намного больше поддержки в области глубокого обучения. обучение (больше проектов с открытым исходным кодом и больше образовательных ресурсов).

Я также заметил, что глубокому обучению уделяется все больше внимания в сообществе. Растущая доля конкурсов Kaggle требует глубокого обучения, больше объявлений о вакансиях требует опыта в глубоком обучении, и все больше статей посвящено глубокому обучению!

Как?

Я уже знаю, какие ресурсы я планирую использовать, когда захочу погрузиться в глубокое обучение, потому что я давно следил за этими ресурсами. Чтобы получить интуитивное представление о нейронных сетях, я планирую посмотреть первые два видео на YouTube. Затем я планирую пройти два следующих курса.

3. Моделирование временных рядов

Почему?

Это так практично, но так неправильно понимают.

Как и мои причины для глубокого обучения, моделирование временных рядов - одна из наиболее практичных концепций науки о данных / статистики, но я также считаю, что это одна из самых сложных концепций, чтобы полностью осмыслить ее.

Я хочу изучить это, потому что заметил, что многие проблемы в моей работе можно решить с помощью моделирования временных рядов. Точно так же я хотел бы выполнить множество личных проектов, требующих знаний в области моделирования временных рядов.

Как?

Ниже представлен ряд курсов аккредитованных университетов. В

4. Системы рекомендаций

Почему?

Есть несколько причин, по которым я хочу лучше разбираться в системах рекомендаций.

Во-первых, как и моделирование временных рядов, системы рекомендаций являются одними из крупнейших приложений в области науки о данных, потому что они настолько применимы.

Что еще более важно, системы рекомендаций приносят доход. Рост продаж Amazon на 29% в 2015 году в значительной степени был связан с ее системами рекомендаций по всему веб-сайту. Еще одна птичка сказала мне, что Faire, такая компания, как Amazon, стала прибыльной через год после того, как представила системы рекомендаций.

Таким образом, хорошее понимание рекомендательных систем означает быть более ценным.

Как?

Первым видео было видео, которое я уже смотрел, и я очень рекомендую его. Он отлично объясняет, как интуитивно работают рекомендательные системы. Затем я пройду по двум другим ссылкам и посмотрю, куда это меня приведет!

5. Оптимизация гиперпараметров

Почему?

В этом году я начал участвовать в соревнованиях Kaggle и заметил, что для того, чтобы попасть в топ-5%, вам нужно знать об оптимизации гиперпараметров.

Каждая деталь имеет значение, когда вы хотите быть идеальным.

И вы должны стремиться к совершенству, если хотите создавать лучшие модели машинного обучения и глубокого обучения. Фактически, если вы посмотрите на модели, созданные ведущими специалистами по обработке данных на Kaggle, большая часть их успеха связана с оптимизацией гиперпараметров!

Как?

Ниже приведены несколько руководств, с которыми я столкнулся, и которые я планирую использовать, чтобы углубить свое понимание оптимизации гиперпараметров!

Спасибо за прочтение!

Надеюсь, это вдохновит вас спланировать то, чему вы хотите научиться в следующем году! То, что вы узнаете в следующем году, должно зависеть от вашего нынешнего уровня знаний, поэтому не думайте, что вам нужно следовать этой статье - возьмите то, что вы хотите от нее. :)

Этот год был невероятным путешествием, и это только начало. Если вы хотите отправиться со мной в это путешествие и вместе изучать эти темы, обязательно подписывайтесь на меня на Medium.

Не знаете, что читать дальше? Я подобрала для вас другую статью:



Теренс Шин