Добро пожаловать обратно! Наука о данных — это постоянно растущая область с множеством движений, карьера в этой области также очень крутая, поэтому давайте поговорим о некоторых инструментах, которые вы должны знать, чтобы получить должность в области науки о данных! Они используются в разных диапазонах, но я хотел убедиться, что они отличаются от стандартных «Python this» и «R that».

Хадуп

Во-первых, у нас есть Hadoop, это программное обеспечение с открытым исходным кодом, которое помогает обрабатывать большие данные. Из большинства вакансий по науке о данных, которые я видел, им требовался некоторый опыт работы с Hadoop. Теперь в этой части программного обеспечения есть несколько разных модулей: Common, HDFS, YARN и MapReduce, каждый из которых очень важен для изучения! Если вы хотите узнать больше о Hadoop, перейдите по ссылке ниже:



Гит

Затем у нас есть Git, это часть программного обеспечения, которое помогает вам отслеживать изменения для набора файлов. Теперь Git используется почти в каждой компании, он помогает вам управлять версиями вашего кода/файлов. Если вы хотите узнать больше о Git, перейдите по ссылке ниже:



Блокнот Юпитера

Далее у нас есть Jupyter Notebook, это еще одна программа, которая позволяет вам кодировать ваши проекты. Вот в чем дело, некоторые из вас могут рассматривать это как еще одну IDE, хотя на самом деле это конкретное программное обеспечение используется во множестве компаний, и это очень важный инструмент почти для каждой работы, связанной с программированием. Если вы хотите узнать об этом больше, перейдите по ссылке ниже:



Инструменты визуализации данных

Далее, еще одна очень важная вещь, которую должен знать каждый специалист по данным, — это некоторый набор инструментов визуализации данных, к счастью для вас, есть несколько вариантов на выбор. Лично мои любимые инструменты визуализации данных — Tableau, PowerBI и Google Data Studio (этот бесплатный). Если вы разбираетесь в нескольких инструментах BI, это может легко помочь вам получить работу по науке о данных.

Докер/Кубернетес

Наконец, одним из самых важных инструментов, которые вы могли бы понять как специалист по данным, является Docker или Kubernetes. Что делают эти программы? Ну, по сути, они позволяют вам разрабатывать и развертывать ваше программное обеспечение в виде контейнеров, что упрощает развертывание вашего кода. Docker и Kubernetes — одни из самых популярных программ для этого. Если вы хотите узнать о них больше, перейдите по ссылке ниже:





Вот оно! Это одни из самых важных инструментов, которые может изучить любой специалист по данным. Используете ли вы в настоящее время какие-либо другие инструменты для своих проектов по науке о данных? Я хотел бы услышать о вашем опыте!

Как всегда

если у вас есть какие-либо предложения, мысли или вы просто хотите связаться, не стесняйтесь связаться со мной / подписаться на меня в Твиттере! Кроме того, ниже приведены ссылки на некоторые из моих любимых ресурсов для изучения программирования, Python, R, Data Science и т. д.



Спасибо за прочтение!