Добро пожаловать обратно! Что ж, эта статья о Tesla, которую я написал на днях, стала довольно вирусной, так что теперь давайте немного подробнее рассмотрим языки программирования, которые использует Tesla, в частности языки, которые они используют для науки о данных. Процесс поиска этих языков был чрезвычайно сложным и сложным, шучу, я просто зашел на страницу их карьеры, посмотрел на должности в области науки о данных и подсчитал, какие языки программирования им требуются:

Языки

Самыми популярными языками, которые я видел, как Tesla использует на должностях в области науки о данных, являются: Python, Scala, MATLAB, R и SQL, им также требовался опыт работы с: Pandas, Numpy, Docker, Kubernetes, распределенными вычислениями, Tableau, RShiny, Matplotlib, PowerBI и машиной. обучающие пакеты (sci-kit learn, Tensorflow и т. д.). Если это все, что вы хотели знать, милости просим ☺️, иначе давайте поговорим об этих языках подробнее!

Python

Начнем с того, что Python на сегодняшний день является одним из самых популярных языков программирования, он используется для множества разных вещей, одна из которых - наука о данных. Некоторые позиции в области науки о данных были гибридными позициями в области науки о данных / разработки программного обеспечения, Python - отличный баланс обоих этих случаев. Для большинства этих должностей требуется опыт, в столбце Приятно иметь, с Pandas и Numpy, это очень популярные пакеты обработки данных с Python:

Ниже приведен раздел со страницы их карьеры, в котором упоминается опыт работы с Python:

Скала

Scala - еще один довольно популярный язык, ориентированный на объектно-ориентированное / функциональное программирование. Этот язык в значительной степени построен на Java, но в нем все еще есть некоторые функции, которые, возможно, лучше для специалиста по данным, чем Java. Кроме того, огромный инструмент, который используется в сообществе Data Science / Data Engineering, - это Apache Spark, этот инструмент построен на Scala. Поскольку Tesla также требовался опыт работы с распределенными вычислениями, неудивительно, что они упоминают Scala как требование. Ниже приведен раздел из науки о данных Tesla, в котором упоминается Scala:

MATLAB

MatLab - еще один популярный язык программирования, который используется для множества различных проектов по обработке данных. Я определенно не создавал ничего супер-сумасшедшего с этим языком лично (кроме некоторых проектов линейной интерполяции), но я понимаю ценность этого языка. Этот язык отлично подходит для анализа данных, разработки алгоритмов, создания настольных / веб-приложений, и одной из моих любимых функций этого языка было кодирование в облаке, это позволяло мне не обязательно устанавливать программное обеспечение MATLAB на моем персональном компьютере, но я был все еще может кодировать / компилировать в веб-браузере (как Google Colab). Ниже приведен раздел из позиции Tesla Data Science, в которой упоминается опыт работы с Matlab:

SQL

Далее у нас есть SQL, технически это язык запросов, но он по-прежнему очень ценный язык для изучения. Это не заменяет какой-либо другой язык в этом списке, вы должны изучить SQL и комбинацию других языков из этого списка. Этот язык, по сути, позволяет вам создавать базы данных и управлять ими, по сути, именно здесь хранятся наши данные. Чтобы не усложнять задачу (и чтобы побудить вас изучить это), я бы, вероятно, сказал, что каждая должность в области науки о данных, которую я когда-либо видел, требовала определенного знания SQL (или NoSQL, MySQL и т. Д.). По сути, вы должны знать SQL, чтобы стать специалистом по данным, к счастью для вас, выучить этот язык не так уж и сложно. Ниже приведен отрывок из позиции Tesla Data Science, в которой упоминается опыт работы с SQL:

R

Далее идет R, один из моих любимых языков программирования. Это статистический язык, я лично считаю, что R - это мой язык для Data Science, он действительно страдает от одной конкретной области - машинного обучения. Хотя у R есть несколько пакетов машинного обучения (Tensorflow), большая часть документации / руководств основана на Python, поэтому это означает, что большинство компаний в конечном итоге будут использовать Python вместо R, если это отвлечет вас от изучения R? Абсолютно нет, многие компании по-прежнему полагаются на R-программистов при обработке данных. Ниже приведен раздел со страницы карьеры Teslas, в котором упоминается опыт работы с R:

Как всегда

Как всегда, если у вас есть какие-либо предложения, мысли или вы просто хотите пообщаться, не стесняйтесь связаться / подписаться на меня в Twitter! Кроме того, ниже приведены ссылки на некоторые из моих любимых ресурсов по изучению программирования, Python, R, Data Science и т. Д.



Спасибо за прочтение!