Выберите Python в качестве первого языка и параллельно изучайте R

Введение

Когда я учился на бакалавриате по математике, мне приходилось использовать почти исключительно R. Мне также пришлось использовать его во время моей степени магистра наук о данных.

Однако во время учебы в магистратуре я обнаружил, что использую Python гораздо чаще, чем R; Я нашел его более интуитивно понятным в использовании и приятным для изучения в рамках науки о данных и за ее пределами.

Прежде чем появятся вилы, имейте в виду, что оба инструмента по-прежнему широко используются в науке о данных. Тем не менее, люди, которые хотят сделать карьеру в области науки о данных, вероятно, больше выиграют от использования Python по причинам, которые я буду обсуждать ниже.

Если вы хотите посмотреть что-то вместо этого, вы можете посмотреть мое видео ниже на ту же тему.

Язык общего назначения

Python создавался с нуля как язык программирования общего назначения. Это означает, что вы можете использовать его для выполнения различных задач. Например, вы можете использовать Python для:

  • Наука о данных.
  • Разработка веб и игр.
  • Веб-приложения.
  • Робототехника.

Напротив, R в основном используется для анализа и статистики. Он не создан для того, чтобы быть языком общего назначения. Почти каждый статистик, который занимается академическими исследованиями, которого я встречал, будет придерживаться R по этой причине: он чрезвычайно продуктивен в том, для чего он предназначен.

Но по мере дальнейшего изучения науки о данных я обнаружил, что хочу использовать что-то гибкое. Python дал мне больше возможностей для моей карьеры в науке о данных, потому что он уже используется для многих вещей внутри и за пределами науки о данных.

С точки зрения хобби, Python также облегчил мне изучение других областей, таких как разработка игр или приложений; хотя они не связаны с наукой о данных, они мотивируют меня практиковаться в кодировании так, как R не может. Я чувствую, что новички в науке о данных часто упускают это из виду.

Читабельность

Python очень легко читать, потому что это язык, который читается как речь. Поэтому неудивительно, что в настоящее время это один из самых популярных языков программирования для детей.

Лично у меня нет опыта программирования, и R был моим первым языком программирования. Его синтаксис был чрезвычайно неудобным для меня. Когда несколько лет спустя я перешел на Python, это было как глоток свежего воздуха.

Python — это язык высокого уровня. Это означает, что он абстрагирует больше деталей, облегчая чтение. Напротив, такие языки, как R и C++, считаются языками низкого уровня. Таким образом, для написания одной процедуры на R потребуется больше кода, чем на Python.

Наконец, есть еще одна вещь, о которой я не задумывался, пока не начал подавать заявки на работу в области науки о данных: читабельность может быть преимуществом на собеседованиях по программированию.

Код, который легко написать, означает, что вы сможете решать проблемы быстрее. Легкость чтения также означает, что интервьюерам легче следовать и понимать ваш код. Даже если бы мой основной язык программирования был другим, это было бы серьезной причиной для меня придерживаться Python на собеседованиях по программированию.

Популярность

Большинство людей уже знают, что Python — один из самых популярных языков в мире. Это во многом благодаря его гибкости и удобочитаемости, как мы уже обсуждали.

Эта популярность привела к очень большому сообществу Python. Следовательно, если у вас есть проблема, вы, скорее всего, найдете кого-то, кто может помочь.

Это становится чрезвычайно удобным, если вы интересуетесь более техническими аспектами науки о данных. Тратя меньше времени на устранение проблем, вы больше времени уделяете влиянию на бизнес. А благодаря гибкости Python вы можете перенести полученные знания в другие дисциплины.

Однако, исходя из R, Python, кажется, испытывает недостаток в очень специализированном сообществе статистиков и статистических исследователей.

Я помню, что лучше справлялся с более сложной статистикой в ​​R. Мне было проще найти более конкретную статистическую помощь. Больше всего мне помогли многие профессора статистики, у которых уже был большой опыт работы с R. У них было прекрасное понимание того, как работают статистические функции, что я нахожу менее распространенным в сообществе Python.

Поэтому, если вы стремитесь стать экспертом в области статистики или исследователем статистики, то вы идеально впишетесь в сообщество R. Однако для других вещей я бы предложил Python, поскольку его сообщество больше во всем остальном.

Глубокое обучение

Многие ключевые проекты глубокого обучения сначала выполняются на Python. Это означает, что если вы считаете глубокое обучение интересным, Python, скорее всего, будет наиболее подходящим.

Теперь R определенно также используется для глубокого обучения. Однако такие библиотеки, как Tensorflow, Keras и PyTorch, были сначала написаны или выражены на Python до того, как стали доступны их версии R.

Кроме того, поскольку Python является языком общего назначения, модели на основе Python проще развертывать в широко используемых и хорошо поддерживаемых средах Python. Маловероятно, что в большинстве компаний уже есть среда R, поэтому, если ваша роль связана с развертыванием модели, R ограничит ваши возможности.

Заключение

Для многих новичков в науке о данных выбор языка программирования похож на выбор реального языка. Он становится вашим родным языком, и позже будет сложнее перейти на другой язык.

После использования R в академических кругах использование R имеет большой смысл для академических исследователей. При этом для большинства обычных специалистов по науке о данных другие преимущества использования Python, вероятно, перевешивают академическую и статистическую специализацию R.

Имея это в виду, выберите Python в качестве своего первого языка. Вы можете немного изучить R для статистики и исследовательского анализа данных. На мой взгляд, это принесет больше пользы вашему путешествию по науке о данных, и это то, что я хотел бы сделать много лет назад. На самом деле у меня уже есть видео о том, как бы я снова выучил Python для науки о данных.

Как всегда, если вам понравилась эта статья, вы можете посмотреть другие мои видео на YouTube. Если вы хотите узнать, чем я занимаюсь по электронной почте, вы можете подписаться на мою новостную рассылку!

Первоначально опубликовано на https://leonlok.co.uk 30 января 2022 г.