В этом месяце KDNuggets опубликовали опрос, в котором они спрашивали пользователей, какие языки обработки данных они используют. Впервые больше пользователей заявили, что используют Python, чем R.

Помимо валидности этого опроса и его методологии, я нахожу его интересным прежде всего потому, что он отражает мой собственный опыт за последний год.

Большую часть 2016 года, а также ранее я был в основном пользователем R. Я использовал его для простого моделирования и более глубокого анализа. Но я никогда не использовал его для написания «производственного» кода. Я всегда находил это немного громоздким.

Когда я начал работать над сложным проектом машинного обучения, для которого требовалась хорошая основа, я начал использовать Python. На самом деле, на данный момент он мне нравится больше, чем R, почти для всех задач.

На мой взгляд, это на несколько порядков лучше для написания поддерживаемого, понятного кода производственного уровня (возможно, не совсем на уровне Java, но все же чертовски хорошо). Он также непревзойден, когда речь идет о внедрении новейших технологий машинного обучения. И даже когда дело доходит до анализа, такие инструменты, как numpy и scikit-learn, реализованные в блокноте Jupyter, чрезвычайно приятны в использовании, а также обеспечивают большую гибкость и надежность.

Я даже не хочу думать о том, как я мог реализовать глубокую сеть или RL с реальными конвейерами данных и командой из нескольких человек в R. Это заставляет меня содрогаться.

В будущем я не удивлюсь, если эта тенденция усилится. Экосистема Python в последнее время стала действительно хорошей. Его сообщество столь же активно, как и сообщество R, его база инструментов и библиотек растет, и у него есть фреймворки глубокого обучения и обучения с подкреплением, которые сметают все остальное с ног на голову.

Я думаю, что место для R обязательно найдется. Я все еще очень люблю его для множества разовых задач анализа. Но лично я буду использовать Python почти для всего в будущем, как для кода производственного уровня, так и для анализа. Я люблю хороший блокнот Jupyter.