Я начал изучать науку о данных примерно за 3 года до того, как начал изучать науку о данных. Если это звучит для вас запутанно, представьте, как я был запутан. Вот история: я работал бизнес-консультантом по организационной культуре, это означало, что я помогал компаниям ориентироваться во всех тонкостях того, как они могут создавать правильную политику, среду и программы развития, которые способствуют поведению, которое представляет их желаемую культуру. Поскольку одной из основных и наиболее важных рекомендаций здесь является постоянное развитие, оставаться в курсе событий и узнавать новое было и остается большой частью моей жизни.

Итак, несколько лет назад, читая в новостях все больше и больше о науке о данных и машинном обучении, я решил узнать об этом побольше. После небольшого поиска в Интернете и нескольких видеороликов на YouTube я решил записаться на онлайн-курс Университет Джона Хопкинса через Coursera: наука о данных: основы использования R. В конце концов, он охватывал все, что, по моему мнению, мне было нужно, он собирался научить меня программированию (я не занимался программированием с тех пор, как мне исполнилось 10 лет, на компьютере Texas Instrument с языком Basic, сохраняя или, точнее, записывая , на кассете с магнитной лентой), а также некоторые более глубокие статистические данные (я читал, что они очень важны для науки о данных), это было самостоятельное обучение, онлайн и от очень узнаваемого учреждения.

Все началось чудесно, я узнал некоторые основы того, что такое наука о данных (и понял примерно половину), и начал понимать некоторые основные концепции программирования на R. Тем не менее, проблемы накапливались очень быстро, и, как и в то время, мой уровень терпимости к тому, что мой код не работает, был очень низким (и, как знает любой, кто научился программировать, неудача — это большая часть обучения и еще большая часть). фактического программирования).

Итак, я перешел к другим вещам, возвращаясь, когда меня настигало настроение, и снова уходил, когда мое настроение снова менялось. Это были мои отношения любви и ненависти к науке о данных в течение 3 лет.

Моя жена, которая также является моим деловым партнером, и я некоторое время работали над идеей относительно способов диагностики человеческого развития для нашего консалтингового бизнеса. Когда мы работали над первоначальной разработкой, однажды вечером мы смотрели документальный фильм под названием «Великий взлом» о том, как такие компании, как Cambridge Analytica, использовали поведенческую экономику и машинное обучение для манипулирования людьми. В тот день что-то щелкнуло, и мы начали все больше и больше говорить о том, что если вы можете разработать системы, выявляющие худшие стороны нашей природы, мы также можем создать что-то, что делает полную противоположность, подталкивает людей, чтобы помочь им стать лучше.

В течение следующих нескольких месяцев я читал и исследовал это, а также модели машинного обучения, которые помогали людям. Я обнаружил, что большая часть литературы на эту тему связана с улучшением перспектив бизнеса и продаж, что совершенно логично, но это еще больше мотивировало меня, поскольку у меня были знания в области психологии, психометрии и поведенческой экономики. Наука о данных.

Большой урок здесь, и извинения Саймону Синеку за то, что он взял слова из своей книги: начните с «Почему». Если у вас есть четкая цель, обучение становится намного более приятным, все новое, что вы открываете, становится четкой идеей для будущего проекта, каждый раз, когда вы сталкиваетесь с проблемой, вы находите способ ее преодолеть, потому что цель вашего путешествия настолько важно, что восхождение на самую большую гору — это просто способ добраться до другой стороны.

Итак, дорогой читатель, подумывающий о том, чтобы войти в невероятный мир науки о данных (и особенно обо мне несколько лет назад), прежде чем вы даже начнете планировать, что изучать, прежде чем столкнуться с вечными спорами о Python или R, прежде чем обнаружите, что вы будете нужно изучать линейную алгебру и исчисление, и даже прежде чем задать странный вопрос о том, почему байесовский наив (извините за шутку о компьютерной статистике), спросите себя: почему я хочу изучать науку о данных.

Не пытайтесь придумать оправдание, а причину, цель. Это может быть что угодно, если это очень важно для вас и только для вас. Помните, что эта причина будет вашим путеводным светом, источником почти безграничного мужества и мотивации. Он пронесет вас, когда вы боретесь с *args и *kwargs, он проведет вас через случайные леса и K-соседей, он даст вам силы через собственные векторы и PCA, и он будет сопровождать вас каждую долгую ночь, каждую сломанную модель и каждую ошибку. в вашем коде.

Ваша цель будет направлять вас на каждом этапе пути к науке о данных.

Надеюсь, наши пути пересекутся…

Джек Райфер Барух

Подпишитесь на меня в Твиттере: @JackRaifer

Подпишитесь на меня в LinkedIN: jackraifer

Следующая история: вечный конфликт Python и R

О серии «Путь к науке о данных»

Сегодня я работаю над первыми шагами очень интересных проектов для человеческого развития, основанных на науке о данных и машинном обучении.

Но не так давно (на самом деле, совсем недавно) я чрезвычайно мало знал о науке о данных и еще меньше знал о том, что все это значит (и я все еще узнаю об этом все больше и больше с каждым днем). В моем стремлении переосмыслить себя от психолога, работающего в области поведенческой экономики, до специалиста по данным, я прошел невероятно интересный путь и многому научился. Эта серия в основном является письмом самому себе из прошлого, чтобы помочь всем, как я, пройти этот удивительный путь и, к счастью, избежать некоторых ошибок, которые я совершил на этом пути из-за недостатка знаний или перспективы.

Надеюсь, вам понравятся мои бредни так же, как я нашла радость на пути к науке о данных.

Нужна помощь в путешествии?

Это может быть трудным путем в одиночку, поэтому не стесняйтесь обращаться ко мне через LinkedIN или Twitter. Я начал эту серию из-за инициативы #66DaysOfData Кена Джи, это отличный способ связаться и получить поддержку, так что просто проверьте Кена в Твиттере @KenJee_DS и присоединяйтесь к вызову #66DaysOfData.