Наука о данных

Первая книга, необходимая для успеха начинающего специалиста по данным

Спойлер: Без предварительных условий, но Джоэл поднимет вас с нуля до героя.

«У новичка много возможностей, но у эксперта мало» - Сюнрю Судзуки.

Чаще всего быть новичком было сильной стороной. Я люблю новичков - в конце концов, я был одним из них.

У них большие мечты. Они хотят «добиться успеха» как специалисты по данным. Они знают, что многие добивались этого в прошлом, и их ничто не остановит. Они - «чистые листы», жаждущие знаний и роста. Они знают, что это будет нелегко, и готовы приложить усилия.

Если у вас аналогичное мышление все умеет, половина успеха выиграна. Вам нужно только немного совета, а все остальное есть в Интернете. Конечно, там слишком много шума, поэтому, если вы спросите меня, где искать, я бы посоветовал начать с этих курсов по науке о данных и дополнить их книгами.

Книги по науке о данных, особенно от известных издателей, собрали тонны полезной информации в одном месте. Большинство новичков сосредотачиваются на курсах и забывают о книгах. Пожалуйста, не делайте этой ошибки.

Я благодарен, что нашел именно эту книгу в ранние годы - она ​​сформировала мои знания и вселила уверенность. В этой статье я расскажу о первой книге, которую должен прочитать каждый начинающий специалист по данным.

Наука о данных с нуля, Джоэл Грус

Поскольку вы читаете это, я знаю, что у вас уже есть какое-то понимание науки о данных. Возможно, вы слышали об этом из сообщений YouTube, LinkedIn или даже из сообщений в блогах, подобных моему.

Но на мгновение, если я предположу, что вы ничего не знаете - Data Science from Scratch от Joel Grus возьмет вас за руку и перенесет из нуля в героя. Лучше всего то, что вам не нужны какие-либо предварительные условия, чтобы начать работу с этой книгой.

Вы можете взять книгу с Amazon или Oreilly и использовать этот репозиторий GitHub для всех кодов, используемых в книге.

Нет, это не спонсируемый пост - просто я извлек из книги огромную пользу в ранние годы. Если вы недостаточно уверены, вот почему вам, как начинающему специалисту по данным, это абсолютно необходимо.

Вам отведена роль самого реалистичного специалиста по данным.

Вас наняли в качестве специалиста по данным (это обязательно произойдет, мой друг).
Ожидается, что вы возглавите усилия по анализу данных в DataSciencester - социальной сети для специалистов по данным (опять же, рано или поздно это обязательно произойдет. .)

В прошлом DataSciencester не вкладывала много средств в развитие практики обработки и анализа данных, так что это будет ваша работа. Иногда вам будет мало помощи в вашей новой организации, если преобразование науки о данных происходит недавно и все еще продолжается. Но не волнуйтесь - Джоэл и его книга - ваш путеводитель.

На протяжении всей книги вы будете изучать концепции науки о данных, решая реальные проблемы, с которыми вы сталкиваетесь в DataSciencester. Вы будете использовать данные, предоставленные пользователями платформы, данные, основанные на взаимодействиях пользователей или на основе экспериментов, которые вы планируете.

Мне лично понравился этот нестандартный подход. Теперь, когда я знаю, какие проблемы мы решаем в реальной организации, я могу поручиться, что сценарий реалистичен. Когда придет время, вы будете готовы применить полученные навыки в любой реальной организации. Поверьте мне в этом.

Мне еще предстоит найти пропущенную важную тему.

Я постоянно выступал за то, чтобы быть агностиком языка, имея в виду, что наука о данных выходит за рамки языков, которые мы используем.

Но Джоэл придерживается самоуверенного подхода, заявляя, что Python - лучший язык для начала. Так что, если вам удобнее работать с R, эта книга не для вас. За исключением этой оговорки, оглавление застало меня врасплох. Я не смог найти ни одной важной темы, отсутствующей в списке.

Он начинается с темы «что такое наука о данных» и переходит к базовому питону, линейной алгебре, статистике, визуализации данных, вероятности, базам данных, машинному обучению, кластеризации, нейронным сетям, сетям, рекомендательным системам, НЛП и, наконец, большим данным.

Он действительно охватил круг тем, достаточный для новичка, не перегружая вас ненужными теориями из учебников и сложными блоками кода. По собственным словам Джоэла:

«В нем есть математика, но ровно столько, сколько необходимо. Там все соскабливают, убирают и возят. Есть машинное обучение. У него есть базы данных и MapReduce. Разумеется, он не входит глубоко в любую из этих проблем, но мне нравится думать, что он закладывает широкую и прочную основу ».

Как новичок, вы хотите, чтобы все было в одном месте.

Я обучал нескольких студентов и начинающих энтузиастов данных. Растущая проблема, с которой все они сталкиваются, - это информационная перегрузка. Ресурсов предостаточно, слишком много, что подавляет их и вообще сбивает с пути.

Чтобы решить эту проблему, нужно выбрать более простой путь и использовать меньше, но исчерпывающих ресурсов. И это самое большое преимущество этой книги - в ней есть все, что нужно новичку, в ОДНОМ месте.

Итак, вы берете эту книгу, изучаете концепции, применяете их в проектах. Вам не нужно беспокоиться о том, чтобы кого-то беспокоить или платить за все больше и больше онлайн-курсов; просто используйте эту книгу как руководство в первые дни.

Теперь, со временем, вы почувствуете себя комфортно с содержанием книги и довольно легко его поймете.

Это ожидаемо - и это тонкий признак того, что вы достигли несколько среднего уровня. Когда это произойдет, похлопайте себя по плечу и поздравьте себя, это всегда было целью.

Тогда вас ждут более интересные вещи, но давайте начнем сегодня?

Чтобы получить более полезную информацию о проникновении в науку о данных, честном опыте и знаниях, подумайте о присоединении к моему личному списку друзей по электронной почте.