3 лучшие книги, которые помогут вам изучить Data Science

Введение

Меня часто спрашивают, какие ресурсы я рекомендую людям, которые хотят начать свой путь в области науки о данных. В этом разделе перечислены книги, которые я рекомендую вам прочитать хотя бы раз в жизни как специалист по анализу данных.

Вам нужно прочитать эти книги, чтобы стать специалистом по анализу данных? Ответ - нет. В Интернете есть множество учебных пособий и бесплатных материалов, не уступающих этим книгам. Однако, если вы можете позволить себе их купить и читать как дополнительный материал, они могут стать очень хорошим источником для изучения. В отличие от онлайн-руководств, эти книги имеют структуру и преподают концепции организованным и структурированным образом. Это означает, что вместо того, чтобы тратить время на поиск в Интернете хороших руководств, вы можете потратить это время на обучение.

Книги, которые я рекомендую здесь, охватывают основные темы, которые вам необходимо изучить как специалист по данным: программирование (Python), анализ данных и машинное обучение (включая глубокое обучение). Я знаю, что есть много книг по каждой теме, но это те, которые я использовал в своем учебном путешествии, и я действительно могу их порекомендовать.

Программирование на Python

Как специалист по данным, вы должны быть в первую очередь хорошим программистом или, по крайней мере, работать над достижением навыков программирования хотя бы на одном языке. Я рекомендую изучить Python из-за его обычного использования в Data Science и относительно простой кривой обучения.

Эта книга похожа на библию о питоне. Он насчитывает около 1600 страниц и охватывает все основные и более сложные концепции Python.

Это хорошая книга для тех, кто начинает с Python, поскольку в ней есть подробные объяснения языка и концепций программирования, а содержание представлено в простой и понятной форме.

Это также будет очень хорошая версия для тех, кто какое-то время работает с python, но хочет улучшить его, улучшить понимание языка и общих концепций, особенно объектно-ориентированного программирования.

Вы можете получить эту книгу здесь (партнерская ссылка).

Анализ данных

Эта книга охватывает практически все, что касается анализа данных, очистки данных и предварительной обработки данных с помощью pandas. И чем занимается Data Science чаще всего?

К сожалению или к счастью, мы тратим большую часть времени на подготовку данных для использования в алгоритмах машинного обучения. Эта книга охватывает все, и достаточно Python для аналитика данных или младшего специалиста по данным, чтобы познакомиться с программированием и библиотеками, популярными для анализа данных.

Кроме того, эта книга написана Уэсом МакКинни, автором пакета pandas. И кто был бы лучшим человеком для изучения анализа данных, если бы не автор одной из самых популярных библиотек анализа данных Python, которая была создана.

Вы можете получить эту книгу здесь (партнерская ссылка).

Машинное обучение

Если бы вы купили только одну книгу о машинном обучении, это был бы мой выбор.

Это могла бы быть книга для начинающего специалиста по данным, желающего получить обзор алгоритмов машинного обучения и того, как их реализовать на реальных примерах с помощью scikit-learn.

Это также хорошая редакция для тех, кто уже знаком с концепциями машинного обучения и хочет книгу для быстрых ссылок и обзора.

Кроме того, в нем есть фантастический второй раздел, посвященный глубокому обучению с помощью Keras и TensorFlow.

Вы можете получить эту книгу здесь (партнерская ссылка).

Другие темы Data Science

Работа в области Data Scientist подразумевает не только программирование на Python, анализ данных и машинное обучение. Есть и другие темы, которые вам следует освоить в этой профессии. Первые области, которые приходят мне на ум, - это математика и статистика.

Я не рекомендую какие-либо книги по этим темам, поскольку я полагался на свои знания в средней школе и университете и дополнял эти знания онлайн-учебниками и ресурсами. Если я прочту хорошие книги по этим темам, я обновлю этот список.

Первоначально опубликовано на aboutdatablog.com: Best Data Science Books, 19 августа 2020 г.

PS: Я пишу статьи, которые объясняют основные концепции Data Science в простой и понятной форме на Medium и aboutdatablog.com. Вы можете подписаться на мой список рассылки, чтобы получать уведомления каждый раз, когда я пишу новую статью. А если вы еще не являетесь участником Medium, вы можете присоединиться здесь.

Ниже приведены другие сообщения, которые могут вам понравиться: