Путь обучения науке о данных
Если кто-то новичок и хочет начать учиться и освоить науку о данных, я рекомендую 5 мощных советов.
- Выберите одного автора и платформу
Я выбрал Эндрю Нг своим Гуру и научился почти всему тому, что знал от него. Когда вы будете следовать за одним автором, вы наверняка сможете настроиться на его образ мыслей и сможете эффективно учиться.
Если кому-то интересно следовать за ним, чтобы изучить машинное обучение, я бы порекомендовал серию, как показано ниже в порядке
- ИИ для всех (это предназначено для генеральных директоров, менеджеров, поэтому вы получите представление об ИИ на высоком уровне)
- Машинное обучение с помощью Coursera (упражнения выполняются в MATLAB/Octave, но все же хорошо начать с этого и параллельно разрабатывать код на Python для этих упражнений)
- Специализация глубокого обучения с Эндрю Нг (это 5 курсов, и очень хорошо изучать глубокое обучение с помощью Python)
Все эти курсы доступны на Coursera, поэтому вы можете придерживаться одной платформы, заплатив ежемесячную плату, и продолжить свое путешествие. Затем вы можете ссылаться на различные материалы, доступные на YouTube и других онлайн-платформах.
2. Выберите один язык программирования и IDE
Python, R, Julia и многие другие языки доступны для вашего путешествия по науке о данных. Но выберите один язык (я предлагаю python) и закончите все свои исследования на python. Тогда его всегда легко закодировать в R. Точно так же выберите одну конкретную IDE, либо блокнот jupyter со Spyder (оба доступны в anaconda), либо аналогичную IDE.
3. Откройте аккаунт GITHUB
Если у вас нет учетной записи GitHub, создайте ее в первый день обучения. Важно хранить все ваши заметки, упражнения и сертификаты в одном месте, и GitHub — хорошее место для хранения всего, и вы всегда сможете вернуться к своему коду позже.
4. Понимание платформ больших данных
Если вы работаете в проекте с большими данными, то это хорошо. Или начните создавать бесплатную учетную запись aws и изучите все облачные функции, поддерживающие разработку больших данных и алгоритмы машинного обучения.
Попробуйте создать простой классификатор, используя лямбда-функцию aws, имея входной файл в S3 и запуская лямбда-файл для создания и сохранения прогнозируемых результатов в S3. Sagemaker является обязательным для понимания.
Изучите другие платформы больших данных, похожие на aws, такие как Azure и т. д.
Вы можете составить список и. Ознакомьтесь со всеми инструментами и технологиями, используемыми в науке о данных.
5. Заинтересоваться
Этот шаг — бесконечное путешествие для специалиста по данным. Наука о данных — это постоянно развивающаяся область. Большая часть исследований и разработок происходит здесь. Поэтому вам должно быть любопытно выучить каждый термин, с которым вы сталкиваетесь в своем путешествии по науке о данных. Проявите любопытство, чтобы узнать статистику, полезную для науки о данных. Проявите любопытство к изучению математики, полезной для науки о данных. Проявите любопытство в творческих навыках презентации, полезных для науки о данных. Заинтересуйтесь изучением R. Заинтересуйтесь изучением новых навыков, связанных с наукой о данных. Думайте о науке о данных :)