Машинное обучение — «Путь самозапуска!!!

Здравствуйте читатели!!! Добро пожаловать в TheBoringStuffs.

Вы слышали слово «Машинное обучение», бродили по Интернету и находили много-много руководств, в которых говорилось: «Прочитай эту книгу, пройди этот курс по машинному обучению, и ты получишь работу», «Следуй этому учебному плану, ты станешь инженером по машинному обучению». », «Смотрите мои видео, вы можете создать свой собственный стартап AI/ML» и этот список можно продолжить…

Если вы тот, кто получил такие ответы, то эта статья для вас!

В этой статье мы собираемся показать, как вы можете научиться машинному обучению самостоятельно!!!

Независимо от того, хотите ли вы стать специалистом по данным, использовать алгоритмы машинного обучения в качестве разработчика или добавить передовые навыки в свой набор инструментов для бизнес-анализа, вы можете освоить прикладные навыки машинного обучения намного быстрее, чем вы думаете.

Практически говоря, вам не нужна модная докторская степень по математике. Вам не нужно быть лучшим программистом в мире. И уж точно не нужно платить 15000 долларов за дорогие «курсы Bootcamp».

Вопрос не в том, как мне начать?

Вопрос в том, являетесь ли вы самостоятельным стартером? Вам нравится учиться на практических проектах? Вы целеустремленны и самомотивированы? Можете ли вы ставить перед собой цели и доводить их до конца? И если да, то вам понравится изучать машинное обучение. Вы сможете решать интересные задачи, мыслить с увлекательными алгоритмами и развивать невероятно ценный карьерный навык.

Самостоятельный способ освоить машинное обучение — учиться, «делая дерьмо».

Сначала люди будут тратить месяцы или даже годы на теорию и математику машинного обучения. Они будут разочарованы загадочными символами и формулами или обескуражены огромным объемом учебников и академических статей, которые нужно прочитать.

Для большинства людей самостоятельный подход лучше академического подхода в основном по трем причинам:

Вам будет веселее. Циклически перемещаясь между теорией, практикой и проектами, вы быстрее достигнете реальных результатов.
Вы приобретете практические навыки, которые требуются в отрасли. Бизнесу все равно, сможете ли вы получить доказательства. Им важно, сможете ли вы превратить их данные в золото.
Попутно вы создадите свое портфолио. С практическими проектами.

Короче говоря, способ самостоятельного запуска быстрее и практичнее.

Тем не менее, это возлагает на вас больше ответственности за выполнение. Надеюсь, эта статья поможет вам оставаться в стеке!!!

Вот несколько ключевых шагов к обучению машинному обучению посредством самообучения:

Создайте основу для программирования.
Погрузитесь в основную теорию машинного обучения.
Используйте пакеты машинного обучения для практики.
Погрузитесь глубже в интересные области с более крупными проектами.

Шаг 1. Создайте основу для программирования

Вам не нужно быть профессиональным программистом, чтобы изучать машинное обучение, но вам необходимо обладать основными навыками в этих областях. Изучайте Python, выполняя проект. Почему стоит выбрать Python для машинного обучения, выходит за рамки этой статьи. Но python лучше всего подходит для начинающих, и это широко используемый язык программирования в машинном обучении, у него самое лучшее и большое сообщество, когда мы говорим в контексте машинного обучения.

Как только вы познакомитесь с основами Python, вы сможете использовать библиотеки NumPy, pandas и Matplotlib.

NumPy — это библиотека для языка программирования Python, добавляющая поддержку больших многомерных массивов и метрик, а также большой набор высокоуровневых математических функций для работы с этими массивами. Более того, NumPy формирует основу стека машинного обучения. Вы увидите, если вы хотите построить свою собственную нейронную сеть без использования какой-либо другой библиотеки, NumPy поможет вам больше всего.

Pandas — это высокопроизводительная библиотека для структур данных и исследовательского анализа данных. Он построен поверх NumPy.

Наконец, изучите библиотеку Matplotlib, которая представляет собой гибкую библиотеку для построения графиков и визуализации.

Шаг 2. Изучите основную теорию машинного обучения.

Цель состоит в том, чтобы впитать как можно больше теории и знаний, чтобы заложить прочную основу.

Теперь некоторые люди могут задаться вопросом: «Если я не планирую проводить оригинальные исследования, зачем мне изучать теорию, если я могу просто использовать существующие пакеты машинного обучения?»

Это резонный вопрос!!

Однако изучение основ важно для всех, кто планирует применять машинное обучение в своей работе. Вот 5 причин для изучения теории машинного обучения:

Планирование и сбор данных. Сбор данных может быть дорогостоящим и трудоемким процессом. какие типы данных мне нужно собирать? Сколько данных мне нужно?
Предположения о данных и предварительная обработка. Разные алгоритмы имеют разные предположения о входных данных. Как мне выполнить предварительную обработку данных? мне его нормализовать? Устойчива ли моя модель к отсутствующим данным?
Интерпретация результатов модели. Представление о том, что машинное обучение — это «черный ящик», просто неверно. Да, не все результаты можно интерпретировать напрямую, но вам нужно уметь диагностировать свои модели, чтобы улучшать их. Как определить, подходит ли моя модель к переоснащению или недообучению? Как мне объяснить эти результаты заинтересованным сторонам бизнеса?
Улучшение и точная настройка моделей. Вы редко получаете лучшую модель с первой попытки. Вы должны понимать неудобство различных параметров настройки и регуляризации. Если моя модель дает переобучение, как это исправить? Должен ли я уделять больше времени разработке функций или сбору данных? Могу ли я собрать свои модели?
Повышение ценности для бизнеса. Машинное обучение никогда не осуществляется в вакууме. Если вы не совсем понимаете инструменты в своем арсенале, вы не сможете максимизировать их эффективность. Какие показатели результатов важнее всего оптимизировать? Есть ли другие алгоритмы, которые здесь работают лучше? Когда машинное обучение не подходит?

Хорошая новость: вам не обязательно иметь ответы на все эти вопросы с самого начала. На самом деле подход заключается в том, чтобы изучить достаточно теории, чтобы начать работу и не сбиться с пути. Затем со временем вы сможете овладеть мастерством, чередуя теорию и практику.

Мы рекомендуем известный курс Эндрю Нг, который является золотым стандартом, когда речь идет об изучении теории машинного обучения. ("курс")

Шаг 3. Используйте пакеты машинного обучения для практики

В Интернете представлено множество библиотек Python, мы рекомендуем вам выбрать одну из них, перечисленных ниже:

Scikit-learn. Scikit-learn или sklearn — это золотой стандарт библиотеки Python для машинного обучения общего назначения. Он делает почти все и имеет реализации всех распространенных алгоритмов. Scikit-learn docs.
Theano: Theano — это библиотека Python, которая позволяет нам эффективно оценивать математические операции, включая многомерные массивы. Он умеет брать структуры и преобразовывать их в очень эффективный код, использующий numpy и некоторые нативные библиотеки. Теано документы.
PyTorch: создатели PyTorch говорят, что у них есть философия — они хотят быть императивными. Это означает, что мы запускаем наши вычисления немедленно. PyTorch — это библиотека на основе Python, созданная для обеспечения гибкости платформы разработки машинного обучения. PyTorch прост в использовании, имеет поддержку Python, графики динамических вычислений. Документы PyTorch.
Tensorflow. В настоящее время это самая известная в мире библиотека машинного обучения. Tensorflow — это бесплатная программная библиотека с открытым исходным кодом для потоков данных и дифференцированного программирования для различных задач. Первоначально TensorFlow был создан только для разработчиков Google, но затем Google открыл его исходный код.

Шаг 4. Погрузитесь глубже в интересные области с более крупными проектами.

Хорошо, теперь самое интересное! До сих пор мы рассмотрели предпосылки и основную теорию. Теперь мы готовы к более глубокому погружению в некоторые более крупные проекты.

Цель этого шага — попрактиковаться в интеграции методов машинного обучения в полный сквозной анализ.

Вы можете попробовать набор данных Kaggle, попробовать решить задачи, поставленные на Kaggle, поучаствовать в соревнованиях Kaggle. Создайте свою сеть с такими же инженерами машинного обучения, как и вы.

Выберите интересный проект, который вас увлекает, или решите интересующую вас реальную проблему, например, в здравоохранении, биомедицине, финансах, бизнесе и т. д. Честно говоря, это лучшая часть обучения машинному обучению.

И последнее, но не менее важное: попробуйте построить алгоритм с нуля.

Загрузите все проекты, коды с хорошо документированными на GitHub. Это также поможет вам составить свое резюме.

Отличная работа! (Пока….)

Поздравляем с окончанием руководства по самостоятельному изучению.

Нам еще многое предстоит узнать! Например, глубокое обучение, компьютерное зрение и обработка естественного языка — это лишь немногие из увлекательных передовых областей, которые ждут вас.

Ключ к тому, чтобы стать лучшим инженером по машинному обучению, — это никогда не прекращать учиться. Добро пожаловать в начало вашего пути в этой динамичной и захватывающей сфере.

Спасибо :)

Подписывается на нас в Instagram, Telegram и Facebook.

Раскройте потенциал машинного обучения и искусственного интеллекта.