Я много месяцев работал над тем, чтобы понять машинное обучение. Это самый мучительный опыт, но, с другой стороны, это волнующий опыт. У меня нет никакого опыта, связанного с ИТ или Advanced Calculus. Действительно, я изучаю математику на предыдущем уроке в колледже, но иногда память может угаснуть, если ею не пользоваться каждый день, я прав?
Поэтому мне приходится изучать основы машинного обучения. Я не посещал платные обучающие курсы. Так что я учусь везде, где я могу получить бесплатно. Честно говоря, для меня это не лучшая практика, потому что иногда мне нужно руководство. Затем я прошу своего менеджера одобрить платное обучение машинному обучению для лучшего понимания. После одобрения присоединяюсь к программе обучения, короче говоря, я получаю лучшее понимание, до сих пор не хватает опыта в обработке данных.
Перенесемся вперед, я случайно смотрю источники MIT о машинном обучении, MIT Deep Learning 6.S191 (introtodeeplearning.com). Лекторы – Александр Амини и Ава Солеймани. Лекция превосходна, как и ожидалось от Массачусетского технологического института. Я изучаю несколько фундаментальных вычислений, а также применение машинного обучения.
Затем я смотрю TensorFlow, который также является отличным каналом для начинающих. Название — Введение в машинное обучение (ML Zero to Hero). Там 4 части, и вы можете легко понять, что он сказал.
https://www.youtube.com/watch?v=KNAWp2S3w94
После просмотра и изучения других источников я пробую свой первый анализ в ирландском наборе данных, который вы можете скачать здесь https://www.kaggle.com/arshid/iris-flower-dataset/version/1. На самом деле, это лучшие данные для начала машинного обучения за пределами данных предварительной сборки TensorFlow.
Что вам нужно знать в машинном обучении потока, начинается с
- Что вы хотите от данных? Классификация? Прогноз? или другие?
- Понимание данных? Какой тип данных у него есть?
Если табличный, какие поля он имеет и есть ли пустые данные? Если изображения, то черно-белые или RGB? Есть ли поврежденные файлы? - Для табличных данных, если вы найдете нуль, вы хотите удалить или сделать интерполяцию самостоятельно? Это важно или нет? Ваши данные содержат временные ряды? Поскольку к данным временных рядов применяется другой подход, будьте осторожны.
- Сделайте некоторую очистку или предварительную обработку данных
- Разделите данные для тестирования и обучения
- Создайте проверенную модель, можете погуглить
- Создайте свою собственную модель, это хлопотная часть, потому что это пробные ошибки
- Постройте свой убыток и var_loss
- Сделайте прогноз на основе данных тестирования
- Нанесите данные прогноза и данные обучения на один и тот же график. Цель состоит в том, чтобы найти данные, которые уже соответствуют нашему требованию или нет.
- Сохраните модель, если вы уверены в ней. Если нет, повторите шаг 7
Это резюме, основанное на моем опыте после 3 месяцев обучения. Конечно, есть еще много возможностей для улучшения. Не стесняйтесь, пишите мне по адресу [email protected], чтобы эта статья нуждалась в редактировании или обновлении. Следующая часть — как обработать ирландский набор данных с помощью TensorFlow. Всем удачного обучения.