Вы, как разработчик программного обеспечения, пробовали запускать модель машинного обучения? Если вы ответили «нет!», Не волнуйтесь, эта статья проведет вас через шаги по внедрению модели машинного обучения и объяснит некоторые различия, которые могут быть обнаружены в машинном обучении и традиционном программировании.

Теперь давайте перейдем к теме, о которой мы действительно думали. Как разработчик, вы могли бы создать компьютерную программу, построив некоторые классы, переменные и методы, верно? внутри методов вы формируете бизнес-логику в соответствии с требованиями, используя условия, другими словами, вы помещаете операторы if / else, switch для управления потоком данных по мере необходимости и получения вывода. Чтобы продемонстрировать такую ​​задачу, мы рассмотрим простой пример классификации цветов ириса по их размерам.

Давайте напишем код!

Мы можем написать простую программу для вывода видов цветов ириса для заданных измерений следующим образом:

Хорошо, мы написали некоторый синтаксис ES6 для вывода названия вида ирисов в консоль. Ну что плохого в таком подходе? Позвольте мне прояснить это для вас. Сколько условий вы бы написали, чтобы охватить все возможные измерения, чтобы соответствовать выходным данным, список можно продолжить ... не так ли?

Какой «ЕСЛИ» мы используем вместо этого машинное обучение?

Многие считают набор данных Iris «Привет, мир» для машинного обучения. Вот почему мы взяли цветы ириса в предыдущем примере, написанном на Javascript, но это простая программа, а не модель машинного обучения. В дальнейшем мы будем писать код на Python, поскольку это самый популярный язык для задач машинного обучения.

Сначала мы импортируем необходимые библиотеки Python.

Затем мы должны назначить набор данных диафрагмы переменной, назовем ее iris_data.

Давайте посмотрим на названия видов ирисов, которые доступны в нашем наборе данных.

Это выведет 3 вида ирисов, доступных в нашем наборе данных: [‘setosa’, ‘versicolor’, ‘virginica’]. Далее мы распечатаем доступные размеры для этих видов ирисов.

[«Длина чашелистика (см)», «ширина чашелистника (см)», «длина лепестка (см)», «ширина лепестка (см)»]

Наконец, давайте напечатаем форму загруженного набора данных.

Это выведет (150, 4), что означает, что в нашем наборе данных доступно 150 строк данных.

Теперь нам нужно отделить тестовые и обучающие данные из нашего набора данных, чтобы передать их в нашу модель машинного обучения. Мы делаем это следующим образом:

Как видите, мы берем 30 процентов данных из набора данных для тестирования модели, а остальные 70 процентов - для обучения модели. Теперь мы готовы запустить нашу модель машинного обучения.

После запуска мы можем обучить модель с набором данных радужной оболочки глаза.

Теперь мы можем оценить результаты тестов для нашей модели машинного обучения.

Получится 0,98, что очень хорошо! Наконец, мы будем прогнозировать вид ириса с помощью данных измерений в нашей модели.

Предполагаемый вид ириса: [‘setosa’]

Вот и все, ребята! Надеюсь, эта статья окажется для вас полезной. Мне пришлось отказаться от визуализации таких компонентов, как графики и таблицы, поскольку я хотел сделать эту статью максимально простой для понимания, особенно для тех, кто разрабатывает программное обеспечение. В следующих статьях я расскажу о подробностях. А пока желаю Вам удачного ̶c̶o̶d̶i̶n̶g̶ машинного обучения!

Вы можете получить полный код из моего репозитория на github и нажать кнопку «Открыть в Colab», чтобы сразу же поэкспериментировать с ним, используя google colaboratory.

Https://github.com/shalindasuresh/machine_learning_python/blob/main/classify_iris_knn.ipynb