Прогноз зарплаты
Машинное обучение
Машинное обучение – это приложение искусственного интеллекта (ИИ), которое предоставляет системам возможность автоматически обучаться и совершенствоваться на основе полученного опыта без явного программирования. Машинное обучение направлено на разработку компьютерных программ, которые могут получать доступ к данным и использовать их для самостоятельного обучения.
Подробнее…
Докер
Docker – это упрощенная контейнеризация, позволяющая настроить инфраструктуру за одну секунду с помощью образов, хранящихся в Docker. Узнайте больше о докере здесь.
В этой статье мы собираемся создать простую модель машинного обучения поверх контейнера, наша модель будет прогнозировать зарплату на основе опыта сотрудников.
Условие:
1. ОС Линукс
Установите Python в локальной системе
yum install python36 -y
Настройте репозиторий для Docker:
Создайте файл «/etc/yum.repos.d/docker.repo»
[dockerrepo] name=docker repo baseurl=https://download.docker.com/linux/centos/7/x86_64/stable/ gpgcheck=0
Установка Докера:
yum install docker-ce --nobest -y
Теперь давайте начнем создавать модель машинного обучения на верхнем контейнере докеров.
Извлеките образ и запустите док-контейнер
Убедитесь, что docker установлен в вашей системе с помощью docker — version, затем запустите docker и проверьте состояние docker.
Определить присутствие Docker
docker --version
Запустить службы Docker
systemctl start docker
Проверьте состояние служб Docker
systemctl status docker
Теперь у нас есть служба докеров, работающая в нашей системе RedHat 8. Теперь нам нужно вытащить образ Centos из dockerHub.
Чтобы извлечь любое изображение, используйте синтаксис
>> docker pull imageName:Tag
Здесь мы собираемся использовать последнюю версию Centos.
>> docker pull centos:latest
Итак, теперь наша последняя версия Centos загружена, и мы можем запустить контейнер.
Для создания контейнера необходимо использовать следующий формат
docker run -it --name Cont_Name Image_Name:Tag
Установите команды в необходимый контейнер
yum install clear net-tools python36 -y
Нам нужно установить некоторые библиотеки Python, которые мы собираемся использовать в коде машинного обучения.
- склерн
- панды
pip3 install pandas scikit-learn
Итак, наша базовая среда готова. Теперь нам нужно получить набор данных внутри док-контейнера. Файл SalaryData.csv в контейнер Centos в корневом каталоге.
Скопировать локальную систему в контейнер
docker cp <SOURCEFILE_PATH> <CONTAINER_NAME>:<DESTINATION_PATH> SOURCEFILE_PATH: Path to the file inside your baseOS i.e here RHEL8CONTAINER_NAME: Path of the container name in which you want to transfer file. Note: Container should be running. DESTINATION_PATH: Path inside docker container where you wanted to copy the file from baseOS.
Из локального Linux запустите команду ниже
docker cp SalaryData.csv 406102f68806:/
Здесь мы видим, что набор данных копируется в каталог контейнера.
SalaryData.csv успешно скопирован.
Модель прогнозирования заработной платы
Файл main.py для создания модели
vi main.py
Создание модели прогнозирования с использованием приведенного ниже кода
Теперь давайте проверим, работает ли он хорошо или нет. Запустите файл с помощью команды python3 main.py.
python3 main.py
Модель успешно создана и сохранена в файле salary_model.pkl.
Создайте код для предсказания зарплаты
vi predictSal.py
Теперь у нас есть созданная модель. Теперь, если мы хотим предсказать зарплату за опыт. Создайте файл predictSal.py и добавьте приведенный ниже код.
Теперь мы можем запустить этот скрипт. Сначала он загрузит модель и спрогнозирует зарплату на основе предоставленного нами многолетнего опыта.
python3 predictSal.py
Теперь мы успешно создали модель и сделали прогноз внутри док-контейнера.