Добро пожаловать в новую публикацию о подготовке набора данных к COVID-19, и мы следим за репозиторием GitHub, мы знаем, что COVID-19 повлиял на обе экономики, а также на все промышленность, из-за этого вируса большинство людей не ходят на работу, некоторые вообще не выходят из комнаты. Чтобы пресечь эту ситуацию, каждый врач в мире пытается найти вакцину, но это требует некоторого времени и тяжелой работы. Чтобы узнать, подействовал ли вирус или нет, врачи тратят три часа на проведение анализов, таких как анализ крови или любые тесты на пневмонию. Итак, инструменты ИИ делают эту работу за три минуты с максимальной точностью, в этом блоге мы собираемся узнать, как подготовить данные для COVID-19.

Во-первых, нам нужно установить библиотеки NumPy, Pandas, Opencv. Используйте следующие команды для установки всех библиотек.

$ sudo pip install numpy

$ sudo pip установить панды

$ sudo pip install opencv-python

Затем импортируйте все библиотеки в файл python.

Создавая класс для набора данных COVID, мы назвали его COVID_IMG.

Здесь создается параметризованный конструктор с параметрами self, path, label. и мы назначаем параметры классу, используя self. мы можем использовать их в любом месте программы

images_path — это функция только с параметром self, li_path — это переменная с пустым списком, которая собирает все пути к изображениям из заданной папки и сохраняет их в списке li_path. Это вернет полные пути изображений через список

img_read — это функция, которая соберет все массивы изображений в пустой список, img_values ​​и метки инициализируются как пустой список, одна из которых предназначена для подключения массивов изображений, другая — для меток, поскольку цикл будет брать все изображения одно за другим, а затем cv2. imread прочитает все изображения и преобразует их в матрицу NumPy, а затем cv2.resize изменит изображение на 244, 244, глубина будет одинаковой с 3 измерениями, img.flatten() - сгладить изображение в NumPy массив, и он будет преобразован в список с помощью to_list(), а затем мы добавим в пустой список, в то же время мы загрузим, наконец, метку в список меток, наконец, он вернет все метки , img_values

matrix_to_csv — это функция, которая помогает нам преобразовать все возвращаемые значения из img_read в параметры данных CSV в функции self, image_array, li, labels, val. Массив изображений будет содержать все значения массива всех изображений, li — это путь ко всем изображениям, метки — это все метки ко всем изображениям, Val — узнать, к какому классу принадлежит изображение, цикл for возьмет image_array и затем сравняет имя изображения с массивом, например, имя изображения 1.jpg и его значение [255, 255, 255, 33, 44, …] здесь ключ имя изображения и значение массив изображений все будет сохранено в изображение, а в противном случае оператор должен знать, к какому изображению принадлежит, следующие данные pd.DataFrame находятся в словаре данных, и он будет транспонирован и сохранен как файл CSV, затем мы добавим метки в CSV и сохранит его как окончательный, прежде чем он будет удален с помощью os.removeif это corona, он будет отправлен в оператор if или elif, это нормально, он будет отправлен в оператор elif, иначе функция будет передана

Метки содержат оба класса, цикл for будет принимать классы один за другим. класс и img_path вернут список всех изображений, функция img_read вернет метки и img_arrays для изображений, последняя функция преобразует все матрицы в файлы CSV.

слияние — это функция, которая помогает объединить обычный файл CSV и файл CSV короны в один файл CSV, он будет читать оба файла с помощью функции read_csv, затем он будет печатать формы обеих функций, функция добавления поможет добавить один набор данных к другому, здесь мы добавляем обычный набор данных CSV в набор данных corona, затем он распечатывает форму набора данных и сохраняет в каталоге, наконец, мы вызываем функцию

Еще две детали для завершения этого проекта

Спасибо