Публикации по теме 'data'


Работа с нулевыми значениями в Pandas Dataframe
Проблема пропущенных значений очень распространена в реальном мире. Например, предположим, что вы пытаетесь получить информацию от компании. Есть поле для адреса компании . Многие люди хотят сохранить свою конфиденциальность и оставляют это поле пустым. Если данные загружаются пандами, эти пустые поля отображаются как отсутствующие значения . NaN — это отсутствующее значение по умолчанию в pandas. В этой статье давайте посмотрим, как мы можем справиться с ними. Общие операции..

Как создать набор данных для классификатора изображений с нуля
Разработка процесса сбора данных в Интернете и их использования в проекте классификатора изображений (использование Beautifulsoup, Selenium) В этой статье я собираюсь представить конвейер, который я построил несколько недель назад для сбора данных (текста и изображений) с веб-сайта Turo , и процесс очистки собранных данных для использования их в проекте классификатора изображений. Заявление об ограничении ответственности: эти данные предназначены для моего использования (они мне не..

Повысьте свои инновации с помощью бесплатного ИИ
Инновации — ключ к успеху в современном быстро меняющемся мире. Для бизнеса крайне важно постоянно исследовать новые идеи и находить способы улучшить свои продукты и услуги. Однако инновация может быть сложным процессом, требующим значительного времени и ресурсов для исследования, разработки и проверки новых идей. К счастью, с появлением искусственного интеллекта (ИИ) предприятия любого размера теперь могут получить доступ к бесплатным инструментам и ресурсам ИИ, которые могут..

Нежное введение, чтобы понять исполнителя воздушного потока
Apache Airflow - это известный фреймворк Python с открытым исходным кодом для планирования задач. В экосистеме Airflow появилось много новых концепций; одна из тех концепций, которые нельзя пропустить, - Airflow Executor , которые являются рабочими станциями для всех запланированных задач. Airflow, как правило, удобен для конечных пользователей, и хорошее понимание Airflow Executor имеет решающее значение для личного использования, а также для производственной среды Airflow. В..

Как выбрать функцию потерь  — в чем я не согласен с Кэсси Козырковым
Выбор правильной функции потерь и показателей оценки важен для успеха вашего проекта по науке о данных. Но хотя об алгоритмах машинного обучения и общих тенденциях в нашей отрасли написано много, мне не попадалось много полезных советов на эту тему. В недавней статье Кэсси Козырков объясняет разницу между функциями потерь и оценочными метриками. Когда дело доходит до науки о данных и аналитики, Кэсси — отличный коммуникатор, и ее вклад в наше сообщество неоспорим. Но на этот раз она..

Создание карт из геолокаций в Python с помощью Folium
Введение: В этой статье блога мы узнаем, как создавать карты из геолокаций в Python с помощью библиотеки Folium. Folium — это мощная и простая в использовании библиотека для создания интерактивных карт с различными функциями, такими как маркеры и всплывающие окна. Мы будем использовать случайно сгенерированные геоточки в Европе, чтобы продемонстрировать этот процесс. В следующем примере кода показано, как создать карту со случайными географическими точками в Европе. Код будет..

Полное руководство по резюме специалиста по данным, чтобы ПОБЕДИТЬ менеджера по найму и ПОЛУЧИТЬ работу в качестве специалиста по данным
Роль науки о данных становится все более популярной на сегодняшнем рынке труда, учитывая гибкость, которую она дает соискателям. давайте узнаем некоторые советы по созданию отличного резюме на роль специалиста по данным в этом блоге. В этом блоге я поделюсь руководствами по составлению резюме для должностей, связанных с наукой о данных. Я поделюсь идеями и советами о том, как убедить HR и менеджеров по найму получить работу специалиста по данным. Перед тем, Двигаясь вперед, я хотел..