Публикации по теме data

Публикации по теме 'data'

Как я создаю прототип модели машины в 10 раз быстрее с помощью PyCaret

Если вы занимаетесь построением алгоритмов машинного обучения или управлением ими, вы хорошо знаете, что создание алгоритма машинного обучения — это трудоемкая задача. Вы тратите много времени на исследовательский анализ данных, подготовку данных, эксперименты с различными алгоритмами машинного обучения, их оптимизацию и оценку результатов. Позже вы тратите время на развертывание уже выбранной модели, например, на создание и докеризацию rest API. PyCaret предлагает решение для..

Большие ИИ, созданные с использованием неверных данных

Глядя на работу Кертиса Норткатта из Массачусетского технологического института по большому количеству ошибок в популярных наборах данных Те, кто работает в области ИИ, в том числе в Deepnews, любят анонсировать свои совершенно новые блестящие модели , подчеркивая, насколько они новаторские и эффективные в выполнении задач и помощи людям. Однако исходным материалом, который помогает этим моделям, являются данные, и некоторые члены сообщества, такие как предприниматель Эндрю Нг, все..

ELTIMS — Акроним новых данных

ETL не покрывает наши современные потребности в данных Каждое утро большинство из нас начинают свой день с проверки телефонов. Мы следим за тем, что происходит в мире, общаемся с друзьями и семьей и смотрим пару видеороликов о кошках. Все эти действия требуют, чтобы в фоновом режиме происходили десятки вещей, включая курирование и загрузку данных, которые обеспечивают то, что мы хотим видеть. В совокупности мы генерируем астрономический объем данных, около 2,5 квинтиллионов байтов в..

Сделайте так, чтобы ваши данные разговаривали!

От 0 до Hero в визуализации с использованием matplotlib и seaborn Если TL; DR : [ Link_To_Note ] Изменить: Фавио Васкес поставил +4 к этому сообщению и ответил «Замечательная статья! Поздравляю :) »- Фавио Васкес в Твиттере"!! Спасибо, Фавио Васкес . Это одно из моих постов из категории Tackle , которое можно найти в моем репозитории на github здесь . Все сообщения из этой категории: Как учиться на файлах BigData при нехватке памяти - инкрементное обучение..

Машинное обучение для чайников

Машинное обучение для чайников Несомненно, Машинное обучение - один из модных терминов в современном мире технологий. Алгоритмы машинного обучения пытаются учиться на данных , и чем больше данных доступно для изучения и чем богаче и полнее алгоритм, тем лучше он работает. В этом посте мы углубимся в работу некоторых из наиболее часто используемых алгоритмов. В идеале данные обучения (In) должны быть помечены (0n). Например, представьте, что мы хотим иметь алгоритм, который..

День, когда вы стали Кагглером: Часть IV Магия создания полнометражных фильмов!

День, когда вы стали Кагглером: Часть IV Магия создания полнометражных фильмов! Цены на жилье: передовые методы регрессии Ссылка на блокнот Jupyter: Github Машинное обучение 101, больше данных = больше точности. В нашем случае данные ограничены. 1460 тренировочных рядов. Тем не менее, есть потенциал для режима с использованием создания функций. Зачем беспокоиться? Создание признаков дает нашей модели больше информации. Возьмите пример. У нас есть две функции Date и..

SQL Snow Day Module 3: Агрегирование данных

Добро пожаловать в часть 3 книги SQL Snow Day: праздничное приключение по основам Postgres с bit.io ! В этом модуле вы изучите основы выбора и подмножества данных из вашей базы данных с помощью SQL. Прежде чем продолжить, убедитесь, что вы знакомы с материалом Модулей 1 и 2 . В этом модуле вы: Узнайте, как агрегировать и обобщать данные. Это означает поиск сводной статистики, такой как суммы и средние значения по всем данным или по подмножествам. Узнайте, как сохранить эти..