Публикации по теме 'data'


Вычисление кривой ROC с помощью Python
Вычисление кривой ROC с помощью Python Кривые ROC обычно показывают истинное положительное значение по оси Y и ложное срабатывание по оси X. Это означает, что верхний левый угол графика является «идеальной» точкой: ложноположительный показатель равен нулю, а истинный положительный показатель равен единице. Это не очень реалистично, но означает, что большая площадь под кривой (AUC) обычно лучше. Кривые ROC обычно используются в двоичной классификации для изучения результатов работы..

Модель машинного обучения: типы, требования к данным и подготовка
Машинное обучение — это тип искусственного интеллекта, который учит компьютеры думать так же, как люди: учась на предыдущем опыте и совершенствуя его. Машинное обучение может автоматизировать практически любую операцию, которая может быть выполнена с использованием шаблона или набора правил, определяемых данными. Машинное обучение — это область исследования, которая фокусируется на обучении компьютерных программ и алгоритмов для улучшения выполнения конкретной задачи. Инсайты,..

Строим будущее с помощью Databricks!
Изучение компании "элиты данных" и того, какие решения они могут предложить Ломать (данные) кирпичи за кирпичиком! Основанная в 2013 году настоящими OG ... создателями Apache Spark, Delta Lake и MLflow, Databricks представляет собой единую платформу для всех ваших потребностей в данных. Это компания-разработчик программного обеспечения (Data + AI), которая предлагает Unified Data Analytics Platform (UDAP) и в основном построена на современной архитектуре Lakehouse в облаке. В..

Это самый быстрый алгоритм сортировки когда-либо
Я пишу информационный бюллетень для учащихся под названием Mighty Knowledge. Каждый новый выпуск содержит ссылки и основные уроки из самого лучшего контента, включая цитаты, книги, статьи, подкасты и видео. Каждый выбран специально для того, чтобы научиться жить более мудрой, счастливой и полной жизнью. Зарегистрируйтесь здесь . Timsort - самый быстрый алгоритм сортировки на свете. Сделано разработчиком для разработчиков. Он создан для реального мира, а не для академических..

Что такое наука о данных и как она изменила мир?
Наука о данных — это сочетание различных инструментов, алгоритмов и принципов машинного обучения с целью обнаружения скрытых закономерностей в необработанных данных (Sharma, 2019). Термин «наука о данных» появился совсем недавно, чтобы конкретно обозначить новую профессию, которая, как ожидается, будет иметь смысл в обширных хранилищах больших данных (Press, 2013). Хотя этот термин часто применяется в настоящее время, он обсуждался в основном математиками, учеными-компьютерщиками и..

Понимание смысла существования могучей очереди
Знание того, когда и как развернуть этот простой и универсальный инструмент, может быть чрезвычайно полезным вариантом при проектировании системы данных . Следующий сценарий действительно имел место в моей карьере, и это был момент, когда назначение очереди в системе «щелкнуло» и стало ясно в моем сознании. Я надеюсь, что рассказ об этой проблеме, о возникшей в результате борьбе и о том, как я ее решил, окажет на вас такое же влияние. Пятница во второй половине дня В офисе..

MVP #86: Как создать динамический список в Excel
Подумайте об этом: у вас есть список продуктов, список со временем растет, и вы хотите, чтобы ваша диаграмма Excel продуктов по сравнению с продажами автоматически отображала любые дополнительные продукты, которые вы добавляете. Или, может быть, это ежедневный отчет о продажах, и вы хотите, чтобы диаграмма автоматически расширялась, чтобы показать новые добавленные даты. Что ж, вам нужно создать динамический список (правильный термин — диапазон, но давайте один с легким пониманием..