Публикации по теме data

Публикации по теме 'data'

Изучение сверхновых с помощью исследовательских работ, часть 1 (Космология)

Космология сверхновой типа Ia, объединяющая данные миссии Euclid и обсерватории Веры С. Рубин (arXiv) Автор: А. Бейли , М. Винченци , Д. Сколник , Дж. -С. Куйландр , Дж. Родос , Е. Р. Петерсон , Б. Попович Аннотация: Миссия Euclid обеспечит первое в своем роде покрытие в ближнем инфракрасном диапазоне в глубоком (три поля, ~10–20 квадратных градусов каждое) и широком (~10000 квадратных градусов) полях. . Хотя исследование не предназначено для обнаружения..

Объяснимый ИИ (XAI): обеспечение лучшего понимания результатов ИИ

Повышение прозрачности и доверия к системам ИИ для улучшения процесса принятия решений По мере того, как искусственный интеллект (ИИ) продолжает развиваться и становится все более распространенным, растет потребность в том, чтобы системы ИИ были прозрачными и объяснимыми. Именно здесь на помощь приходит объяснимый ИИ (XAI) — область исследований, посвященная разработке систем ИИ, способных дать понятное объяснение своим решениям. Что такое объяснимый ИИ (XAI)? Объяснимый ИИ (XAI)..

Идентификация людей — в данных

Прежде всего: это *не* статья о том, как идентифицировать людей в анонимных или обезличенных данных. Речь идет о стандартных кодах и идентификаторах, которые вы можете использовать в наборах данных или базах данных, которые рассматривают людей как тип сущности . Это продолжение предыдущего поста о важности уникальных идентификаторов и связанного с ним Шпаргалки по уникальным идентификаторам . Глобального уникального идентификатора для людей не существует. И пока люди не..

Демистификация машинного обучения: понимание основ

ВВЕДЕНИЕ В МАШИННОЕ ОБУЧЕНИЕ Машинное обучение — это захватывающая область искусственного интеллекта, которая фокусируется на разработке алгоритмов и моделей, способных учиться на данных без явного программирования. Это позволяет компьютерам анализировать и интерпретировать сложные закономерности в огромных объемах данных, что приводит к прогнозам, принятию решений и автоматизации. В этом блоге мы углубимся в фундаментальные аспекты машинного обучения, включая принципы его..

Оптимизация гиперпараметров: поиск по сетке, случайный поиск и байесовская оптимизация в действии

Введение Модели машинного обучения часто требуют тонкой настройки для достижения оптимальной производительности в заданном наборе данных. Оптимизация гиперпараметров играет решающую роль в этом процессе. В этой статье мы рассмотрим концепции гиперпараметров, способы их установки и методы поиска наилучшей гиперпараметризации для данной проблемы. Мы будем использовать набор данных алмазов, доступный на Kaggle, и работать с Google Colab для наших примеров кода. Две цели, с которыми мы..

Документы для чтения по оптимизации портфеля

Обобщенная матрица точности для распределений t-Стьюдента в оптимизации портфеля ( arXiv ) Автор: Каролин Бакс , Эмануэле Тауфер , Сандра Патерлини Аннотация: модель Марковица по-прежнему является краеугольным камнем современной теории портфеля. В частности, при рассмотрении портфеля с минимальной дисперсией единственным требуемым вводом является ковариационная матрица или, лучше сказать, обратная ей матрица, так называемая матрица точности. До сих пор большинство ученых..

Обработка несбалансированных данных путем передискретизации с помощью SMOTE и его вариантов

В этом посте я объясню передискретизацию/апсемплинг с использованием SMOTE, SVM SMOTE, BorderlineSMOTE, K-Means SMOTE и SMOTE-NC. После объяснений я приведу практический пример, в котором мы применяем эти методы для решения несбалансированной проблемы машинного обучения, чтобы увидеть их влияние. Введение При работе над проблемами машинного обучения я в первую очередь проверяю распределение целевого класса в моих данных. Это распределение информирует об определенных аспектах того,..