Публикации по теме 'data'
Изучение сверхновых с помощью исследовательских работ, часть 1 (Космология)
Космология сверхновой типа Ia, объединяющая данные миссии Euclid и обсерватории Веры С. Рубин (arXiv)
Автор: А. Бейли , М. Винченци , Д. Сколник , Дж. -С. Куйландр , Дж. Родос , Е. Р. Петерсон , Б. Попович
Аннотация: Миссия Euclid обеспечит первое в своем роде покрытие в ближнем инфракрасном диапазоне в глубоком (три поля, ~10–20 квадратных градусов каждое) и широком (~10000 квадратных градусов) полях. . Хотя исследование не предназначено для обнаружения..
Объяснимый ИИ (XAI): обеспечение лучшего понимания результатов ИИ
Повышение прозрачности и доверия к системам ИИ для улучшения процесса принятия решений
По мере того, как искусственный интеллект (ИИ) продолжает развиваться и становится все более распространенным, растет потребность в том, чтобы системы ИИ были прозрачными и объяснимыми. Именно здесь на помощь приходит объяснимый ИИ (XAI) — область исследований, посвященная разработке систем ИИ, способных дать понятное объяснение своим решениям.
Что такое объяснимый ИИ (XAI)?
Объяснимый ИИ (XAI)..
Идентификация людей — в данных
Прежде всего: это *не* статья о том, как идентифицировать людей в анонимных или обезличенных данных. Речь идет о стандартных кодах и идентификаторах, которые вы можете использовать в наборах данных или базах данных, которые рассматривают людей как тип сущности . Это продолжение предыдущего поста о важности уникальных идентификаторов и связанного с ним Шпаргалки по уникальным идентификаторам .
Глобального уникального идентификатора для людей не существует. И пока люди не..
Демистификация машинного обучения: понимание основ
ВВЕДЕНИЕ В МАШИННОЕ ОБУЧЕНИЕ
Машинное обучение — это захватывающая область искусственного интеллекта, которая фокусируется на разработке алгоритмов и моделей, способных учиться на данных без явного программирования.
Это позволяет компьютерам анализировать и интерпретировать сложные закономерности в огромных объемах данных, что приводит к прогнозам, принятию решений и автоматизации. В этом блоге мы углубимся в фундаментальные аспекты машинного обучения, включая принципы его..
Оптимизация гиперпараметров: поиск по сетке, случайный поиск и байесовская оптимизация в действии
Введение
Модели машинного обучения часто требуют тонкой настройки для достижения оптимальной производительности в заданном наборе данных. Оптимизация гиперпараметров играет решающую роль в этом процессе. В этой статье мы рассмотрим концепции гиперпараметров, способы их установки и методы поиска наилучшей гиперпараметризации для данной проблемы. Мы будем использовать набор данных алмазов, доступный на Kaggle, и работать с Google Colab для наших примеров кода. Две цели, с которыми мы..
Документы для чтения по оптимизации портфеля
Обобщенная матрица точности для распределений t-Стьюдента в оптимизации портфеля ( arXiv )
Автор: Каролин Бакс , Эмануэле Тауфер , Сандра Патерлини
Аннотация: модель Марковица по-прежнему является краеугольным камнем современной теории портфеля. В частности, при рассмотрении портфеля с минимальной дисперсией единственным требуемым вводом является ковариационная матрица или, лучше сказать, обратная ей матрица, так называемая матрица точности. До сих пор большинство ученых..
Обработка несбалансированных данных путем передискретизации с помощью SMOTE и его вариантов
В этом посте я объясню передискретизацию/апсемплинг с использованием SMOTE, SVM SMOTE, BorderlineSMOTE, K-Means SMOTE и SMOTE-NC. После объяснений я приведу практический пример, в котором мы применяем эти методы для решения несбалансированной проблемы машинного обучения, чтобы увидеть их влияние.
Введение
При работе над проблемами машинного обучения я в первую очередь проверяю распределение целевого класса в моих данных. Это распределение информирует об определенных аспектах того,..