Публикации по теме data

Публикации по теме 'data'

Может ли искусственный интеллект предсказать рецессию рынка?

Алгоритмы машинного обучения обнаружили возможную загвоздку. По словам главного директора Allianz Global Investors по систематическим акциям Майкла Хелдманна, «очень высокая степень риска рецессии» указывается статистическими алгоритмами фирмы, которые используют ИИ и МО для прогнозирования рецессий. Контракты, электронная почта, веб-сайты, аудио- и видеозаписи и компьютеры — все это источники зеттабайтов данных, которые должны анализировать современные предприятия. Однако ни один..

Моя первая встреча с Data Science!

«Без данных вы просто еще один человек, у которого есть мнение!» По правде говоря, Данные - очень важный ресурс в этом мире. Более того, этот мир каждый день создает порции и порции данных! Наука о данных, выражаясь словами непрофессионала, предназначена для использования этих данных. Он предназначен для сбора, очистки, управления, исследования данных и творчества с ними. Наука о данных - это область исследования, которая сочетает в себе опыт в предметной области, навыки..

Будущее ореолов темной материи, часть 1 (Космология)

Когерентные и некогерентные структуры в нечетких гало темной материи (arXiv) Автор: И-Кан Лю , Ник П. Проукакис , Герасимос Ригопулос Аннотация: мы показываем, что нечеткие гало темной материи проявляют пространственную дифференциацию по степени когерентности конфигурации поля, начиная от полностью когерентной в центральном солитонном ядре до некогерентной вне его, с областью пересечения между две фазы. Солитонное ядро действительно представляет собой чистый конденсат,..

Кластеризация: два подхода

Что такое кластеризация? Это процедура поиска отдельных групп в данных, если они существуют. Такие группы представляют собой кластеры. Они являются частью неконтролируемого моделирования. Мы используем неконтролируемое моделирование в машинном обучении (ML), когда нам нужно найти общие закономерности в данных и у нас нет конкретной цели. У нас может быть только несколько независимых переменных. Примечание. крайне важно, чтобы мы использовали кластеризацию в качестве метода..

Как массово удалить все ваши твиты, включая старые «невидимые» из кэша

Возможно, вам не нравится новый владелец и вы беспокоитесь о своих данных. Возможно, вы журналист, которому нужно быстро очистить твиты. Может быть, вы просто хотите удалить свои детские смущающие твиты, когда вы были молоды. Вы хотите начать сначала. Оказывается, многие службы удаляют только последние несколько тысяч твитов, прежде чем вы больше не сможете просматривать старые твиты в своем профиле. Ну, я нашел простой Javascript на Stackoverflow , который позволяет вам удалять ваши..

Разработки в области машинного обучения, часть 2 (выпуск за ноябрь 2022 г.)

k-аддитивный подход на основе интеграла Шоке для аппроксимации значений SHAP для обеспечения локальной интерпретации в машинном обучении (arXiv) Автор: Гильерме Дин Пелегрина , Леонардо Томазели Дуарте , Мишель Грабиш Аннотация . Помимо точности, недавние исследования моделей машинного обучения касались вопроса о том, как можно интерпретировать полученные результаты. Действительно, хотя сложные модели машинного обучения способны давать очень хорошие результаты с точки зрения..

Оценка влияния несбалансированных данных на производительность модели

В предыдущей статье мы построили модель, которая классифицирует отзывы на положительные или отрицательные в зависимости от полученных данных. Мы достигли показателя точности 94 %, но является ли точность наиболее эффективным показателем для оценки производительности модели? В этой статье мы углубимся в эту тему и рассмотрим подходы к усовершенствованию модели, построенной с использованием данных DataDNA iPhone Reviews Dataset Challenge . Проверка набора данных: сбалансированный или..