Публикации по теме 'analytics'


Дополненная аналитика: текущие возможности и ограничения
Многие фирмы, изучающие технологические тренды (Gartner, BBVA, Forbes и многие другие), в последнее время обсуждают новый тип тренда в аналитике: дополненную аналитику. Идея дополненной аналитики невероятно интересна. Способность компьютера превращать аналитические идеи в данные путем автоматизации подготовки данных, обнаружения идей и, наконец, обмена ими с соответствующими людьми имеет удивительный потенциал. Но насколько далеко зашел этот подход? Стоит ли инвестировать в это..

Краткое введение в программирование на R
В R структуры данных называются объектами. Каждый объект может содержать векторы, упомянутые выше, скаляры, матрицы, массивы, фреймы данных и списки . Среди всех объектов список является самым особенным. Это связано с тем, что список может содержать любой или все типы данных. Матрицы Матрицы представляют собой единый двумерный набор данных. И можно создать матрицу с помощью функции matrix() . Матрица содержит векторный элемент, а nrow и ncol представляют размеры строки и столбца..

Решение градиентного спуска, часть 1
Давайте поговорим о методе, который мы используем в науке о данных, который, по словам моей невесты, «похож на математику»: градиентный спуск. Она не ошибается: это так! Звучит как целая куча математики (и это так). Смысл этих двух частей в том, чтобы они звучали немного меньше, чем ***MATH***. В науке о данных мы находим, что градиентный спуск весьма полезен. Давайте поговорим о том, что такое градиентный спуск, как и почему мы его используем, рассмотрим пример и, во второй части,..

Разрешение сущности клиента на основе графа
1. Описание проблемы Предприятия знают о преимуществах объединения данных из нескольких источников для создания более подробных и полных записей о своих клиентах, своих продуктах, своих сотрудниках и т. д. Источниками могут быть разные отделы или компьютерные системы внутри одного предприятия, сочетание внутренних и внешних источников данных или в результате корпоративных слияний и поглощений. Однако слияние источников данных не всегда просто. В частности, одной из проблем является..

Десять потрясающих недавних разработок в R
В течение последнего года или около того развитие экосистемы R продвигалось быстрыми темпами. Новые функции в базовом языке R, в ключевых пакетах R и в среде RStudio IDE упростили повседневную работу программистов на R, таких как я. Большинство этих разработок также сделали программирование на R более приятным и приятным и во многих случаях устранили предыдущие головные боли или представили функциональность, которая лучше согласуется с другими языками программирования. Если вы не..

Оптимизация сборок LoL с помощью машинного обучения
Поиск подходящих предметов и рун в LoL приносит игрокам высокую прибыль при минимальных затратах. Это важная часть работы аналитика, поскольку поиск таких сборок в основном связан с оптимизацией и исследованиями. До сих пор поиск подходящих сборок элементов выполнялся в основном методом проб и ошибок, с упором на аналитику и опыт, а не на прогнозирование и машинное обучение. Иногда невероятно мощные предметы оставались незамеченными в течение многих месяцев (Ardent Censor 2016) или..

Как выбрать между несколькими моделями
Ключевые концепции, которые следует помнить при сравнении моделей В предыдущей статье мы обсудили концепции недостаточного и избыточного соответствия, как они могут привести к моделям, не совпадающим с доступными данными, как выявить каждую проблему и как определить модели, которые хорошо соответствуют данным. Эти концепции могут помочь вам избежать серьезных ошибок и создать модели, которые достаточно точно соответствуют данным; однако существует невероятное количество моделей,..