Публикации по теме 'data'


Интерпретируемость и рост ценностей Шепли
Интерпретируемость - горячая тема в науке о данных в этом году. Ранее этой весной я рассказывал на ODSC East о необходимости для специалистов по обработке данных использовать передовые практики, такие как важность на основе перестановок, частичная зависимость и объяснения. Когда я впервые собрал этот доклад, многие специалисты по данным были в новинку. Но год спустя, и теперь я вижу эти идеи во многих сообщениях в блогах и презентациях ODSC, так что же мне делать? Пришло время..

Количественные рабочие процессы: новая парадигма для всех
Такие темы, как машинное обучение, искусственный интеллект и наука о данных, широко обсуждались в последние несколько лет. Но эти темы существуют уже давно, хотя названия меняются с годами. Все типы проблем, которые разработчики решают в этих областях, вписываются в то, что мы называем количественными рабочими процессами - процесс начала с данных и получения идей, действий и количественных моделей . А разработчики, которые их создают? Это исследователи, любители, разработчики,..

Классификация и сегментация изображений
Это не так просто, как вы думаете. Что касается изображений, то за последние несколько лет было достигнуто многое. Компьютерное зрение развивается довольно быстро, и кажется, что многие проблемы компьютерного зрения теперь решаются намного проще. С появлением предварительно обученных моделей и более дешевых вычислений теперь стало проще простого обучить почти современную модель в домашних условиях для решения большинства проблем, связанных с изображениями. Но есть много разных типов..

Что, если бы вы могли дать каждому сотруднику своего специалиста по данным?
Представьте себе мир, в котором у вашей компании есть ресурсы, чтобы обеспечить каждого менеджера и сотрудника персонализированным специалистом по данным. Объем данных, генерируемых компаниями по всему миру, растет взрывоопасными экспоненциальными темпами из года в год, и компании, независимо от размера, которые теперь используют облачные технологии, продолжают увеличивать это число до небес. Зачастую среднестатистическому экстремалу уже не под силу расшифровать. Крупнейшие компании..

Проведение внутреннего конкурса по науке о данных в AppNexus
(в соавторстве с Дэниелом Остином ) Команда AppNexus Data Science всегда ищет способы распространения знаний о данных в AppNexus. Мы не первая компания, которая осознает, что масштабирование машинного обучения (ML) означает улучшение знаний о машинном обучении за пределами отдела науки о данных: другие компании, включая Airbnb ( здесь , здесь ), Facebook ( здесь , здесь ), У Google ( здесь ) есть стратегии грамотности в отношении данных и машинного обучения, как правило, через..

Что я говорю деловым людям о том, почему реляционные базы данных настолько плохи
Что я говорю деловым людям о том, почему реляционные базы данных настолько плохи Ниже приводится то, что я написал в своей книге Как избежать ИТ-катастроф , чтобы объяснить деловым людям, почему реляционные базы данных являются причиной стольких проблем в корпоративных системах. Это нетехническое объяснение, предназначенное для широкой аудитории, но я подумал, что для технической аудитории может быть интересно прочитать то, что, по моему мнению, следует рассказать неспециалистам. В..

Все, что вам нужно знать о JSON
Знакомство с наиболее часто используемым форматом файлов. Добро пожаловать в мою серию статей о языках разметки. На этот раз я хочу погрузиться в JSON, один из самых распространенных форматов для обмена или сериализации данных. JSON означает нотацию объектов JavaScript. Как уже понятно из названия, он создан на основе JavaScript, но доступен на многих языках. Он разработан, чтобы быть удобочитаемым и в то же время легким. Начнем с примера: { "name": "Ash", "profession":..