Публикации по теме 'data'


Как использовать искусственный интеллект без кода, чтобы уменьшить убыль сотрудников
Простое руководство. Исчезновение - это просто увольнение сотрудника, что может быть невероятно дорогостоящим, поскольку работодателям необходимо либо найти и обучить новые таланты, либо перераспределить работу между нынешними сотрудниками, увеличивая их рабочую нагрузку. LinkedIn предлагает удобный инструмент для оценки стоимости ухода сотрудников из вашей организации, которая составляет около 50% от заработной платы сотрудника начального уровня или 250% от зарплаты сотрудника с..

Как построить масштабируемую стратегию аннотирования данных
О поиске подходящего инструмента, найме или аутсорсинге аннотаторов и аннотировании с помощью машинного обучения. Как вы, возможно, знаете, группы специалистов по обработке и анализу данных тратят около 80 % своего времени на создание данных для обучения и управление ими. Обычные проблемы часто связаны с плохим внутренним инструментарием, повторной работой с маркировкой, поиском необходимых данных и трудностями, связанными с совместной работой и повторением данных распределенных..

Подробное изучение больших данных с помощью Hadoop (часть 1): введение в Hadoop
Пронай Гош и Хирен Рупчандани По оценкам, около 90% мировых данных было создано за последние два года. Кроме того, 80 процентов данных неструктурированы или доступны в различных формах, что затрудняет анализ. Теперь у вас есть представление о том, сколько данных было сгенерировано. Хотя такой огромный объем данных представляет собой значительную трудность , еще более серьезная проблема связана с тем фактом, что данные не организованы. Включены изображения, такие..

Озеро данных против. Хранилище данных: типы, инструменты и ключевые отличия
Контур Введение Что такое хранилище данных? Что такое озеро данных? 7 главных различий между озером данных и хранилищем данных Типы хранилищ данных Типы озер данных Инструменты хранилища данных Инструменты озера данных Может ли озеро данных заменить хранилище данных? Введение Озера данных и хранилища данных — это две разные вещи. Озеро данных — это место, где хранятся все виды структурированных и неструктурированных данных. Напротив, хранилище данных..

Методологии преобразования данных
Методы нормализации и сокращения данных, чтобы получить максимальную отдачу от ваших моделей машинного обучения Эта статья является продолжением серии статей, посвященных ключевым теоретическим концепциям машинного обучения. Остальные статьи этой серии доступны на моей страничке . Машинное обучение - это разработка алгоритмов, которые учатся на основе информации. Они изучают взаимосвязи в представленных им данных и используют их, чтобы затем предсказать природу невидимых..

Pandas Полное руководство (Часть 2)
Во втором руководстве мы рассмотрим индексирование, выбор и назначение. На самом деле выбор определенных значений кадра данных или серии pandas для работы является неявным шагом практически в любой операции с данными, которую вы будете выполнять, поэтому мы постараемся узнать, как для быстрого и эффективного выбора точек данных, имеющих отношение к вам. Простые методы доступа: Собственные объекты Python предоставляют хорошие способы индексации данных. Pandas поддерживает все это,..

Всесторонний обзор методов выбора признаков в машинном обучении
Освоение выбора функций: советы и рекомендации по выбору лучших функций для ваших данных Важным этапом машинного обучения является выбор функций. Чтобы повысить эффективность и обобщаемость модели, она включает в себя выбор и создание подмножества функций из набора данных, которые наиболее связаны с целевой переменной. Существует множество различных методов, которые можно использовать для выбора признаков, и подходящий метод будет зависеть от конкретной проблемы и типа данных, с..