Публикации по теме 'data'


Как мы настраиваем систему маршрутизации колл-центра, основанную на производительности, с использованием науки о данных и машин…
Масштабы, в которых работает контакт-центр Virgin Media O2, огромны. В прошлом году наши телефоны звонили миллионы раз, и это были только наши существующие клиенты. Каждый день наши агенты ведут сотни бесед с нашими клиентами. От согласования новой продажи до устранения неполадок и переговоров о повторном заключении контракта. На самом раннем этапе формирования нашей команды по продвинутой аналитике и науке о данных мы задались вопросом: «Как мы можем убедиться, что наши клиенты..

10 концепций, которые должен знать каждый дата-инженер
Мы знаем, что есть намного больше, но это основы В этом тексте рассказывается о многих важных концепциях в области инженерии данных. Он охватывает все: от моделирования данных, что имеет решающее значение для создания эффективной базы данных, до безопасности данных, которая помогает защитить данные от угроз и взломов. Он также охватывает интересные темы, такие как хранилище данных, данные…

От обнаружения к исправлению: как сохранить чистоту и надежность производственных данных
В Production ML качество данных — это все. Неважно, насколько хороши ваши модели или алгоритмы, если данные, которые вы им подаете, — мусор, вы получите мусорные результаты. Но как узнать, хорошие у вас данные или плохие? Это то, что мы собираемся исследовать в этой статье. Мы начнем с обсуждения важности проверки данных и выявления проблем с данными в рабочей среде. В частности, мы сосредоточимся на двух типах проблем с данными: дрейф данных и концепций и перекос схемы и распределения...

Функция машинного обучения, которую вы должны знать
Машинное обучение В реальном мире нас окружают люди, которые могут всему научиться на собственном опыте благодаря своим способностям к обучению, и у нас есть компьютеры или машины, которые работают по нашим инструкциям. Но может ли машина также учиться на опыте или прошлых данных, как это делает человек? Итак, наступает роль машинного обучения . Машинное обучение называется подмножеством искусственного интеллекта , которое в основном связано с разработкой алгоритмов, которые..

Использование прогнозов данных для применения динамического ценообразования в стиле Uber
Представьте, что вы только что пошли в кинотеатр во вторник, чтобы посмотреть «Оно», чтобы проникнуться жутким духом Хэллоуина. Когда ты выходишь из театра, темно, и ты не можешь представить, как идешь домой, потому что, признайся, тебе страшно. Вы достаете свой телефон, чтобы заказать поездку от Uber. Поздно вечером в будний день и на улицах никого нет, поэтому цена низкая. Ниже, чем вы помните, цена была в пятницу вечером, когда вы пошли смотреть «Однажды в Голливуде». О, ты еще и..

Основные концепции Kafka (не рассказ)
Apache Kafka превратилась в платформу для создания надежных систем на основе событий с возможностью обработки сверхбольших объемов данных, поддерживаемых простым горизонтальным масштабированием. Apache Kafka - это быстрая, масштабируемая и отказоустойчивая система обмена сообщениями публикация-подписка. Он отличается высокой доступностью, устойчивостью к сбоям узлов и поддерживает автоматическое восстановление. Давайте кратко рассмотрим концепции Apache Kafka Core: Темы: тема..

Извлечение текста из PDF-файлов с помощью Python: подробное руководство
Полный процесс извлечения текстовой информации из таблиц, изображений и обычного текста из файла PDF. Введение В эпоху больших языковых моделей (LLM) и их широкого спектра применений, от простого суммирования и перевода текста до прогнозирования динамики акций на основе настроений и тем финансовых отчетов, важность текстовых данных никогда не была такой высокой. Существует множество типов документов, в которых содержится такая неструктурированная информация: от веб-статей и..