Публикации по теме 'data'


Брифинг о рисках насилия на выборах, август 2020 г.
Беларусь и Шри-Ланка, две страны, в которых в этом месяце пройдут общенациональные выборы, подвержены высокому риску насилия на выборах. The Electoral Violence Intelligence System (ELVIS) – это система прогнозирования на основе машинного обучения, которая ежемесячно оценивает риск насилия, связанного с выборами, для каждых общенациональных выборов. В этих сообщениях будут представлены обновленные результаты нашей модели прогнозирования, подробное представление о том, чего ожидать в..

Надежность: подготовьте свой завод к машинному обучению в будущем — начните сохранять данные об отказах!
Инструменты управления надежностью оборудования гораздо более автоматизированы и интеллектуальны, чем в прошлые годы, но то, будут ли они работать и насколько хорошо они будут работать для какой-либо отдельной компании, зависит от постоянной проблемы: доступных данных. Хорошо известно, что машинное обучение (МО) на основе данных о состоянии датчиков может ускорить выявление и анализ проблем, но плохие или отсутствующие данные об отказах могут замедлить МО, а также диагностику человека и..

Приложения рекомендательных систем, часть 1 (искусственный интеллект)
Обзор рекомендательных систем Введение в рекомендательные системы Обзор некоторых основных алгоритмов рекомендаций. towardsdatascience.com Профилирование рецензентов с учетом отправки для системы рекомендаций рецензентов (arXiv) Автор: Омер Анджум , Алок Каматар , Тоби Лян , Цзинцзюнь Сюн , Вэнь-мэй Хву Аннотация: Назначение квалифицированных, непредвзятых и заинтересованных рецензентов для представленных статей..

Потоковая передача CDC в реальном времени с использованием Debezium, MySQL и Redpanda
Использование совместимости Redpanda с Debezium для потоковой передачи изменений из MySQL Эта статья была написана участником сообщества Redpanda Алмасом Максотовым. Введение: как настроить поток CDC в Redpanda В этом руководстве вы собираетесь создать поток CDC, используя Redpanda и Debezium. Обратите внимание, что вся экосистема Kafka Connect работает с Redpanda «из коробки», поскольку Redpanda API-совместима с Apache KafkaⓇ. Что такое сбор измененных данных (CDC)? CDC —..

Путь к оптимизации интерфейса нашей платформы ML с помощью нашего инструмента CLI
В постоянно развивающемся мире операций машинного обучения (MLOps) эффективность и производительность имеют решающее значение для организаций, стремящихся извлечь выгоду из потенциала своих моделей машинного обучения. Цель состоит в том, чтобы предоставить пользователям платформы оптимизированный и стандартизированный интерфейс, который позволит им сосредоточить свое внимание на эффективном предоставлении ценности, в то время как предложения платформы постоянно совершенствуются, а..

Исследовательские работы, основанные на распознавании именованных объектов, часть 1 (обработка естественного языка)
Адаптивная тонкая настройка языковых моделей на основе преобразователя для распознавания именованных объектов (arXiv) Автор: Феликс Столленверк Аннотация . Текущий стандартный подход к тонкой настройке языковых моделей на основе преобразователя включает фиксированное количество эпох обучения и график линейной скорости обучения. Чтобы получить модель, близкую к оптимальной для данной нисходящей задачи, обычно требуется поиск в оптимизационном пространстве гиперпараметров. В..

Вы можете выполнять работу по науке о данных удаленно; Смотрите преимущества!
Наука о данных широко распространена и является самой дружественной удаленной работой. Многие компании обращаются к удаленным работникам в связи с растущим спросом на специалистов по данным, а другие не хотят рисковать, что возврат к работе будет неправильным . Такие компании, как Amazon, Facebook и IBM, добились успеха с этой моделью. Удаленные специалисты по данным не только оказывают значительное влияние на свои команды, но и помогают сократить расходы в долгосрочной перспективе...