Публикации по теме 'open-data'


Приглашаем спикеров и членов комитета по содержанию ODSC East 2022
Мы рады объявить о нашем официальном приглашении спикеров на ODSC East 2022 ! И сейчас мы ищем людей, которые хотят выступить на ODSC East 2022. Мероприятие следующего года будет гибридным , что означает, что у вас будет возможность выступить лично в Бостоне, Массачусетс, или виртуально. Учитывая ваш уровень комфорта или географическое положение, это дает вам возможность выбирать, как и где вы хотите выступать. В ходе конференций 2021 года у нас было: 18000+ участников 450..

Набор данных русской открытой речи в текст (STT / ASR)
4000 часов данных STT на русском языке Если вы не платите цену за утюг, значит, кто-то заплатил за вас. Так работает во всех сферах жизни Сообщение на spark-in.me 1 мая 2019 г. TL; DR Это сопроводительный пост к нашему выпуску набора данных Открытая речь в текст на русском языке (STT / ASR) . Это должно быть немного беззаботно и насмешливо. Все мнения мои, наверное, мнения моих коллег расходятся. Это нетехническое резюме. Не относитесь к этому слишком серьезно,..

Исследовательские работы по концепции оптимального транспорта
Факультет дистилляции с оптимальным транспортом( arXiv ) Автор: Су Лу , Хань-Цзя Е , Дэ-Чуан Чжань Аннотация : Дистилляция знаний (KD) показала свою эффективность в улучшении классификатора учащихся при наличии подходящего учителя. Излияние разнообразных и многочисленных предварительно обученных моделей может предоставить богатые ресурсы для учителей для KD. Однако эти модели часто обучаются на разных задачах ученика, что требует от ученика точного выбора наиболее..

4 причины, по которым декларативное машинное обучение имеет смысл для инженеров
Машинное обучение становится мейнстримом, покидая исследовательскую лабораторию и внедряясь в продукты. На самом деле, у каждой инженерной команды, с которой мы работали, в дорожной карте был пункт, который звучал примерно так: «Улучшить [крутую функцию] с помощью машинного обучения». Но «заниматься машинным обучением» — не типичная инженерная задача. Существует бесчисленное множество блокировщиков, которые могут помешать вам запустить ваши проекты машинного обучения, в том числе:..

Автоматическая маркировка данных для классификации текста
Для специалистов по машинному обучению (ML) одной из наиболее важных и типичных задач является полнотекстовая классификация (FTC) — метод, при котором вы назначаете набор категорий или тегов целой строке текст. То, как вы выполняете эту, казалось бы, простую задачу, напрямую влияет на то, как мы создаем и запускаем приложения на сайтах социальных сетей, новостях, сообщениях в блогах или онлайн-форумах, и это лишь некоторые из наиболее известных вариантов использования. Согласно..

Обучение обученных оптимизаторов
Примечание редактора. Люк Мец будет спикером на ODSC East 2022 с 19 по 21 апреля. Обязательно ознакомьтесь с его выступлением «Learned Optimizers » здесь! Поскольку модели машинного обучения продолжают расти, затраты и время на обучение таких моделей становятся все более громоздкими. Эти растущие затраты усложняют как обучение моделей на новых данных, так и проведение исследований для улучшения будущих версий этих моделей. Традиционно для обучения таких моделей..

Введение в обучение несколькими выстрелами
Машинное обучение очень успешно работает в приложениях, интенсивно использующих данные, но часто затрудняется, когда набор данных мал. Для решения этой проблемы было предложено обучение с небольшим количеством выстрелов (FSL). Он используется в различных областях компьютерного зрения, НЛП и т. д. Он приобрел популярность, потому что помогает делать прогнозы, используя ограниченное количество примеров с контролируемой информацией, то есть с небольшим количеством обучающих выборок. Мы..