Публикации по теме 'open-data'
Приглашаем спикеров и членов комитета по содержанию ODSC East 2022
Мы рады объявить о нашем официальном приглашении спикеров на ODSC East 2022 ! И сейчас мы ищем людей, которые хотят выступить на ODSC East 2022.
Мероприятие следующего года будет гибридным , что означает, что у вас будет возможность выступить лично в Бостоне, Массачусетс, или виртуально. Учитывая ваш уровень комфорта или географическое положение, это дает вам возможность выбирать, как и где вы хотите выступать.
В ходе конференций 2021 года у нас было:
18000+ участников 450..
Набор данных русской открытой речи в текст (STT / ASR)
4000 часов данных STT на русском языке
Если вы не платите цену за утюг, значит, кто-то заплатил за вас. Так работает во всех сферах жизни
Сообщение на spark-in.me 1 мая 2019 г.
TL; DR
Это сопроводительный пост к нашему выпуску набора данных Открытая речь в текст на русском языке (STT / ASR) . Это должно быть немного беззаботно и насмешливо. Все мнения мои, наверное, мнения моих коллег расходятся. Это нетехническое резюме. Не относитесь к этому слишком серьезно,..
Исследовательские работы по концепции оптимального транспорта
Факультет дистилляции с оптимальным транспортом( arXiv )
Автор: Су Лу , Хань-Цзя Е , Дэ-Чуан Чжань
Аннотация : Дистилляция знаний (KD) показала свою эффективность в улучшении классификатора учащихся при наличии подходящего учителя. Излияние разнообразных и многочисленных предварительно обученных моделей может предоставить богатые ресурсы для учителей для KD. Однако эти модели часто обучаются на разных задачах ученика, что требует от ученика точного выбора наиболее..
4 причины, по которым декларативное машинное обучение имеет смысл для инженеров
Машинное обучение становится мейнстримом, покидая исследовательскую лабораторию и внедряясь в продукты. На самом деле, у каждой инженерной команды, с которой мы работали, в дорожной карте был пункт, который звучал примерно так: «Улучшить [крутую функцию] с помощью машинного обучения».
Но «заниматься машинным обучением» — не типичная инженерная задача. Существует бесчисленное множество блокировщиков, которые могут помешать вам запустить ваши проекты машинного обучения, в том числе:..
Автоматическая маркировка данных для классификации текста
Для специалистов по машинному обучению (ML) одной из наиболее важных и типичных задач является полнотекстовая классификация (FTC) — метод, при котором вы назначаете набор категорий или тегов целой строке текст. То, как вы выполняете эту, казалось бы, простую задачу, напрямую влияет на то, как мы создаем и запускаем приложения на сайтах социальных сетей, новостях, сообщениях в блогах или онлайн-форумах, и это лишь некоторые из наиболее известных вариантов использования.
Согласно..
Обучение обученных оптимизаторов
Примечание редактора. Люк Мец будет спикером на ODSC East 2022 с 19 по 21 апреля. Обязательно ознакомьтесь с его выступлением «Learned Optimizers » здесь!
Поскольку модели машинного обучения продолжают расти, затраты и время на обучение таких моделей становятся все более громоздкими. Эти растущие затраты усложняют как обучение моделей на новых данных, так и проведение исследований для улучшения будущих версий этих моделей. Традиционно для обучения таких моделей..
Введение в обучение несколькими выстрелами
Машинное обучение очень успешно работает в приложениях, интенсивно использующих данные, но часто затрудняется, когда набор данных мал. Для решения этой проблемы было предложено обучение с небольшим количеством выстрелов (FSL). Он используется в различных областях компьютерного зрения, НЛП и т. д. Он приобрел популярность, потому что помогает делать прогнозы, используя ограниченное количество примеров с контролируемой информацией, то есть с небольшим количеством обучающих выборок. Мы..