Публикации по теме 'dataset'


Опыт создания набора данных NLG
Привет, читатель, это будет мой первый блог, поэтому, если вы обнаружите какие-либо проблемы или грамматические ошибки, пожалуйста, не стесняйтесь признать то же самое. Генерация естественного языка (NLG) — это использование программирования искусственного интеллекта (ИИ) для создания письменных или устных повествований из набора данных. Здесь я буду обсуждать, как я создал набор данных, который использовался для обучения модели чат-бота (для медицинской области). Задача, поставленная..

Различные способы получения данных в Google Colab
Google colab - одна из лучших платформ для предоставления бесплатного графического процессора. Это одно из лучших мест для экспериментов, если вы начинаете с глубокого обучения. Одна из лучших вещей в google colab, помимо бесплатного графического процессора, заключается в том, что он поставляется с большинством библиотек и фреймворков, необходимых для начала глубокого обучения, и это тот тип прямого кода и запуска, который вам, скорее всего, не понадобится устанавливать. что-нибудь. Но..

Удивительные бесплатные общедоступные источники данных по машинному обучению и глубокому обучению на 2018 год
Эти общедоступные источники данных можно использовать для исследований в области машинного обучения и глубокого обучения. Наборы данных - неотъемлемая часть области машинного обучения. Поиск хорошего набора данных машинного обучения часто является самым большим препятствием, которое разработчик должен преодолеть, прежде чем начинать какой-либо проект в области науки о данных. Независимо от того, являетесь ли вы новичком в машинном обучении или профессиональным специалистом по..

Служба автоматизированного машинного обучения Azure | 2023
→ Добро пожаловать, семья, в новую услугу, которой я сейчас пользуюсь, и она должна стоить вашего времени. → Если вы работаете над проектом, в котором используются функции машинного обучения в вашем приложении, или вам просто интересно узнать о службе машинного обучения Azure, то это для вас. → Будучи JS-специалистом, пытаюсь интегрировать различные области ИТ в приложения. Зачем использовать эту услугу? → Автоматически создавайте модели машинного обучения со скоростью и..

Как звучит слово "сломанный"? Первый в мире набор аудиоданных о неисправных промышленных машинах
«Кашель из-за меня…» При обычном медицинском осмотре врач может прижать стетоскоп к груди пациента и использовать звук кашля для выявления любых аномальных респираторных заболеваний. Теперь группа исследований и разработок из японского транснационального конгломерата Hitachi предложила похожую звуковую технику для выявления неисправных промышленных машин на заводе. Исследователи Hitachi выпустили первый в своем роде набор данных, содержащий звуки работающих и неисправных промышленных..

Набор данных SHABD (Sampoorna Hindi Akshar Barakhadi Digital)
Хранилище изображений алфавитов хинди, состоящих из гласных, согласных и их комбинаций. Язык хинди написан с использованием сценария деванагари, который составляет основу для 120 языков по всему миру. В Индии хинди является официальным государственным языком 12 штатов и поэтому широко используется в правительственных и юридических целях. Язык состоит из 44 алфавитов (11 гласных и 33 согласных) и нескольких специальных символов, в результате чего их количество достигает 52 [ источник..

Балансировка в наборах данных алгоритма машинного обучения
ОБРАБОТКА НЕБАЛАНСИРОВАННЫХ НАБОРОВ ДАННЫХ В ML | К ИИ Акт балансировки в наборах данных алгоритма машинного обучения Методы смягчения последствий обучения классификаторов с несбалансированными наборами данных в Python Что происходит, когда вы тренируете классификатор с несбалансированными данными? Имея дело с несбалансированными классами, нам может потребоваться дополнительная работа и планирование, чтобы убедиться, что наши алгоритмы дают нам полезные результаты. В этом..