Почему важно включать все виды знаний в маркировку данных

Если вы читали о маркировке данных, вы, вероятно, предположили, что специалисты по маркировке данных относятся к категории работы «синих воротничков». Заголовки статей, как правило, сосредоточены на маркировке массовых данных, происходящей по всему миру, особенно в странах с менее развитым экономическим положением. Маркировка данных часто рассматривается как второстепенная задача, выполняемая в больших масштабах. Это помогает машинам развить базовое понимание мира, такое как распознавание велосипедов, автомобилей или пешеходов. Хотя сегодня маркировка данных может выглядеть именно так, вряд ли это будет ее будущее. Мы не должны игнорировать различные градации знаний и возможность того, что специализированные знания могут способствовать более глубокому и точному машинному обучению.

Раньше не хватало средств доступа к разным качествам знаний для маркировки данных и обратной связи с людьми. Хотя существует множество примеров, например, когда врачи маркируют данные, эффективной платформы для управления такими задачами пока нет. В этой статье мы исследуем, как HUMAN Protocol может помочь Запрашивающим получить доступ ко всем сегментам пирамиды знаний.

Хотя у нас не может быть «мудрой» машины, имея доступ к самым мудрым этикетировщикам, машина неявно извлечет выгоду из их наблюдений, даже если они кажутся нелинейными. Другими словами, машина может отражать мудрые знания.

Пирамида знаний

Для наглядности обратимся к пирамиде знаний. Традиционные представления о маркировке данных сосредоточены на двух нижних частях пирамиды. Данные в этом контексте определяются как:

«Символы, которые представляют свойства объектов, событий и их окружения. Они продукты наблюдения ».

Данные естественным образом приводят к информации, которая относится к «кто, что, где, когда и сколько» в поле. Эти две категории знаний четко отображаются в обычном приложении для ввода кода. Наблюдение человека (данные) приводит к предоставлению информации в виде ярлыка (информации).

Движение вверх по пирамиде

Это не случай поиска лучших знаний, но, как предполагает конструкция пирамиды, более редкие категории знаний среди населения.

В центре внимания машинного интеллекта было создание общего понимания повседневного мира; умение распознавать предметы и узоры. Имеют значение и другие факторы: ограничения платформ для маркировки данных и коммерческая направленность ранних приложений машинного обучения, таких как реклама и улучшенная автоматизация (включая автомобили без водителя).

То, что мы видим дальше по пирамиде, - это специализированное знание более сложных или, по крайней мере, редких форм значения. Знания могут принадлежать врачу, который знает, как выглядит полип при колоноскопии.

Мудрость подразумевает нелинейную способность суждения. Хотя это может показаться несоответствующим неизбежной линейности машинного обучения, мудрость также можно упростить: это неизбежное следствие высоких знаний, опыта и рациональности - все это качества, которые можно отобразить в машинном обучении. Таким образом, хотя у нас не может быть «мудрой» машины, имея доступ к самым мудрым этикетировщикам, машина неявно извлечет выгоду из их наблюдений, даже если они кажутся нелинейными. Другими словами, машина может отражать мудрые знания.

Изменение рабочего ландшафта

HUMAN Protocol позволяет всем людям получать оплату за ответы на все вопросы. Помогая революционизировать гиг-экономику и освобождая гигантов от зависимости от централизованных сервисов, таких как Uber и Deliveroo, мы можем изменить ландшафт работы. Чтобы узнать больше о том, как HUMAN Protocol намеревается достичь этого и предоставить больше свободы, возможностей и выбора для гиг-работников, прочитайте нашу недавнюю статью о гиг-экономике.

HUMAN Protocol не только предлагает работу с меньшим количеством ограничений (вам нужен только ноутбук для маркировки данных), мы считаем, что расширенный доступ к пирамиде знаний помогает гигантам в полной мере представить свою ценность на глобальных рынках труда. Обозначение всех видов труда также означает признание различных видов ценности, включая специальные знания и опыт.

Разнообразие кадров помогает рынкам расти. HUMAN Protocol поддерживает рост глобальной рабочей силы, которая представляет каждую часть пирамиды знаний. Эти два аспекта идут рука об руку: более разнообразные задачи, которые необходимо выполнить, и более разнообразный персонал для их выполнения. А чтобы реализовать новое поколение технологий искусственного интеллекта и машинного обучения, мы должны иметь возможность предоставлять машинам более подробное и разреженное понимание мира. И на ее поверхности, и на ее более глубоких уровнях.

Чтобы быть в курсе последних обновлений HUMAN Protocol, подписывайтесь на нас в Twitter или присоединяйтесь к нашему сообществу Telegram channel.

Отказ от ответственности HUMAN Protocol Foundation не делает никаких заявлений, гарантий или обязательств, явных или подразумеваемых, в отношении точности, надежности, полноты или обоснованности информации, содержащейся здесь. Любые высказанные предположения, мнения и оценки представляют собой суждение HUMAN Protocol Foundation на момент публикации и могут быть изменены без предварительного уведомления. Любой прогноз, содержащийся в представленной здесь информации, основан на ряде предположений, и нет никаких гарантий, что какие-либо прогнозируемые результаты будут достигнуты.

Первоначально опубликовано на https://www.humanprotocol.org.

Почему важно включать все виды знаний в маркировку данных