*Бизнес. Этика. Разнообразие

Мы все были там раньше — после того, как ваш банк / поставщик услуг / какое-то другое учреждение поставило вас на паузу — вы были переведены на голос, который говорит: «Пожалуйста, укажите в нескольких словах, что вы хотели бы сделать сегодня » — это обработка естественного языка в действии.

Обработка естественного языка — это часть машинного обучения (ветвь искусственного интеллекта), которая эффективно использует алгоритмы для понимания естественного языка, то есть человеческого голоса, и реагирования на него.

Возможно, наиболее заметным применением является распознавание речи — вспомните Siri и Alexa. В качестве примера, это шаги, которые выполняются для распознавания речи для смарт-устройства, которое использует Эй, Толу в качестве триггера (в общих чертах разработано на основе шагов, описанных в курсе ИИ для всех Эндрю Нг — ссылка здесь к курсу)

  1. Сбор данных: соберите большой (огромный!) набор аудиоклипов разных людей, говорящих «Эй, Толу».
  2. Обучение модели: вводите в модель данные для обучения таким образом, чтобы после предоставления модели различных случайных аудиоклипов модель могла распознавать определенный звук «Эй, Толу». Здесь аудиоклип является входом, а выходом является то, что модель распознает слово «Толу» (и затем активируется для получения дальнейших команд). Этот процесс повторяется несколько раз, чтобы модель могла распознавать различные высоты тона, тона, акценты и вариации входных данных.
  3. Развертывание модели: разверните и поместите алгоритм в умный динамик/приложение/компьютерную систему.
  4. Обратная связь: модель учится сама и учится дальше, используя дополнительные клипы и циклы, обеспечивая постоянное совершенствование.

Несколько этических соображений, связанных с обработкой естественного языка, включают следующее:

  • Кто может идентифицировать меня, используя данные, которые я предоставляю алгоритму? Кто имеет доступ к моим данным? Это особенно важно для чувствительных приложений, таких как банковское дело, где есть некоторая зависимость от выходных данных НЛП для принятия решений, касающихся доступа к кредиту.
  • Является ли алгоритм потенциально предвзятым к определенной расе или полу? Это реальная проблема, если обучающие данные недостаточно разнообразны.

В заключение сегодняшнее определение:

Сопоставление A:Bметод машинного обучения, при котором алгоритм обучается внутри себя и дает результат B на основе входных данных A. Общим примером являются цены продажи домов в определенном районе (входные данные A), а выходными данными могут быть оценочные рыночные цены на конкретный дом в том же районе (выход B).