*Бизнес. Этика. Разнообразие
Мы все были там раньше — после того, как ваш банк / поставщик услуг / какое-то другое учреждение поставило вас на паузу — вы были переведены на голос, который говорит: «Пожалуйста, укажите в нескольких словах, что вы хотели бы сделать сегодня » — это обработка естественного языка в действии.
Обработка естественного языка — это часть машинного обучения (ветвь искусственного интеллекта), которая эффективно использует алгоритмы для понимания естественного языка, то есть человеческого голоса, и реагирования на него.
Возможно, наиболее заметным применением является распознавание речи — вспомните Siri и Alexa. В качестве примера, это шаги, которые выполняются для распознавания речи для смарт-устройства, которое использует Эй, Толу в качестве триггера (в общих чертах разработано на основе шагов, описанных в курсе ИИ для всех Эндрю Нг — ссылка здесь к курсу)
- Сбор данных: соберите большой (огромный!) набор аудиоклипов разных людей, говорящих «Эй, Толу».
- Обучение модели: вводите в модель данные для обучения таким образом, чтобы после предоставления модели различных случайных аудиоклипов модель могла распознавать определенный звук «Эй, Толу». Здесь аудиоклип является входом, а выходом является то, что модель распознает слово «Толу» (и затем активируется для получения дальнейших команд). Этот процесс повторяется несколько раз, чтобы модель могла распознавать различные высоты тона, тона, акценты и вариации входных данных.
- Развертывание модели: разверните и поместите алгоритм в умный динамик/приложение/компьютерную систему.
- Обратная связь: модель учится сама и учится дальше, используя дополнительные клипы и циклы, обеспечивая постоянное совершенствование.
Несколько этических соображений, связанных с обработкой естественного языка, включают следующее:
- Кто может идентифицировать меня, используя данные, которые я предоставляю алгоритму? Кто имеет доступ к моим данным? Это особенно важно для чувствительных приложений, таких как банковское дело, где есть некоторая зависимость от выходных данных НЛП для принятия решений, касающихся доступа к кредиту.
- Является ли алгоритм потенциально предвзятым к определенной расе или полу? Это реальная проблема, если обучающие данные недостаточно разнообразны.
В заключение сегодняшнее определение:
Сопоставление A:B — метод машинного обучения, при котором алгоритм обучается внутри себя и дает результат B на основе входных данных A. Общим примером являются цены продажи домов в определенном районе (входные данные A), а выходными данными могут быть оценочные рыночные цены на конкретный дом в том же районе (выход B).