AI, имитирующий человеческое тело - часть 1

Автор: Алаа Эльджатиб

Что такое AI

Искусственный интеллект или ИИ - это термин, который в последнее время часто используют. Но когда людей просят объяснить, что это означает, не каждый может четко сформулировать объяснение. Что я могу сказать с уверенностью, так это то, что ИИ не новость. Я изучал этот предмет в бакалавриате и аспирантуре с 2006 по 2016 год и был очарован огромными исследованиями и приложениями, которые восходят ко второй половине 20-го века.

Проще говоря, ИИ - это более широкий термин, обозначающий компьютерные или программные процессы, которые пытаются имитировать человеческое взаимодействие и поведение. Машинное обучение, которое совпадает с ИИ, на самом деле является подмножеством ИИ, которое прогнозирует тенденции на основе существующих данных. Фактически, когда был изобретен компьютер, одной из самых ранних идей было создание механического устройства с искусственным интеллектом, похожего на человеческий мозг. Если мы сравним человеческое тело с компьютерными системами, то увидим, что у них обоих есть входы и выходы. Когда пять органов чувств отвечают за сбор и получение входных данных, тело генерирует выходные сигналы посредством речи и физических движений тела. Под зонтиком ИИ существует бесчисленное множество приложений, и я попытаюсь объяснить каждое приложение через призму пяти человеческих чувств: зрения, слуха, вкуса, запаха и осязания.

Зрение или видение

Ученые ИИ работают над моделированием обрабатывающей способности человеческого глаза с помощью операций, в том числе алгоритмов обработки изображений IPA (обработка и анализ изображений), DIP (обработка цифровых изображений) и других подполей IPA / DIP, таких как оптическое распознавание символов. (OCR) и алгоритмы улучшения изображения. Процесс зрения, который позволяет людям видеть, разделен на два подпроцесса: захват изображения и понимание изображения в мозгу. Часть понимания - это то, где алгоритмы ИИ творит чудеса. IPA и DIP используют машинное обучение и естественную обработку изображений для анализа изображения и проецирования результатов на экран или другое оборудование, которое объясняет, что такое захваченное изображение.

Настоящая проблема состоит в том, чтобы обрабатывать изображения на уровне человека в режиме реального времени, когда результаты выдаются немедленно. Другие области, которые по-прежнему требуют большой работы, - это улучшение изображения, то есть объединение недостающих фрагментов воедино или превращение размытого и нечитаемого изображения в четкое изображение высокой четкости.

Слух

Голос, в частности голосовые помощники, - это новая область, недавно популяризированная Amazon Alexa и Google Assistant, взаимодействующими через проприетарное оборудование (Echo, Dot и Google Home соответственно). В голосе есть множество подтем, в которые мы можем погрузиться:

  • Распознавание голоса
  • Голосовые команды
  • Перевод текста в речь и речи в текст

Хотя об этом говорят все, по сравнению с другими приложениями искусственного интеллекта развитие голоса отстает. Мы можем переводить только речь в текст и текст в речь. Хотя такие компании, как Samsung с их недавно представленным голосовым помощником под названием Bixby (еще не выпущенным), пытались понять естественную речь человека и выполнить соответствующие действия, он все еще находится в зачаточном состоянии и требует дополнительной работы, чтобы вести себя более эффективно.

Когда вы смотрите типичный шпионский фильм или фильм о Джеймсе Бонде, персонаж иногда имитирует звук и внешний вид другого человека. Возможность изображать и имитировать чей-то голос по тону, акценту и стилю речи в режиме реального времени все еще находится в стадии разработки.

Вот вторая часть моего блога, в которой я рассказываю о приложениях искусственного интеллекта для изучения запаха, вкуса и осязания. Оставьте мне комментарий ниже, если у вас есть какие-либо мысли, комментарии или вопросы!

Алаа Эльджатиб был очарован возможностями и возможностями искусственного интеллекта и получил степень магистра и доктора наук в области искусственного интеллекта в Дамасском университете в Сирии. Покинув свой дом в 2016 году, он присоединился к TribalScale в качестве инженера по гибкому программному обеспечению, накопив богатый опыт в области искусственного интеллекта и инженерии.

Присоединяйтесь к TribalScale в Twitter, Facebook и LinkedIn!