Вы когда-нибудь задумывались, почему фотографирование в сложных ситуациях, например, ночью или прямо против солнечного света, в конечном итоге портит тон вашей кожи? Это сложные световые ситуации для современных смартфонов из-за аппаратных ограничений камеры текущего поколения. По этой причине многие бренды смартфонов реализовали такие функции, как "Ночной режим"или "Улучшенный AI"фото- и видеорежимы, в своем программном обеспечении для своих устройств для этого конкретного использования. случай. Некоторые из этих решений отлично работают и значительно улучшают воспринимаемое качество этих фотографий… когда они работают так, как задумано. Но в остальное время фотографии и видео выглядят, ну… не так. Либо оттенки кожи, фон или какие-либо другие характеристики изображения в конечном итоге выглядят неестественно, а иногда можно сказать, «некрасиво».

Часто пользователи задаются вопросом, почему этот кадр в итоге выглядит плохо, а другие — отлично? Кто-то приходит к выводу об ошибке пользователя, кто-то подбрасывает на волю случая. А некоторые решили посмотреть немного глубже, особенно специалисты по данным. Исследователи проанализировали групповые исследования по этому вопросу и обнаружили общий фактор для этих сохраняющихся более высоких показателей отказов.

Как указано в статье The Verge, Поле искусственного интеллекта слишком белое и слишком мужское. При тестировании алгоритмов машинного обучения на воссоздание лиц из частичных/размытых изображений/изображений с потерями алгоритмы машинного обучения часто оказываются отбеленными реконструкциями и в конечном итоге не выглядят похожими на исходные образцы изображений.

Но какое отношение это имеет к моим уродливым фотографиям?
Почему этот искусственный интеллект ведет себя таким образом?
Почему он не может просто работать при любых настройках и условиях освещения?
Что-то делается для этого или мы просто остаемся с тем, что есть?

Вот некоторые вопросы, которые у вас могут возникнуть сейчас по этому поводу, и я отвечу на них в следующей статье. Мы рассмотрим, как создается машинное обучение для таких приложений и почему получаются такие резкие результаты, почему это происходит, каковы ограничения и какие будущие технологии работают над улучшением ситуации.

Алгоритмы машинного обучения могут показаться волшебством, во многом так оно и есть… но это не кларк-тек, эти алгоритмы предназначены для выполнения функции с заданным набором входных данных и ожидаемых результатов. Хотя подробное объяснение мельчайших деталей машинного обучения может оказаться для меня забавной кроличьей норой, к сожалению (для меня, вздох), это выходит за рамки этой статьи.

Для целей этой статьи все, что вам нужно знать, это то, что алгоритмы машинного обучения регулируются набором правил. Эти правила не определяются архитектором, а являются побочным продуктом процесса создания самого алгоритма. Как правило, алгоритмам предоставляется набор входных данных, называемых выборочными данными или обучающими данными; на которых они «обучаются» с целью достижения желаемого результата. Это «обучение» осуществляется с помощью положительной и отрицательной обратной связи, которую дает регулятор алгоритма. После обучения эти алгоритмы могут продолжать создавать новые выходные данные для заданных входных данных, как и предполагалось, и даже продолжать учиться, используя новые входные данные и совершенствоваться дальше.

Помимо примечания, основным фактором, способствующим этому дисбалансу в результатах алгоритмов машинного обучения, таких как распознавание лиц и улучшение изображений, является чрезмерное использование наборов данных, содержащих в основном белые, белые, мужские демографические данные, что приводит к тому, что алгоритмы имеют врожденную предвзятость для получения отличные результаты для указанной демографической группы и посредственные или даже плохие результаты для остального мира.

Это основная причина, по которой алгоритмы машинного обучения, разработанные на Западе, в конечном итоге приводят к результатам, на которые указывает The Verge. Также причина, по которой вы можете получить некрасивые фотографии с вашего iPhone.

Чтобы «обобщить» такие алгоритмы таким образом, чтобы они хорошо работали для большого набора объектов и условий освещения, требуется, чтобы разработчики этих алгоритмов включали более разнообразный набор данных изображений с вышеупомянутыми объектами и условиями освещения. Это дорогое предприятие, поскольку создание любого вида ИИ обходится дорого, но создание более универсального ИИ требует особого внимания. По этой причине до сих пор большинство корпораций предпочитали разрабатывать свою продукцию для наиболее платежеспособной демографической группы (что может иметь смысл в меньшем масштабе), но правда в том, что мы все уникальны и сильно отличаемся от других. друг друга во многих отношениях. То, что работает для какого-то технического руководителя, сидящего в Калифорнии, теперь может работать для вас, живущего в Сингапуре.

К счастью, мы не зациклены на том, что имеем, вычислительные технологии быстро развиваются, а крупные игроки, такие как Google, внедряют такие проекты, как Real Tone, чтобы бороться с против этой исторической расовой предвзятости в алгоритмах искусственного интеллекта и машинного обучения. Ожидается, что с ростом конкуренции подобные проекты будут развернуты в техносфере такими компаниями, как Apple, Samsung и Microsoft. В целом, когда дело доходит до искусственного интеллекта и машинного обучения, кажется, что солнце восходит для более открытого и справедливого мира. (где теперь мой кофе? Алекса!)