Печатать сложно.

Интернет по-прежнему в значительной степени основан на английском языке. Веб-адреса пишутся английским алфавитом, веб-сайты часто имеют английский эквивалент, и английский остается наиболее часто используемым языком в Интернете. С другой стороны, по данным Nielsen, почти половина интернет-пользователей в 2017 году были из Азии (второе место занимает Европа - всего 17%).

Поскольку распространение Интернета в Азии продолжает стремительно расти, стандартное использование Интернета в странах Восточной Азии требует постоянного переключения между языками и методами ввода с помощью меню выбора языка или сочетания клавиш. Несмотря на десятилетия работы над методами ввода, это постоянное переключение кода по-прежнему часто приводит к производственным ошибкам. Например, пользователь может попытаться ввести строку на английском языке, используя метод ввода на японском языке. В результате получается тарабарщина, или, как принято называть по-японски, моджибаке (文字 化 け).

Ввод текста на японском языке

Из языков Восточной Азии японские пользователи компьютеров создают текст с помощью самого различного количества шрифтов. Ввод текста на японском языке также выполняется относительно быстро. Из-за этого производственные ошибки при генерации текста на японском языке особенно задерживаются и трудно устраняются.

Для генерации обычного японского текста обычно используются три скрипта. Эти сценарии включают в себя: хирагана (обычно используется для обозначения родных японских слов), катакана (обычно используется для обозначения заимствованных слов) и кандзи (заимствованные китайские иероглифы). В современном японском языке латинский шрифт (ромадзи) часто используется для слов, которые не транслитерировались в катакана, или просто для стилистического эффекта.

Чтобы ввести строку, большинство японских пользователей вводят текст хираганой и / или ромадзи, а затем транслитерируют текст в соответствующий алфавит. Кандзи - своего рода исключение - оно генерируется методом, аналогичным вводу китайского пиньинь, и транслитерируется из введенного пользователем текста хирагана через список завершения.

Переключение метода ввода может быть выполнено несколькими способами в зависимости от операционной системы. Windows предоставляет пользователю «языковую панель», которая позволяет пользователю выбрать желаемый метод ввода. Многие ноутбуки, планшеты и телефоны также оснащены специальными клавишами переключения языков. Несмотря на простоту переключения языков, производственные ошибки из-за несоответствия скриптов по-прежнему распространены при генерации японского текста.

Анализ заданий GOMS для японских материалов

Возможные причины производственных ошибок устраняются путем выполнения анализа GOMS генерации японского текста. Отказ от ответственности: здесь все становится занудно.

Конечная цель генерации текста - создать читаемую пользователем строку с правильным скриптом и кодировкой. Подцели этой задачи делятся на две разные категории: выбор метода ввода и ввод текста. Операторы варьируются от поиска пользовательского интерфейса выбора языка до ввода символов. Выбор метода ввода и ввод текста постоянно чередуются, когда пользователь пытается ввести текст. Ввод текста состоит из большинства операторов, присутствующих в задаче ввода текста на японском языке. Только когда требуется другой метод ввода, цикл задачи возвращается к выбору метода ввода. Ниже приведен пример анализа задачи GOMS для генерации японского текста с несколькими методами ввода в Windows 10:

Производственные ошибки при использовании Интернета

Производственные ошибки из-за несоответствия скриптов могут затруднить выполнение даже самых простых действий при использовании веб-браузера. Наиболее распространенные ошибки обычно возникают во всех контекстах общения. Есть также более конкретные примеры, такие как ввод URL-адреса. Поскольку веб-адреса обычно пишутся латиницей, перед вводом URL-адреса необходимо переключиться с хираганы или катаканы на буквенно-цифровой метод ввода. В общем случае, когда об этом переключателе забывают, пользователь создает моджибаке, такой как в примере, что, конечно, не подходит для действительного URL.

Такие трудности также обычны при общении в чате или при использовании мессенджера. Японские интернет-пользователи разработали огромный и очень разнообразный интернет-жаргон с сокращениями, эмодзи и намеренными орфографическими ошибками. Многие из этих последовательностей символов были сохранены в мускульной памяти японских интернет-пользователей, и, соответственно, они вводятся не символ за символом, а как единое высказывание.

Следовательно, когда язык ввода неправильный, пользователи могут вводить целые фразы на неправильном языке или в неправильном алфавите, что часто оказывается неудобным. Например, поиск в Интернете и, конечно же, ввод URL-адресов часто ведется на английском языке из-за преобладания англоязычных веб-сайтов. Затем пользователь идентифицирует сеанс использования Интернета с англоязычным контентом, создавая ложную, чрезмерно обобщенную когнитивную карту. В результате при разговоре на японском языке пользователь может вместо этого генерировать текст, состоящий из буквенно-цифровых символов, что приводит к моджибаке.

Эти трудности в создании текста часто оказываются очень утомительными, раздражающими и отнимающими много времени. И хотя были предприняты некоторые попытки исправить типичные ошибки и особые случаи, производственные ошибки распространены даже среди самых опытных пользователей компьютеров.

Смягчения

Современные операционные системы и веб-браузеры предоставляют элементарные средства защиты от моджибаке. Например, Windows 10 будет переключать код, когда пользователь вводит «www» с использованием неправильного метода ввода. Аналогичные меры защиты доступны для других часто используемых строк, таких как «ftp:», «http», «c: /» и т. Д.

Хотя эти методы подстановки строк полезны, они не панацея. Ошибки ввода URL-адресов по-прежнему остаются очень распространенной производственной ошибкой при генерации текста. Например, простой ввод URL без поддомена «www» приведет к производственной ошибке. Кроме того, эти правила применяются непоследовательно в операционных системах и браузерах. Всегда существует неуверенность в том, может ли пользователь рассчитывать просто ввести текст в адресной строке.

Мы можем добиться большего, применив некоторое дизайнерское мышление к задаче ввода моджибаке. Вот несколько идей:

  • Лучшее состояние системы. Пользовательские интерфейсы должны четко отражать, какой метод ввода использует человек. Это позволит пользователю переключать код до начала генерации текста.
  • Интеллектуальное переключение кода. После создания текста система должна сопоставить сгенерированный текст с общими конструкциями и попытаться исправить моджибаке. Например, если пользователь вводит «Google。c お m» в адресную строку, эту строку можно транслитерировать в «google.com».
  • Лучшее исправление. 􏰀 Пользователи должны иметь возможность переключать способ отображения строки, переключая метод ввода после генерации текста.
  • 􏰀 Настройка. Пользователи должны иметь возможность редактировать все аспекты методов ввода и правил исправления для максимальной эффективности.
  • Коррекция с машинным обучением. Если пользователю не удается перейти к «Apple。cおm» несколько раз, потому что он не существует, система должна узнать, что этот URL недействителен и не соответствует пользователю.

Делаем лучше

Генерация текста в восточноазиатских шрифтах уже сложна, и этот процесс только усугубляется постоянным переключением кода. Как показано в анализе задачи, для создания текста на японском языке требуется целый отдельный набор операторов, прежде чем можно будет написать один символ. Ошибки производства из-за неправильного метода ввода очень распространены из-за отрицательной обратной связи и простой забывчивости. К счастью, эта проблема относительно разрешима с помощью современных технологий и машинного обучения. Самое сложное - это в первую очередь осознать, что есть проблема.