Traduttori traditori гласит римская поговорка. «Переводчик — предатель».
Это потому, что языки не пересекаются. Между словами одного языка и словами другого языка нет однозначного соответствия. Симптомом этого является несоответствие количества слов в одном и том же тексте, но на разных языках.
Чем конкретнее что-то, тем легче это перевести. Вот почему технические тексты хорошо справляются с машинным переводом, а поэзия — нет.
Машинный перевод быстро совершенствуется. Нетрудно представить, что вскоре большинство переводческих задач можно будет полностью автоматизировать.
Это поднимает вопрос о том, как технологии меняют наше отношение к языкам. Если мы можем общаться через языковые барьеры, используя компьютеры в качестве посредников, зачем учить новый язык?
В более общем плане возникает вопрос, что происходит с навыками, когда компьютеры разрушают потребность в этих навыках? Является ли цена, которую мы платим за то, что компьютеры берут на себя определенное бремя, заключается в том, что мы должны отказаться от умений, которые пришли с этим бременем?
Аналогию можно найти и в других областях, где машины облегчают нагрузку на людей. В конце концов, это не потому, что у нас есть машины, из-за которых люди перестали ездить, и не потому, что калькуляторы сводят на нет необходимость изучения математики. Общим для этих примеров является то, что задача сама по себе приносит пользу. В случае бега вы не только переходите от А к Б, вы также улучшаете физическую форму и теряете вес.
Точно так же изучение языка имеет надежно документированные когнитивные преимущества. Но ценность языка не ограничивается возможностью того, что его изучение отсрочит Ацгеймера. В конце концов, аргумент в пользу познавательной пользы — это аргумент в пользу изучения какого-либо языка, а не обязательно в пользу сохранения языков как таковых.
Языки имеют ценность, потому что определенные идеи существуют только в некоторых языках. Любой, кто говорит более чем на одном языке, испытал разочарование из-за идеи, которая просто не переводится. Язык — это способ категоризировать мир и взаимодействовать с ним. Каждый раз, когда язык теряется, окно в мир навсегда закрывается.
Окна быстро закрываются. Подсчитано, что через 100 лет дети не будут говорить на 60–80% языков мира.
Таким образом, хотя машинный перевод может облегчить взаимодействие с людьми на поверхностном уровне, он не решает проблему того, как по-настоящему глубоко погрузиться в язык и усвоить наследие, которое он несет. Но машины могут помочь двумя способами.
Во-первых, существует огромный потенциал компьютерного изучения языков. Потенциал, который, я подозреваю, до сих пор в значительной степени не задействован. В 2010 году шахматный гроссмейстер Гарри Каспаров опубликовал статью, в которой заметил, что гроссмейстеры молодеют и молодеют. Причина этому наличие шахматного софта. Все в более молодом возрасте люди начинают играть в шахматы против своих компьютеров. Некоторые из этих людей играют одержимо и очень долго, их компьютеры действуют как тренеры, которые никогда не теряют терпения и не устают. В результате люди быстрее получают практику и опыт, необходимые для мастерства.
Изучение языка наиболее эффективно, когда человек погружен в язык и имеет доступ к носителям языка. Практика открытая и интенсивная. Это трудно сделать, если вы не живете там, где говорят на этом языке.
Можно представить себе будущее, в котором чат-боты будут использоваться в языковой практике, фактически имитируя погружение.
Еще один способ, которым компьютеры могут помочь в сохранении языков, находящихся под угрозой исчезновения, — не обучать их, а изучать. В конце концов, наиболее эффективные на сегодняшний день системы обработки языка используют глубокое обучение, набор методов машинного обучения, с помощью которых компьютеры осваивают навыки посредством массового воздействия контента, а не явного программирования.
Могут ли умирающие языки сохраняться в машинах, как ДНК в окаменелостях янтаря, в ожидании того дня, когда кто-то захочет их выучить и оживить?
Это обнадеживающее видение. Но, как мне недавно указали в дискуссии, здесь есть уловка-22. Английский и мандаринский языки сегодня являются языками, на которых лучше всего говорят компьютеры. Отчасти это связано с тем, что на этих языках доступно так много исходного материала для обучения алгоритмов глубокого обучения. Я подозреваю, что такие языки, как французский, японский, немецкий и испанский, вероятно, не слишком отстают.
А как насчет такого языка, как яганский? Этот язык когда-то был распространен среди людей на крайнем юге Чили, на Огненной Земле. Сегодня есть единственный живой носитель этого языка. Ее зовут Кристина Кальдерон, и на момент написания этой статьи ей 88 лет. Ей не с кем поговорить на родном языке, который, скорее всего, умрет вместе с ней.
Этот сценарий слишком частый. Достойным применением искусственного интеллекта было бы оставить смерть языка в прошлом.