Машинное обучение и платоновская аллегория пещеры

Как нынешний подход к машинному обучению вписывается в знаменитую аллегорию Платона и куда мы идем оттуда.

Аллегория пещеры была представлена греческим философом Платоном в его работе Republic, первоначально для сравнения «эффекта образования и отсутствия это от нашей природы ». Как ни странно, современная область машинного обучения, как оказалось, все еще более или менее вписывается в этот шаблон, которому более 2000 лет.

Аллегория пещеры

Аллегория проясняется из разговора между Сократом и его учеником Главконом.

Проще говоря, Сократ говорит Главкону представить людей, живущих в огромной подземной пещере, открытой для внешнего мира через один тяжелый и крутой туннель. Люди скованы цепями, лицом к высокой стене, они не могут повернуть лица или разорвать цепи. Позади заключенных горит сильный огонь, проецируя происходящее позади людей в виде теней всех форм на стену, перед которой находятся заключенные.

Поскольку люди никогда не могут хоть немного повернуться лицом на протяжении всей своей жизни, они растут и умирают, наблюдая за тенями на стене, которые составляют всю известную им реальность.

Символически говоря, тени на стене представляют собой поверхностную истину - «виртуальную» реальность, которая воспринимается только нашими чувствами, в отличие от конечной «реальной» реальности, которая, согласно платонизму, есть состоящий из Форм (идей), которые мы, смертные, никогда не сможем познать посредством ощущений.

Кроме того, двухмерные проекции на стене представляют собой целый мир для бедных заключенных. Их любопытные умы будут пытаться придумать истории или истории для этих фантомов - как они имеют тенденцию взаимодействовать друг с другом, когда некоторые тени имеют тенденцию появляться вместе, вызывает ли одна особенная тень появление другой и т. Д. Они размышляют и придумывают самые сложные теории, объясняющие поведение теней; но, к сожалению, они все еще не знают истинной природы теней.

Если бы они только могли повернуться лицом, они бы узнали, что некоторые из их любимых теорий теней основаны на плохих шутках некоторых обманщиков, стоящих прямо за ними, которые могли прекратить играть в любой момент, уничтожив некоторые из лучших моделей из команды заключенных. Даже если мы предположим, что мир доброжелателен, в котором нет никого, кто мог бы обмануть бедных заключенных, в любой момент небольшая случайная корректировка угла, под которым появляется трехмерная фигура, может сильно повлиять на ее проекцию на стену. несомненно, что привело к значительному хаосу среди теоретиков заключенных.

Что делает машинное обучение

Несмотря на всю шумиху и обещания, связанные с машинным обучением или искусственным интеллектом, по сути, алгоритмы машинного обучения рассматривают кучу наблюдений, сделанных в отношении явления и прикрепленных к ним ярлыков / значений (в зависимости от того, является ли это задачей классификации или регрессии), попробуйте прийти с помощью функции, состоящей из известных функций, форма которых, кажется, соответствует форме данных, а затем продиктовать метку или значение, когда приходит новое наблюдение.

Эмпирические правила заключаются в том, что (1) качество любых выходных данных машинного обучения сильно зависит от качества входных данных. Проще говоря, мусор на входе, мусор на выходе; (2) алгоритмы машинного обучения никогда не смогут «изучить» или обнаружить какие-либо новые правила, которые нам еще неизвестны.

Другими словами, то, чего мы в конечном итоге можем достичь с помощью моделей машинного обучения, зависит от качества данных, с одной стороны, и известной «реальности» исследователей, создавших эти модели, с другой.

Параллели

Вернемся на время к аллегории пещеры. По-видимому, точно так же, как реальные трехмерные фигуры проецируются как двумерные тени на стену, в повседневной практике машинного обучения описания реальных объектов (переменных), когда они записываются как числовые или категориальные данные, никогда не являются полное изображение исходного объекта.

Причина может заключаться в том, что нам не хватает измерений определенных свойств из-за различных логистических ограничений, но более вероятно, что, поскольку мы с рождения ограничены всевозможными примерами и опытом коллективного обучения, нам просто не хватает знаний даже о существовании определенных важнейших свойств. объекта. Очевидно, что если мы даже не подозреваем о существовании чего-либо, как мы можем в первую очередь просить об этом, затем задавать вопросы об этом и, наконец, измерять это?

В этом свете текущие усилия по использованию альтернативных данных для решения всех проблем машинного обучения имеют смысл и заслуживают похвалы, поскольку мы осознали, что традиционный набор функций больше не соответствует нашим потребностям, и поскольку мы работаем с данными `` теней '' в любом случае, почему бы не позаимствовать фрагменты из других «теней», которые могут помочь нам в реалистичных терминах? Неудивительно, что спутниковые изображения заводов или данные о настроениях в социальных сетях все чаще включаются в модели автоматической торговли; правда в том, что они были хорошими факторами при прогнозировании показателей капитала, а старые школьники, застрявшие с балансами, просто упускают из виду.

Нетрудно представить, что миллионы моделей машинного обучения обучаются каждый день на данных «теней», при этом им ставится задача выяснить взаимосвязь (корреляцию или даже причинно-следственную связь, если того потребует какой-нибудь преуспевающий руководитель проекта) между реальными- объекты жизни, породившие данные. Не вдаваясь в неоплатоническую тему эманационизма, который, по сути, утверждает, что все происходит из совершенной первой реальности и, будучи далее извлеченным и отчужденным от первой реальности, становится менее чистым и менее совершенным, мы могли бы описать дилемму, повернув к другому примеру.

В романе Льюиса Кэрролла Зазеркалье, когда Белый Рыцарь объясняет Алисе песню Haddocks 'Eyes, автор обсуждает различие между песней и песней называется, название песни и то, как называется песня ». Сама песня, будучи платонической формой, порождает производные формы, такие как название песни или даже название названия песни (которое может продолжаться бесконечно); тем не менее, эти производные могут даже не иметь близкого отношения к теме песни. Тем не менее, производные (низкоуровневые) в большинстве случаев - это то, чем известен и анализируется реальный объект, в то время как сам объект остается невыразимым или неизвестным.

Бритва Оккама

Следовательно, в тот момент, когда мы наблюдаем за объектом, происходит вывод, и мы создали тень на стене. Если мы поймем, что в конце концов, мы работаем с наборами данных «теней», мы могли бы лучше определять наши ожидания в отношении того, что может получиться из точных моделей машинного обучения. Мы могли бы случайно и ненадолго разорвать цепи в нашем уме, выпуская свое любопытство и воображение и постулируя дико параметризованную модель реальности, но, очевидно, бритва Оккама доминирует в пещере, и прозрения в конце концов случаются нечасто.