Выбор нового поколения

Недавно я разговаривал с Джозу, другом из моей хьюстонской церкви. Он видел, как я читал какую-то действительно интересную книгу о глубоком обучении или тому подобном, и дискуссия перешла к будущему технологий, и, конечно, ни одна такая тема не обходится без, по крайней мере, консультации с прогнозами научной фантастики. Я упомянул, что, по моему мнению, лучшая научная фантастика на телевидении прямо сейчас - это сериал Netflix под названием Черное зеркало, который мы видели и какое-то время обсуждали, какие эпизоды являются лучшими. Как признак хорошего пастора, он начал направлять вопросы на пересечения этих историй и тех аспектов веры или морали, которые могли быть в центре внимания проповеди. Эта конкретная церковь имеет изящную историю того, чтобы задавать подобные вопросы, наш старший пастор даже публиковал книги, извлекающие уроки духовности из того, что могло бы быть неожиданным произведением художественной литературы вроде сериала HBO« Клан Сопрано , - что для непосвященных не просто история о гангстерах, но это также и захватывающая драма, затрагивающая такие темы, как семья, психология и верность. По мере того, как дискуссии о том, чему мы могли научиться из научной фантастики, развивались, у Джозу появилась искра, которую такое выступление могло бы создать для аккуратного группового обсуждения, и, короче говоря, мы закончили тем, что договорились организовать специальную встречу, на которую мы пригласили бы Несколько друзей смотрели серию Черное зеркало всей группой, а затем мы оба следовали с презентацией, где я говорил о технических аспектах серии, а он мог затронуть более библейские темы. Пройдя немного вперед и назад, мы остановились на эпизоде ​​Аркангел. Ниже представлены подготовленные мной слайды и тезисы для обсуждения этого выступления. И без лишних слов.

Черное зеркало - британский научно-фантастический сериал, созданный Netflix. Эпизоды состоят из замкнутых историй, действие которых происходит в периоды от ближайшего до далекого будущего. Общая тема состоит в том, что сюжеты сосредоточены вокруг проекций будущих парадигм технологий, засеянных теми аспектами технологий, которые только появляются сегодня. Например, некоторые точки обращения включают посягательство на наши отношения геймифицированных взаимодействий в социальных сетях, альтер-эго, обеспечиваемое виртуальными мирами массовых многопользовательских игр, или прямые мозговые каналы для компьютерного интерфейса. Несомненно, стоит отметить, что тон этой серии, как правило, довольно мрачный, а в некоторых случаях даже крайне мрачный, поскольку истории задают вопросы не только о том, куда могут нас привести эти технологии, но и о том, как они могут пойти не так. Эта презентация в основном избегает этих темных тем и вместо этого фокусируется на тех аспектах конкретного эпизода, которые основаны на современных технологиях.

Общий комментарий жанра научной фантастики состоит в том, что я считаю, что лучшие рассказы не просто фокусируются на фантастических воплощениях космических путешествий или новых технологий, например, но уравновешивают эти аспекты с включенными темами вневременных элементов человеческой природы - будь то те. темами могут быть политика, романтика или борьба проигравшего. Должен быть хотя бы один главный герой, который позволит нам взглянуть на то, что может быть странным новым миром, глазами вневременной призмы. Нам нужен кто-то, с кем можно отождествлять себя или болеть за то, чтобы истории не стали слишком сюрреалистичными и неузнаваемыми.

Этот эпизод Arkangle включает в себя невероятный спектр технологий будущего в истории, но по своей сути это вечная аллегория о воспитании детей и отношениях между матерью-одиночкой и ее ребенком. История задает вопросы о рисках, связанных с воспитанием детей в вертолете, о том, что происходит, когда ребенок растет в чрезмерно защищенной среде, что происходит, когда ему не позволяют совершать собственные ошибки. По мере того, как этот ребенок взрослеет и сталкивается со сверстниками с плохим влиянием, мы видим, как благие намерения властного родителя могут стать контрпродуктивными. В конце концов, центральным вопросом этого эпизода является развитие личности ребенка, находящегося в крайне защищенном состоянии, и то, как это может помешать его способности справляться с искушениями по мере того, как он становится взрослым. Это рассказ о психологии.

Технологические аспекты этого эпизода охватывают широкий спектр, но по своей сути исследуют потенциальные возможности взаимодействия компьютера с прямым интерфейсом мозга. Реализация, продемонстрированная в эпизоде, представляет собой довольно плавную реализацию ребенка, которому имплантирована какая-то технология мозга, позволяющая контролировать сенсорные ощущения через удаленный терминал. Этот мозговой интерфейс не только облегчает сторонний мониторинг, он также служит для прямого взаимодействия с теми же сенсорными входами, которые испытывает получатель, так что последующие встречи со взрослыми темами, такими как насилие, сексуальность или травма, подвергаются цензуре за счет затемнения этих частей зрения. или аудио с графическими наложениями или звуковыми помехами. Фактическая реализация такого мозгового имплантата в рассказе абстрагируется, но что действительно интересно, так это то, что некоторые из основных технологий, которые позволят реализовать такие возможности, уже исследуются современными учеными. В этой презентации будут освещены некоторые аспекты категорий технологий, которые могут быть предшественниками парадигм Arkangel. Мы будем обращаться к ним с позиций высокого уровня науки о мозге, сенсорного мониторинга, анализа настроений и дополненной реальности.

Мне, вероятно, следует предварять этот раздел заявлением о том, что я не считаю себя экспертом по человеческому мозгу, в конце концов, это самый сложный орган нашего тела, и ученые могут провести всю свою карьеру, изучая только микстуры его функционирования. Однако в ходе своих исследований я обнаружил, что есть несколько высокоуровневых функций архитектуры, которые, как я думаю, могут помочь лучше интуитивно понять систему, и поэтому я кратко предлагаю здесь основные моменты.

Ни одно обсуждение мозга не будет полным без описания нейронов, фундаментальных строительных блоков вычислений. Каждый нейрон представляет собой отдельную клетку, которая взаимодействует с окружающими нейронами посредством электрических импульсов различной частоты. Человеческий мозг состоит из миллиардов нейронов и триллионов синапсов (точек сопряжения между нейронами). Мозг выборочно и непрерывно адаптирует интенсивность возбуждения каждого отдельного нейрона на основе воздействий в реальном времени в процессе, известном как избирательная адаптация. Если бы единственным средством взаимодействия нейронов были электрические импульсы, их было бы легче смоделировать, однако нейроны также подвержены влиянию более тонких химических и гормональных аспектов.

Ученым до некоторой степени удалось составить карту областей мозга на основе их специализации, используя такие инструменты, как аппараты МРТ, для измерения скорости активации нейронов при воздействии различных сенсорных сигналов. Из того, что я собрал, каждая из этих областей может иметь более высокую скорость связи между нейронами в пределах их границ, хотя степень взаимосвязи, пересекающая эти границы, будет повсюду. Можно провести важное различие между теми аспектами нашего мозга, которые составляют сенсомоторный процесс, которые имеют некоторое сходство с современной архитектурой машинного обучения, известной как нейронные сети прямого распространения, в которых сигнал преобразуется по мере его прохождения через прогрессивные слои взаимосвязанные нейроны. Другие аспекты мозга, такие как формирующие воспоминания, больше связаны с архитектурой аттракторных сетей с коллективной последовательностью паттернов возбуждения для набора нейронов.

В междисциплинарной научной специализации, известной как теория сложности, исследователи будут изучать системы, которые проявляют так называемые эмерджентные свойства. Одним из ключевых открытий в этой области является то, что для систем достаточной сложности невозможно понять работу коллектива, просто изучая те отдельные компоненты, из которых состоит система. У этих систем есть неснижаемое поведение, которое возникает, например, с увеличением масштаба, взаимосвязанности или частотной области взаимодействия.

Взгляните на эту фотографию, которую я сделал во время заката, когда колония летучих мышей покинула мост, под которым они живут в парке Буффало Байу. Каждая из этих летучих мышей действует независимо, основываясь на звуковом ощущении близости и движения своих ближайших соседей. Если у вас когда-нибудь будет возможность приехать, я рекомендую, это действительно отличное впечатление (если вы не можете приехать в Хьюстон, на территории кампуса Университета Флориды есть еще одна колония). Надо задуматься над тем, что движение летучих мышей из-под моста происходит не одновременно, есть поток летучих мышей, даже несмотря на то, что нет «королевы», которая руководит группой. Если все летучие мыши уйдут одновременно, они рухнут на землю в скоплении пут, так что есть некоторая координация, но только одна, которая возникает от каждой летучей мыши, действующей независимо, вероятностным образом. Учтите также, что если вы посетите эту колонию несколько дней, вы обнаружите, что направление, в котором они движутся, меняется с вечера на вечер, но даже при том, что те летучие мыши, которые уезжают раньше всех, не взаимодействуют с теми, кто позже следует за колонией, коллективно принимают решения.

Я пытаюсь провести аналогию с тем, что клетки нашего мозга работают аналогично колонии летучих мышей. Каждый нейрон является независимым агентом, взаимодействующим только с теми нейронами, с которыми он напрямую связан. Переживание сознания реализуется не только через действия конкретных нейронов, но благодаря коллективному взаимодействию массовых сетей этих возникающих систем, как сетей прямого распространения, так и сетей аттракторов, составляющих наш мозг и нервную систему, мы можем испытывать сознание. и взаимодействовать с грубыми представлениями о нашей окружающей среде.

Особенность этого эпизода в отслеживании сенсорных входных данных открывает целую банку червей, поэтому, прежде чем рассматривать внешние аспекты сенсорного мониторинга, давайте сначала попробуем пройтись по некоторым основным элементам работы зрительной коры головного мозга человека. Оказывается, у нас есть некоторая помощь в том, что особая архитектура современных алгоритмов компьютеризированного машинного обучения была частично построена для имитации элементов работы зрительной коры головного мозга. Эта архитектура машинного обучения известна как сверточная нейронная сеть, и она работает как своего рода сеть прямого распространения, в которой закодированное изображение подается через последовательность взаимосвязанных слоев нейронной сети для преобразования в некоторую интерпретацию, причем такое преобразование происходит через числовые веса и активации от сигнала каждого искусственного нейрона, что аналогично преобразованию входного сигнала биологического нейрона в некоторую производную выходную частоту импульсов электрического импульса. Если вы изучите развитие этих нейронных слоев в сверточной нейронной сети, вы обнаружите, что каждый является производным от процесса алгоритмической операции контролируемого обучения, так что сеть может распознавать особенности возрастающей сложности в каждом слое как изображение проходит через сеть. Например, ранняя строка может обнаруживать края изображения, последующая строка может обнаруживать кривые или прямые линии от этих краев, другая строка может обнаруживать простые формы из этих кривых и линий, а поздние строки в сети могут обнаруживать особенности возрастающей сложности. например лица, дома или автомобили.

Оказывается, зрительная кора головного мозга работает аналогичным образом: зрительные нервы в глазу преобразуют изображения в закодированные электрические сигналы, по которым нейроны зрительной коры распознают края и формы. Я частично исхожу из моих несколько ограниченных знаний, но я считаю, что одно ключевое отличие состоит в том, что, хотя современная искусственная сверточная нейронная сеть работает в основном через прогрессию изображения через интерпретацию нейронной сети с прямой связью, в мозгу распознавание особенностей наивысшая изощренность происходит за пределами зрительной коры через взаимодействие ее аспектов прямой связи с сетями аттракторов других долей, которые хранят репрезентации воспоминаний и изученных свойств. Таким образом, зрительная кора головного мозга похожа на первые слои сверточной нейронной сети, которые обнаруживают простые особенности изображения, которые затем интерпретируются другими областями органа.

Установив некоторые строительные блоки обработки изображений мозга, давайте теперь обратимся к более футуристическому применению мониторинга сенсорных входных сигналов, и для этого обратимся к превосходному выступлению Джека Галланта на TED 2017 года по этой теме. Идея этой демонстрации состоит в том, что, как только мы составим карту паттернов возбуждения мозга человека в ответ на стимулы, используя какое-либо устройство для измерения возбуждения нейронов (которое может быть, например, фМРТ или какое-то будущее высокоточное устройство ЭЭГ), мы можем затем интерпретировать и расшифровать то, что этот мозг впоследствии испытывает, на основе измерений нейронной активности в реальном времени в ответ на некоторые неизвестные стимулы. Здесь мы видим демонстрацию, датируемую еще 2011 годом, в которой взгляд человека на какой-то фильм воссоздается на основе нейронных измерений, при этом изображения слева представляют собой видеокадры, изображающие слона в паре с соответствующим изображением ниже, отфильтрованным, чтобы только показать, что края изображения, а изображения справа - это декодированная нейронная активность, пытающаяся воссоздать зрение субъекта. Очевидно, что точность воспроизведения этих демонстраций оставляет желать лучшего, но подумайте, как далеко продвинулась компьютерная графика в детских фильмах, например, после выпуска Pixar 1995 года История игрушек.

Я выделю еще один пример из превосходного выступления Джека Галланта на TED, поскольку я думаю, он дополнительно иллюстрирует, какие возможности будут реализованы в этой сфере. В этом примере изображение справа - это видео, просматриваемое субъектом, мозг которого был ранее нанесен на карту, а ключевые слова, появляющиеся слева, декодируются из нейронной активности. Обратите внимание на то, как эта демонстрация (более поздняя, ​​выпущенная в 2016 году) не только точно описывает особенности фильма, но также делает это с текстовыми весами, чтобы продемонстрировать преобладание функции на изображении в сочетании с соответствующей пространственной конфигурацией. Я предполагаю, что в этом декодировании используется мониторинг большего количества областей мозга, чем в предыдущем примере, который, возможно, специально отслеживал те особенности меньшей сложности, захваченные зрительной корой, в то время как это представление объединяет это пространственное представление с экстра-визуальной нейронной активностью для высокоразмерная категоризация функций (хотя другое объяснение может заключаться в том, что в период с 2011 по 2016 год точность декодированных изображений из зрительной коры головного мозга резко возросла, что позволило использовать более традиционный классификатор изображений, основанный на машинном обучении).

Возвращаясь к контексту эпизода с Аркангелом, ключевой вывод здесь должен заключаться в том, что даже сегодня (хотя и со сложным механизмом для того типа верности, который демонстрируется здесь) возможно осуществлять внешний мониторинг сенсорных восприятий на основе измерений активности мозга.

Теперь, когда мы расшифровали сенсорное восприятие нашего объекта, классификация характеристик по содержанию стала намного проще с использованием современных технологий. Могут быть развернуты классификаторы нейронных сетей, которые с учетом некоторых входных данных, таких как изображения, аудио или текстовые выходные данные, содержат определенные категории, основанные на тех, которые получены в результате контролируемой операции обучения для алгоритма. Под контролируемым обучением я подразумеваю, что наш классификатор необходимо будет подготовить путем разработки потенциально большого набора выборочных входных данных, помеченных в соответствии с теми категориями, которые мы хотим классифицировать - например, если мы хотим классифицировать в соответствии с темами для взрослых, одним из решений могло бы быть следующее: обучить классификатор изображений с соответствующим образом маркированными видеокадрами из коллекции Netflix фильмов с рейтингом PG и R. Посредством алгоритмического «обучения» с использованием этих демонстраций наша нейронная сеть узнает, какие типы функций изображения более распространены в материалах, подходящих для детей, а также распознает те более взрослые темы, которые встречаются только в сценах с рейтингом R. Ограничением этого подхода является то, что наша нейронная сеть будет обобщать только те типы функций, которые присутствуют в обучающем материале. Оценки здравого смысла не будет. Учитывая, например, картину какого-нибудь мастера эпохи Возрождения с изображением обнаженной натуры, вполне вероятно, что наш классификатор сочтет это неприемлемым для детей, хотя здравый смысл подсказывает нам, что это высокое искусство и уместно как часть образования любого подростка, точно так же безобидные шутки между сверстниками о метеоризме , сиськи или другие острые темы могут быть полезной частью образования подростка, даже если этот гипотетический классификатор, вероятно, не найдет в учебном наборе, полученном из фильма PG. Я закрою этот слайд, отметив, что наши классификации не обязательно ограничиваются бинарной подходящей / несоответствующей маркировкой, в зависимости от того, насколько далеко мы продвинулись в подготовке обучающих данных, диапазон функций, которые может проверить наш классификатор, может быть значительным.

Итак, мы продемонстрировали сенсорный мониторинг и классифицировали эти данные на основе контента для взрослых. Последним элементом воссоздания возможностей истории будет наложение сгенерированных функций, чтобы скрыть или иным образом трансформировать то, что испытывает наш субъект. Возможность передачи или наложения сенсорной информации непосредственно в мозг - самый фантастический элемент этого вымышленного шоу. Однако, если бы мы позволили нашему субъекту ощущать свои сенсорные входы через внешний канал, такой как аудио / визуальная установка виртуальной реальности, было бы вполне возможно выполнять манипуляции такого типа, показанные в эпизоде, с использованием современных технологий.

Следует учитывать важное различие в возможностях этого типа для этих категорий виртуальной реальности и дополненной реальности. Гарнитура виртуальной реальности полностью скрывает внешнее зрение, заменяя ее дисплеями для близорукости, что может быть реализовано, например, путем установки экрана смартфона с высоким разрешением. Часть уловки, чтобы сделать этот опыт виртуальной реальности захватывающим, заключается в использовании преимуществ датчиков, таких как акселерометр в смартфоне, для отслеживания положения головы, что позволяет соотносить ориентацию трехмерного и 360-градусного видео или игрового движка с физическими движениями. Обратите внимание, что в различных магазинах приложений уже доступно несколько приложений, которые предлагают эти возможности иммерсивного видео с единственным аппаратным аксессуаром, который потенциально требует дешевой гарнитуры для крепления на смартфон, хотя для более интенсивных задач, таких как видеоигры, может потребоваться специальное оборудование. Я предполагаю, что вполне возможно, что наборы микросхем сотовых телефонов и возможности обработки графики в конечном итоге догонят то, что в настоящее время присутствует на рынке сред виртуальной реальности для игровых консолей.

Возможности виртуальной реальности расширены в приложении дополненной реальности. Определяющей особенностью оборудования дополненной реальности является смешивание визуального ввода между реальным окружением с интерактивным наложением трехмерного видео. Для преднамеренного смешивания этих двух сред, реального и виртуального, требуется, чтобы набор дополненной реальности разработал трехмерную модель окружающей среды в реальном времени. Многие автомобили с автоматическим управлением развивают эту возможность для трехмерного моделирования окружающей среды с помощью лазерного датчика, похожего на радар, который называется лидаром, хотя я ожидаю, что с современной технологией машинного обучения станет все более возможным выводить трехмерные модели с использованием ввода с видеокамеры. В сочетании с современными инструментами машинного обучения для интерпретации изображений установка дополненной реальности может выборочно накладывать графику, адаптированную к конкретному содержанию окружающей среды. Приложения могут включать в себя благонамеренную, но ошибочную защитную цензуру, изображенную в этом эпизоде, погружающие игры или потенциально другие важные варианты использования, такие как накладки на лобовое стекло автомобиля для обеспечения безопасного вождения или улучшения для промышленных / медицинских специалистов.

Я сам не особо люблю видеоигры, поэтому для иллюстрации приложений дополненной реальности обращусь к информативному и временами трогательному выступлению на TED, представленном Брайаном Малленсом на эту тему. Здесь Брайан демонстрирует пример промышленного усовершенствования для таких целей, как ремонт или установка. Это расширение может сэкономить деньги несколькими способами, такими как снижение требований к обучению технических специалистов, повышение эффективности рабочего процесса, а также содействие созданию более безопасной рабочей среды за счет прямого наблюдения за процедурами безопасности, такими как блокировка / маркировка или другие меры предосторожности. Я могу представить себе сценарий, в котором технический специалист с минимальным уровнем навыков входит в новую рабочую среду и становится продуктивным с первого дня.

Mullens также предлагает вариант использования еще более интенсивной категории специализации - медицинские или хирургические процедуры. Здесь важна безопасность не специалиста, а пациента, которому проводится процедура. Малленс отмечает, что это даже не обязательно должны быть те самые сложные процедуры, которые рассматриваются здесь, но, учитывая нехватку врачей, необходимых для потенциально спасающих жизнь процедур в значительной части развивающегося мира, этот тип расширенных реальность может спасти миллионы жизней, оказав помощь нуждающимся в медицинской помощи.

Я закончу этой цитатой, потому что я думаю, что она говорит об идее вычислений, охватывающей эту и многие другие парадигмы. Видение Стива Джобса компьютера касалось не только клавиатуры, мышей и мониторов, но и расширения горизонтов для человечества.

* Для дальнейшего чтения ознакомьтесь с моими Оглавлением, Рекомендациями по книгам и Музыкальными рекомендациями.

Книги, на которые здесь ссылались или иным образом послужили вдохновением для написания этого поста:

Евангелие от Тони Сопрано «» - Крис Си

Стив Джобс - Уолтер Айзексон

(Как партнер Amazon я зарабатываю на соответствующих покупках.)

Альбомы, на которые здесь ссылались или иным образом послужили вдохновением для написания этого поста:

Вторник, четверг и суббота - Джимми Баффетт.

(Как партнер Amazon я зарабатываю на соответствующих покупках.)

Привет, я блогер-любитель, пишу для удовольствия. Если вам понравился этот пост или вы получили от него какую-то ценность, не стесняйтесь ставить лайк, комментировать или делиться. Со мной также можно связаться по linkedin для профессиональных вопросов или twitter для личных.

Для дальнейшего чтения, пожалуйста, ознакомьтесь с моими Оглавлением, Рекомендациями по книгам и Музыкальными рекомендациями.