Итак, новая версия AlphaGo, нулевая, обыграла старую версию, обыгравшую лучшего игрока мира. Хо Гум.

https://medium.com/mit-technology-review/alphago-zero-shows-machines-can-become-superhuman-without-any-help-26902647265e

Да, в нем использовалась немного другая версия, которая играла сама себя миллионы раз, имея лишь несколько правил игры в го и нейронную сеть с обучением с подкреплением. Она стала лучше быстрее, чем когда она играла с хорошими игроками-людьми. Так почему же это не должно нас удивлять? Потому что мы действительно изучили основной принцип работы человеческого разума и только начинаем его использовать, а впереди нас ждет экспоненциальный рост. Я научился го, изучая правила и играя сам, но у меня не очень хорошо получалось; хотя именно так я научился шахматам, где я был первым человеком в моем школьном шахматном клубе, который обыграл нашего учителя. Alphagozero просто сделал это лучше, потому что он был намного быстрее. Не уверен, что это приводит к изучению жизни, но и здесь может быть способ машинного обучения.

Вот личный взгляд на историю, которая привела нас сюда. На мой взгляд, это началось почти сто лет назад, когда Карл Лэшли научил животных трюку, а затем провел операцию по удалению частей их мозга. Он решил, что не столько важно, какие части мозга, сколько сколько. Все части казались одинаково важными для памяти, распределенной памяти. Следующий большой шаг был сделан Дональдом О. Хеббом, который прозорливо предположил, что когда нейроны возбуждаются вместе, они соединяются вместе. Вслед за Дэвидом Хьюмом он понял, что мозг — это один обширный коррелятор, который коррелирует все, например, форму вашего носа с углом наклона капота автомобиля, довольно произвольно, но жадно, и выводит сходство и метафору из результатов. На микроуровне это поразительное открытие было подтверждено действиями синапсов, каждый из которых включает десятки тысяч соединений, чтобы определить их смежность и усилить эти соединения в течение короткого промежутка времени друг друга. На макроуровне Иван Павлов давно показал, что звонок, предшествовавший поступлению пищи менее чем за несколько секунд (по порядку синаптических отношений, обнаруженных позже), вызывает слюноотделение (своего рода обучение с подкреплением). Этот базовый акт свертки, как мы теперь знаем, работает и с компьютерами.

Итак, вот оно: разум оперирует смежностью, корреляцией, сверткой и подкреплением. Естественно, такая сложная история имеет много других нитей, включая Гальтона и корреляцию; Эккарт и Янг для разложения по сингулярным числам (с использованием корреляции для факторного анализа); и современная история нейронных сетей. И бит продолжается. Но промежуточный вывод очевиден: мы понимаем, как работает разум, и это приводит к экспоненциальным улучшениям.

Мы также понимаем, насколько похожи все разумы, от низших планарий до человекообразных обезьян, включая нас. Наш разум очень мало отличается от разума человекообразных обезьян, за исключением небольшого размера; мы всего лишь на шаг впереди них. Вероятно, человекоподобных обезьян было бы гораздо больше, но мы либо слились с ними, либо этнически очистили их, когда вступили с ними в конкуренцию, как неандертальцы. В результате мы очень гомогенны как вид: у всех людей около 99,5% одних и тех же генов, лишь немного отличающихся от генов человекообразных обезьян. Так что в каком-то смысле мы находимся на первой ступеньке лестницы символического мышления. Неудивительно, что как только мы смогли уловить основной принцип мышления и реализовать его на компьютерах, мы смогли продвинуться вперед.

Эволюция редко совершает скачкообразные скачки вперед, хотя иногда она делает поистине впечатляющие скачки вперед. Тем не менее, мы не можем ожидать каких-либо кардинальных биологических изменений в нашем интеллекте только в результате эволюции в течение нашей жизни. Тем не менее, увеличив наш интеллект с помощью ИИ, может произойти нечто столь же драматичное. Куда заведет нас этот расцвет и бум интеллекта, особенно сложно представить, но золотой век роботов и искусственного интеллекта, заменяющих ручной и интеллектуальный труд, определенно находится в пределах нашей досягаемости.