В Часть 1 мы рассмотрели, как искусственный интеллект (ИИ) использует архитектуру Transformer, неконтролируемое и контролируемое обучение для обучения. Мы также рассмотрели основные наборы данных, которые ИИ, такие как ChatGPT, используют для обучения.

Во второй части мы исследуем «глубокое обучение», которое имеет решающее значение для создания ИИ, такого как ChatGPT. Глубокое обучение основано на концепции искусственных нейронных сетей, моделирующих структуру и функции человеческого мозга.

Что такое глубокое обучение?

Глубокое обучение — это тип компьютерной программы, которая может научиться делать что-то самостоятельно.

В некотором отношении это похоже на то, как мы учимся в детстве. Когда мои сыновья были маленькими, мы шли по улице, и я указывал на вещи и рассказывал им, что это такое. «Это дерево». Если бы мой сын назвал фонарный столб деревом, я бы его поправил и объяснил, что фонарный столб отличается от дерева.

Глубокое обучение для ИИ делает это в массовом масштабе. Например, если вы хотите научить ИИ распознавать собак, вы можете показать программе множество изображений собак и сказать: «Это собаки». Затем вы показывали программе множество изображений предметов, не являющихся собаками, и говорили ей: «Это не собаки». Согласно ChatGPT, для достижения высокой точности прогнозов обычно необходимы десятки тысяч изображений.

Программа будет использовать эту информацию для поиска закономерностей на изображениях собак, таких как их характерные морды, шерсть, лапы, уши и усы. Он также узнает, что не является собакой, например, кошки, деревья или фонарные столбы. Затем, когда вы показываете программе новую картинку, она может решить, собака ли это, основываясь на том, что она узнала из всех показанных вами примеров. Глубокое обучение на самом деле не «смотрит» на картинки, как это делают люди. Вместо этого программа обрабатывает необработанные данные изображения математически, чтобы определить особенности, важные для распознавания собак.

Нейронные сети

Человеческий мозг состоит из миллиардов нейронов, соединенных синапсами. Эти связи позволяют передавать информацию между нейронами, и сила этих связей может быть изменена опытом и обучением.

По сути, именно так ИИ «учится». Программа ИИ обрабатывает огромные объемы данных через несколько слоев искусственных нейронов, которые связаны весами, которые можно регулировать для повышения точности прогнозов ИИ.

У компьютера нет биологических нейронов, подобных тем, что есть в человеческом мозгу. Вместо этого искусственные нейроны используются в моделях глубокого обучения для имитации поведения биологических нейронов.

Искусственный нейрон называется перцептроном. Персептрон — это математическая модель, вдохновленная тем, как работают нейроны в нашем мозгу. Программа ИИ создает несколько слоев взаимосвязанных персептронов, которые принимают входные данные (например, изображения собак), решают, какие факторы являются важными (морда, шерсть и т. д.), и дают ответ.

Когда персептрон обучается, он сначала делает случайные предположения. Но каждый раз, когда он делает ошибку и получает правильный ответ, он корректирует свои «веса» (которые определяют, насколько сильно он взвешивает каждый ввод), чтобы в следующий раз быть более точным.

Сравнение ИИ с человеческим обучением

Очевидно, что люди и машины учатся по-разному, но в своем путешествии, чтобы узнать больше о том, как работает ИИ, мне было полезно понять их сходство. Как и машины, люди полагаются на данные и опыт, чтобы учиться и принимать решения.

Неконтролируемое обучение на машинах больше похоже на то, как люди учатся на собственном опыте. Когда мы сталкиваемся с новой ситуацией, мы пытаемся разобраться в ней, основываясь на нашем прошлом опыте и знаниях. Точно так же алгоритмы неконтролируемого обучения пытаются найти закономерности в данных независимо, без указания, что искать.

Контролируемое обучение на машинах похоже на то, как люди учатся у учителей. Например, мы учим ребенка узнавать животных, показывая ему изображения разных животных и рассказывая ему, как называется каждое животное. Точно так же алгоритм машинного обучения можно обучить тому, как распознавать различные объекты или шаблоны.

Нейронные сети в машинах вдохновлены человеческим мозгом. Точно так же, как в нашем мозгу есть взаимосвязанные нейроны, которые обрабатывают информацию, в нейронных сетях есть взаимосвязанные персептроны, обрабатывающие данные. И точно так же, как наш мозг формируется нашим опытом, нейронные сети формируются данными, на которых они обучаются.

Я всегда нахожу полезным иметь общее представление о том, как работает конкретная технология, чтобы демистифицировать ее. Я надеюсь, что это исследовательское путешествие помогло вам демистифицировать искусственный интеллект.