И почему так много науки о данных и искусственного интеллекта вращается вокруг нейронных сетей?

Глубокое обучение повсюду.

Но мало кто может объяснить, что это такое. Чем глубокое обучение отличается от машинного обучения? Или почему нейронные сети стали олицетворением искусственного интеллекта, хотя у нас было так много разных архитектур. Какова математическая причина, по которой исследователи ИИ масштабируют нейронные сети, а не логистическую регрессию?

Сегодня мы расскажем об этом. Даже если вы не занимаетесь машинным обучением, это поможет вам понять предысторию одной из самых важных областей в нашем обществе.

Важные детали

  1. Что такое машинное обучение. Для тех из вас, кто абсолютно ничего не знает об этой области, вот объяснение ELI5. В машинном обучении мы передаем в модель много данных, и она пытается выявить закономерности. . Подача данных называется «обучением». В более математическом смысле, во время обучения нашей модели наша модель пытается найти функцию, соответствующую предоставленным ей данным.
  2. Что такое глубокое обучение.Глубокое обучение — это часть машинного обучения. В нем мы используем нейронные сети (которые в основном представляют собой взвешенные графы) с большим количеством слоев. Однако есть одна загвоздка. Простые нейронные сети (даже очень большие) по-прежнему производят линейные функции. Это верно для большинства методов машинного обучения. Однако оказывается, что введение нелинейности меняет правила игры.
  3. Подождите... Что такое линейность? Как график может быть линейным? Здесь я использую математическое определение линейной функции. Проще говоря, функция является линейной, если она удовлетворяет двум условиям:

Линейность достаточно важна как концепция, поэтому в понедельник я сделаю ей отдельный пост. Вы увидите, что эта концепция будет часто встречаться во всех областях статистики и инженерии.

4. Какое отношение это имеет к Deep Networks?Оказывается, мы можем аппроксимировать любую непрерывную функцию, взяв комбинацию нелинейных функций . Я подчеркиваю непрерывность, потому что многие люди неправильно понимают эту теорему, предполагая, что вы можете аппроксимировать любую функцию. На это ошибочное предположение было потрачено много времени, энергии и денег венчурного капитала. Очень большие глубокие сети работают, потому что они могут попробовать множество нелинейных функций и всевозможных их комбинаций.

5. Почему все используют глубокое обучение. Причина, по которой мы видим их повсюду, заключается в том, что людей привлекают новые блестящие объекты. А мы ленивы. Если у меня есть задача анализа данных, я могу использовать Deep Learning, чтобы получить какой-то результат, поэтому люди часто прибегают к ним, не задумываясь. И поскольку в наши дни это модно, нет вопросов о том, имеет ли смысл глубокое обучение. Весь смысл моего контента по машинному обучению заключается в том, чтобы подчеркнуть, что вы можете сделать множество вещей для улучшения анализа данных, которые не требуют дополнительных обучающих данных, больших глубинных сетей и дополнительного обучения.

Это должно быть достаточно хорошим обзором того, почему глубокое обучение, похоже, в наши дни захватило большую часть ИИ. Если вы принимаете решения, то знание этого имеет решающее значение для понимания этой новой области. И если вы разработчик (особенно если вы занимаетесь анализом данных), то понимание универсального приближения имеет решающее значение для понимания того, почему вы повсюду видите нейронные сети.

Для прекрасной визуализации этой концепции (приближение универсальной функции) посмотрите следующее видео. Как создатель, я знаю, как трудно говорить об идеях глубокого обучения более высокого уровня, не вдаваясь в сорняки. Emergent Garden блестяще справляется с этой иглой. Я никоим образом не связан с его каналом, я просто думаю, что он делает исключительный контент. Если вы увлекаетесь искусственным интеллектом более высокого уровня, добавьте его канал в свой список.

Чтобы узнать больше о подобных статьях, ознакомьтесь с моим информационным бюллетенем Простые технологии. Tech Made Simple — лучший ресурс для людей, которые хотят построить блестящую карьеру в сфере технологий. Это поможет вам концептуализировать, создавать и оптимизировать ваши решения. Он охватывает все: от технических аспектов от проектирования систем, концепций информатики и решения проблем Leetcode до подробных руководств по работе в сети и построению вашей карьеры. Сэкономьте свое время, усилия и деньги, найдя все необходимое в одном месте. Используйте ссылку здесь, чтобы получить скидку 20 % на срок до целого года.

Я создал Упрощенную технологию, используя новые методы, полученные в результате обучения нескольких людей в ведущих технологических компаниях. Информационный бюллетень предназначен для того, чтобы помочь вам добиться успеха, избавив вас от часов, потраченных впустую на работу с Leetcode. У меня есть политика 100% удовлетворенности, поэтому вы можете попробовать ее без риска для себя. Вы можете прочитать FAQ и узнать больше здесь

Не стесняйтесь обращаться, если у вас есть какие-либо интересные работы/проекты/идеи для меня. Всегда рад вас выслушать.

Свяжитесь со мной

Воспользуйтесь ссылками ниже, чтобы ознакомиться с другим моим контентом, узнать больше о репетиторстве или просто поздороваться. Кроме того, ознакомьтесь с бесплатной реферальной ссылкой Robinhood. Мы оба получаем свободный сток (денег вкладывать не надо), и никакого риска для вас нет. Таким образом, если вы не используете его, вы просто потеряете бесплатные деньги.

Чтобы помочь мне понять вас, заполните этот опрос (анонимно)

Ознакомьтесь с другими моими статьями на Medium. : https://rb.gy/zn1aiu

Мой Ютуб: https://rb.gy/88iwdd

Свяжитесь со мной в LinkedIn. Подключаемся: https://rb.gy/m5ok2y

Мой Инстаграм: https://rb.gy/gmvuy9

Мой Твиттер: https://twitter.com/Machine01776819

Если вы хотите построить карьеру в сфере технологий: https://codinginterviewsmadesimple.substack.com/

Получите бесплатный сток на Robinhood: https://join.robinhood.com/fnud75