Мнение

Наука о данных против глубокого обучения

Вот разница

Оглавление

  1. Вступление
  2. Наука о данных
  3. Глубокое обучение
  4. Резюме
  5. использованная литература

Вступление

Если сравнивать науку о данных и глубокое обучение, результаты удивительны. В большинстве появляющихся статей наука о данных сравнивается с машинным обучением, что, конечно, полезно, но не так актуально, как прямое сравнение с глубоким обучением. С учетом сказанного, цель данной статьи - напрямую сравнить эти две популярные области исследований. Несмотря на то, что есть сравнения, я хотел дать свое профессиональное сравнение, основанное на моем опыте - отсюда и ярлык мнение этой статьи. Продолжайте читать ниже, если хотите узнать, почему эти два поля разные и в чем их сходство.

Наука о данных

Начнем с того, что наука о данных невероятно универсальна, и это, пожалуй, самое большое различие между ней и глубоким обучением. Еще один способ подумать об этом сравнении: глубокое обучение на самом деле является частью науки о данных. Итак, что же такое остальная наука о данных? Основная концепция науки о данных - принимать обоснованные решения на основе данных. Однако я считаю, что общее определение нуждается в уточнении.

Если бы я суммировал науку о данных в одной фразе или новом определении с более подробной спецификацией, это было бы следующее (конечно, это определение не полностью применимо к каждому случаю / работе, но из моего личного опыта):

  • Специалист по данным - это профессионал, ориентированный на бизнес, который раскрывает проблему, которую можно решить с помощью набора данных, обучая прошлые данные в алгоритме для автоматического прогнозирования будущей цели.

Я бы сказал, что большинство определений слишком похоже на определение аналитика данных или бизнес-аналитика. У них действительно много общих навыков и целей, однако наука о данных обычно требует программирования на таких языках, как R или Python, а также использования алгоритмов. Но есть одна важная часть этого определения - алгоритмы. В этой части определения вступает в действие глубокое обучение, это часть науки о данных, а точнее, часть машинного обучения.

Чтобы лучше понять, что аналитик данных делает на повседневной или проектной основе, вот краткое изложение ожидаемых шагов:

  1. Понять бизнес: чем он занимается, каковы его проблемы, какие данные у него есть, кто его клиенты.
  2. Анализируйте данные или поработайте с заинтересованным лицом бизнеса, например, с менеджером по продукту, чтобы увидеть, какие конкретные проблемы есть, которые в конечном итоге могут быть решены с помощью науки о данных.
  3. Определите цели проекта, например, улучшение общих KPI (Ключевые показатели эффективности).
  4. Создайте набор данных из одного или нескольких источников
  5. Определите функции, которые вы хотите протестировать и включить в свою модель науки о данных
  6. Поймите и определите, нужен ли вам алгоритм регрессии или алгоритм классификации и т. Д., Прогнозируете ли вы непрерывную цель или целевую цель / категорию с группировкой?
  7. Завершите окончательную модель, поделившись результатами и в конечном итоге автоматически развернув в бизнесе

Как видите, специалист по данным ведет путь к решению проблемы, используя алгоритм (s), который использует данные. В большинстве случаев специалисты по обработке данных также пытаются автоматизировать то, что заранее выполнялось вручную.

Глубокое обучение

Теперь, когда мы ознакомились с тем, что делает специалист по данным и что обычно такое наука о данных, с примерами, давайте рассмотрим, что такое глубокое обучение. Глубокое обучение - это аспект науки о данных, также относящийся к аспектам алгоритмов машинного обучения (я говорю алгоритмы, потому что я думаю, что многие рабочие места, отмеченные, например, как инженеры машинного обучения, на самом деле являются разработчиками программного обеспечения, которые помогают развернуть алгоритм - как в операциях, связанных с алгоритмом и окончательной моделью). Что делает глубокое обучение уникальным, так это его реализация слоев в искусственных нейронных сетях. Когда вы работаете с большими данными с задействованными графическими процессорами, вы склонны выбирать конкретный алгоритм глубокого обучения, поскольку многие модели науки о данных могут неожиданно воспользоваться преимуществами использования только традиционных алгоритмов машинного обучения.

В то время как традиционные алгоритмы машинного обучения включают деревья решений, случайный лес, XGBoost и т. Д., Глубокое обучение является более конкретным и включает такие алгоритмы, как:

  • Сверточные нейронные сети (CNN)
  • Рекуррентные нейронные сети (RNN)
  • Сети долгосрочной краткосрочной памяти (LSTM)

Итак, по сравнению с специалистом по обработке данных, инженер глубокого обучения может быть тем же самым. В большинстве случаев роль в области науки о данных может включать в себя особые требования к глубокому обучению, поэтому повседневный процесс очень похож на работу специалиста по данным. Основное отличие заключается в используемых уникальных алгоритмах глубокого обучения и, возможно, в большем внимании к стоимости и эффективности, поскольку эти алгоритмы могут быть более сложными и дорогостоящими.

Резюме

Когда мы сравнили эти две популярные области и профессии, я надеюсь, что вы лучше понимаете, что делает их похожими и что отличает их друг от друга. Еще многое предстоит сказать об используемых инструментах и ​​знаниях, необходимых для этих областей, но в целом они являются просто частью друг друга. Вы можете быть специалистом по данным, занимающимся глубоким обучением, или инженером-специалистом по глубокому обучению.

Подводя итог, вот ключевой вывод из этой статьи:

* You can be a data scientist who performs deep learning
* Or, you can be a deep learning engineer specialist

Надеюсь, моя статья была вам интересна и полезна. Пожалуйста, не стесняйтесь комментировать ниже, если вы согласны или не согласны с моим объяснением этих двух популярных областей. Почему или почему нет? Конечно, их можно прояснить еще больше, но я надеюсь, что мне удалось пролить некоторый свет на основные различия и распространенные ошибки при их интерпретации, особенно в отношении названий должностей. Спасибо за чтение!

Не стесняйтесь проверить мой профиль Мэтт Пшибила и другие статьи, а также написать мне в LinkedIn.

использованная литература

[1] Фото bruce mars на Unsplash, (2018)

[2] Фото bruce mars на Unsplash, (2019)

[3] Фото Fakurian Design на Unsplash, (2021 г.)