Ну, если вы думаете, что этот пост будет скучной историей о технических концепциях и других темах с теми, которые вы обычно слышали, и они заставляют вас спать, я попытаюсь сделать это немного иначе, и после того, как вы его прочтете, вы поймете, почему эта тема оказывает огромное влияние на деятельность Data Scientist.

Хорошо, давайте Рок! ! !

Прежде всего… Что такое управление данными?

Управление данными имеет много значений, я сдержу свое слово и определю его в нескольких словах:

"Набор передовых методов работы с данными, позволяющих добиваться качественных результатов"

Что ж, теперь вы знаете мое собственное определение и можете легко его получить, а также основную информацию об экосистеме от каждой компании, юридического лица, бизнеса и т. д.

Управление данными — это проект?

Извините, но это не проект, приятель… Управление данными — это функция, которую вам нужно добавить почти во все ваши действия. В двух словах, независимо от того, разрабатываете ли вы модель машинного обучения или Data Engine, у вас будет результат, и это преобразование, которое вам нужно, чтобы объяснить, почему сертифицированный результат.

Сколько в нем компонентов?

Согласно предыдущему объяснению, мы затронули 2 важных компонента управления данными:

  1. Когда вы создаете модель или механизм обработки данных, вы создаете новые объекты, которые будут жить в вашей экосистеме данных, и это делает вас владельцем или хранителем данных (в управлении данными эта роль наиболее актуальна). потому что это помогает идентифицировать детальные определения — сущности —). Кроме того, когда вы запускаете свою модель в производство, вам необходимо предоставить документацию о ваших входных и выходных переменных… Как видите, теперь вы выравниваетесь с первым шагом «Содержимое данных»
  2. С другой стороны, когда вы можете объяснить другим, как это может быть полезно для компании, вы можете доказать, как правильно получить эту ценность. Дорогой друг, теперь вы знаете, что такое "Качество данных".

В соответствии с предыдущими компонентами, мы можем отметить два последних:

3.- На этапе разработки вам необходимо сопоставить лучшие источники данных, соответствующие потребностям модели, и для выполнения этой части вам необходимо включить сопоставление в свою документацию, где вы можете объяснить, где находится дорожная карта от ваших данных до прибытия к результат (от начала до конца)… И именно так мы получаем нашу «Происхождение данных»

4.- И последнее, но не менее важное… «Доступность данных». На этом этапе нет необходимости подробно объяснять это, потому что основная цель — демократизировать ваши сущности для тех, кто должен использовать его в вашей организации.

Ну что теперь?

Отлично, насколько теперь мы знаем, какие основные компоненты программы управления данными (да, это программа, которая помогает улучшить активы компании, потому что данные — это новая нефть в 21 веке).

Более того, мы можем использовать его основную цель, описанную выше, но для того, чтобы сделать этот вывод более удобоваримым, я хотел бы обратить внимание на его важность в нашей экосистеме данных. Почему? Это просто, например, вы можете создать лучшую модель с лучшими алгоритмами предсказания желаемой цели… но позвольте мне сказать, что все ваши источники данных имеют худшее качество, и никто не знает, как они были построены или где вы можете найти лучшие объект для расчета вашего прогноза. Как вы думаете, что может быть вашим выходом? (Ну ты знаешь ответ, приятель).

В заключении…

  • В наши дни нам необходимо создать новое мышление в отношении культуры данных о том, как управление данными может помочь нам, и о влиянии, которое оно оказывает на любую организацию (частную или государственную).
  • Как Data Scientist вы знаете, насколько важно иметь хорошее качество данных для ваших моделей, и по этой причине создайте осведомленность и примите участие в стратегии данных вашего бизнеса.

В заключение я хотел бы узнать, что вы думаете об этой важной теме, которая, возможно, во многих организациях довольно актуальна, но в других совсем нет… в данный момент.

Спасибо за уделенное время и до скорой встречи, приятель!!! :)