Привет, я думаю, вы уже слышали об анализе данных.

Процесс, в котором мы извлекаем из набора данных какую-то полезную модель, чтобы использовать эту информацию для нашей будущей бизнес-стратегии и развивать бизнес.

Но что такое данные?

Данные могут быть чем угодно, что дает любую информацию о чем угодно.

Теперь в этой статье я собираюсь рассказать историю данных, связанных только с аналитикой данных и наукой о данных. Так что логично, 😁

Теперь мы слышали, что данные — это новое топливо для любой организации, позволяющее расти и конкурировать на рынке.

Так почему же?

Предположим, что Вы являетесь владельцем компании, которая существует последние 10 лет. Теперь вы хотите, чтобы ваш бизнес приносил больше прибыли, потому что последней целью любой организации является получение денег.

так что здесь данные могут принести вам деньги, если вы правильно их понимаете.

допустим, вы собрали данные обо всех ваших прошлых клиентах и ​​теперь хотите настроить таргетинг на этих клиентов. так что здесь вы можете проанализировать, какой продукт они покупали у вас в прошлом, и какая категория им нравится больше всего,

Таким образом, вы можете поддерживать свой инвентарь, а также вы можете разработать правильную маркетинговую стратегию, ориентированную на этих клиентов.

Теперь, как вы можете подумать, что самое главное здесь - это данные.

Итак, чтобы получить шаблоны из данных, вам сначала нужно понять данные. Так ……………….

Основные типы данных, которые должен знать любой энтузиаст данных

Основные две категории .1. Числовая 2. Категориальная

Числовые данные

Этот тип данных содержит только числа в своей категории. 1,1 2 3 6 4 8 2,2365 3 5 6 9 8 74

Эти числовые данные далее делятся на две категории.

1. Целочисленные данные 2. Продолжение данных

Целые данные: содержат только целое число, например 1 2 3 6 5 4 7 8 9 999 222 333 66 55 66 99 88 774

Пример: если в вашем наборе данных есть столбец Like no of kids, то это будет 2, 3 или 5. это не будет 2.3 или 5.5

Непрерывные данные:содержит десятичную точку данных, например 2,3 6,6 5,5 8,9 3,3 4,5

Пример: Столбцы с данными температуры, 23,3 36,6 45,5 47,2 C

Категорические данные

Категориальные данные — это любые данные, которые не являются числовыми, например, мужчина, женщина, хорошо, плохо, очень хорошо и т. д.

Он также имеет две категории. 1. Порядковый 2. Номинальный

Порядковые данные. Любые категориальные данные, которые могут быть оценены, являются порядковыми данными.

Пример: Тест еды: хороший, обычный, худший, замечательный, поэтому здесь мы можем дать рейтинг: хороший: 4, худший: 1, замечательный: 5, обычный: 3.

Номинальные данные. Любые категориальные данные, которые не могут быть оценены, являются номинальными данными.

Пример: Пол Данные: Мужской и женский, Здесь нельзя ставить рейтинг.

Но помните, что существуют некоторые исключения для типов данных.

Допустим, у вас есть столбец ZipCode в вашем наборе данных. На первый взгляд можно сказать, что это числовые данные. а тут нет. это категориальные данные номинального типа.

Поэтому убедитесь, прежде чем классифицировать данные, потому что это оказывает большое влияние, когда вы выполняете предварительную обработку данных для обучения модели машинного обучения.

Надеюсь, вы найдете эту статью полезной.

Спасибо