Впервые я познакомился с нормализацией данных на моей нынешней работе, когда ИТ-директор поставил передо мной задачу создать лист Excel со всеми отелями в разных городах. Он просто объяснил, что для того, чтобы компьютер мог обрабатывать данные, они должны быть в двумерном формате.

На этой неделе я еще раз пересмотрю эту идею. Оказывается, есть четыре причины, по которым важна нормализация данных.

  1. Во избежание избыточности
  2. Для достижения целостности данных
  3. Чтобы поместить данные в правильные таблицы
  4. ВО избежание аномалий CUD

Я узнал, что есть 3 уровня нормализации данных.

1-й уровень

  • Устранение повторяющихся групп в отдельных таблицах
  • Создайте отдельную таблицу для каждого набора связанных данных
  • Определите каждый набор связанных данных с помощью первичного ключа

2-й уровень

  • Должен следовать всем правилам NF с 1-го уровня
  • Все неключевые столбцы должны зависеть от основного

3-й уровень

  • Все 2-я нормальная форма
  • Все неключевые столбцы не должны транзитивно зависеть от первичного ключа.

Если мы будем следовать правилам нормализации данных, мы сможем создать базу данных, которую нашему компьютеру будет легче обрабатывать и в то же время легко редактировать нам.

Нормализация данных упростит установление связей has_many, own_to с нашими таблицами.