Нормализация базы данных

Нормализация таблиц базы данных — первый ход на пути проектирования структуры реляционной базы данных. Строго говоря, само собой разумеется, не самый первый — сперва нужно сделать вывод, что же мы по большому счету будем хранить в базе, другими словами определиться со структурой полей, их размерностью и типами, смыслом хранимой в них информации.

Теория нормализации реляционных баз данных была создана в конце 70-х годов 20 века. В соответствии с ей, выделяются шесть обычных форм, пять из которых так и именуются: первая, вторая, третья, четвертая, пятая обычная форма, и обычная форма Бойса-Кодда, лежащая между третьей и четвертой.

База данных считается нормализованной, в случае если ее таблицы (по крайней мере, большая часть таблиц) представлены как минимум в третьей обычной форме. Довольно часто многие таблицы нормализуются до четвертой обычной формы, время от времени, напротив, производится денормализация.

Основная цель нормализации базы данных — дублирования информации и устранение избыточности. В совершенстве при нормализации нужно добиться, дабы любое значение хранилось в базе в одном экземпляре, причем значение это не должно быть получено расчетным методом из другой информации, хранящихся в базе.

Первая обычная форма

Первая обычная форма:

запрещает повторяющиеся столбцы (которые содержат однообразную по смыслу данные)

запрещает множественные столбцы (которые содержат значения типа перечня и т.п.)

требует выяснить первичный ключ для таблицы, другими словами тот столбец либо комбинацию столбцов, каковые конкретно определяют каждую строчок

Вторая обычная форма

Вторая обычная форма требует, дабы неключевые столбцы таблиц зависели от первичного ключа в целом, но не от его части: в случае если таблица находится в первой обычной форме и первичный ключ у нее складывается из одного столбца, то она машинально находится и во второй обычной форме.

Третья обычная форма

Дабы таблица пребывала в третьей обычной форме, нужно, дабы неключевые столбцы в ней не зависели от вторых неключевых столбцов, а зависели лишь от первичного ключа. Самая популярная обстановка в данном контексте — это расчетные столбцы, значения которых возможно взять методом каких-либо манипуляций с другими столбцами таблицы. Для приведения таблицы в третью обычную форму такие столбцы из таблиц нужно удалить.

Обычная форма Бойса-Кодда

Обычная форма Бойса-Кодда требует, дабы в таблице был лишь один потенциальный первичный ключ. Значительно чаще у таблиц, находящихся в третьей обычной форме, так и не редкость, но не всегда. В случае если обнаружился второй столбец (комбинация столбцов), разрешающий конкретно идентифицировать строчок, то для приведения к обычной форме Бойса-Кодда такие эти нужно вынести в отдельную таблицу.

Четвертая обычная форма

Для приведения таблицы, находящейся в обычной форме Бойса-Кодда, к четвертой обычной форме нужно устранить имеющиеся в ней многозначные зависимости. Другими словами обеспечить, дабы вставка / удаление любой строки таблицы не потребовала бы вставки / удаления / модификации вторых строчков данной же таблицы.

Пятая обычная форма

Таблицу, находящуюся в четвертой обычной форме и, казалось бы, уже нормализованную до предела, в некоторых случаях еще возможно не редкость разбить на три либо более таблиц, соединив каковые, мы возьмём исходную таблицу. Оказавшиеся в следствии таковой, в большинстве случаев, очень неестественной, декомпозиции таблицы и именуют находящимися в пятой обычная форме. Формальное определение пятой обычной формы таково: это форма, в которой устранены зависимости соединения. Как правило практической пользы от нормализации таблиц до пятой обычной формы не отмечается.

Созданы особые формальные математические способы нормализации таблиц реляционных баз данных. На практике проектировщик баз данных, подробно познакомившись с предметной областью, в большинстве случаев, достаточно скоро создаст структуру, в которой большая часть таблиц находятся в четвертой обычной форме:.

Основное, чего мы добьемся, совершив нормализацию базы данных — это устранение (либо, по крайней мере, важное сокращение) избыточности, дублирования данных. Как следствие, существенно уменьшается возможность появления противоречивых данных, облегчается обновление информации и администрирование базы в ней, уменьшается количество дискового пространства.

Первая обычная форма: три несложных условия

Похожие статьи:

Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!:

Adblock
detector