.CDB вариант №

Файлы CDB используются в критически важных приложениях, таких как электронная почта. CDB расшифровывается как «база данных констант», быстрый, надежный и простой пакет для создания или чтения баз данных констант. Замена базы данных защищена от сбоев системы. Пользователям не нужно делать паузу во время перезаписи. CDB работает как ассоциативный массив (на диске), сопоставляя ключи со значениями и позволяя хранить несколько значений в одном ключе.

Формат файла CDB

Формат файла CDB хранит числа, смещения, длины и хэш-значения в формате с прямым порядком байтов как 32-разрядные целые числа без знака. Ключи и данные считаются непрозрачными строками байтов без специальной обработки. В начале базы данных заголовок фиксированного размера представляет 256 хэш-таблиц, перечисляя их положение в файле и их длину в слотах. Обычно данные хранятся в виде последовательности записей, каждая запись хранит длину ключа, длину данных, ключ и данные. Нет правил сортировки или выравнивания. За записями следует набор из 256 хэш-таблиц различной длины. Поскольку допустимой длиной является ноль, в базе данных может быть физически сохранено менее 256 хеш-таблиц, но ничто не считается 256 таблицами. Хэш-таблицы состоят из ряда слотов, каждый из которых содержит хеш-значение и смещение записи. «Пустые слоты» имеют нулевое смещение.

Структура

База данных CDB состоит из всего набора данных в одном компьютерном файле. Он состоит из трех частей:

Поиск доступен только для точных ключей. Поиски действуют по следующему алгоритму:

  • Хэшируйте ключ.
  • Определите, в какой хэш-таблице и слоте должна находиться эта запись.
  • Протестируйте указанный слот в хеш-таблице.

Для поиска ключей с более чем одним значением можно найти дополнительные значения, просто возобновив поиск в следующем слоте.

Функции

Структура базы данных CDB обеспечивает несколько функций:

Быстрый поиск

Успешный поиск в огромной базе данных обычно занимает всего два обращения к диску, а неудачный поиск — только один.

Низкие накладные расходы

База данных использует 2048 байтов, 24 байта на запись и пространство для ключей и данных.

Нет случайных ограничений

CDB может управлять любой базой данных размером до 4 гигабайт. Поскольку других ограничений нет, записи даже не обязательно помещаются в память. Базы данных хранятся в машинно-независимом формате.

Быстрая атомарная замена базы данных

Команда cdbmake может перезаписать всю базу данных на два порядка быстрее, чем другие пакеты хеширования.

Быстрые дампы базы данных

cdbdump может распечатать содержимое базы данных в формате, совместимом с cdbmake.

использованная литература

Первоначально опубликовано на https://docs.fileformat.com 16 июня 2021 г.