Таблица Char vs Symbol KDB разделена на части

Я создаю новую таблицу в базе данных KDB как разделенную на части (разделенную по дате), в новой схеме таблицы есть столбец с именем CCYY, в котором много повторяющихся значений. Я не уверен, должен ли я сохранить его как char или символы. Моя главная цель - использовать наименьшее количество памяти.

В результате какой из них я должен использовать? В чем преимущество/недостаток сохранения повторяющихся значений либо в виде массива символов, либо в виде символа в разделенной расширенной настройке?

kdb q-lang

stretchr 18.04.2014 источник

Ответы (2)

arrow_upward
1
arrow_downward

Похоже, вы должны использовать символ.

Здесь есть руководство по символам/перечислениям:http://www.timestored.com/kdb-guides/strings-symbols-enumeration#when-to-use цитата:

Как правило, вы должны следовать рекомендациям:

Если столбец используется в сравнениях равенства предложений, например. выберите из t, где символ в AB -> Символ

Короткие, часто повторяющиеся строки -> Символ

Else Long, Неповторяющиеся строки -> Строка

Ryan Hamilton 18.04.2014

arrow_upward
0
arrow_downward

При оценке того, следует ли использовать символ для столбца, ключевое значение имеет кардинальность этого столбца. Длина отдельных значений имеет меньшее значение, и, во всяком случае, более длинные значения могут быть лучше в качестве символов, поскольку они будут храниться только один раз в файле sym, но повторяться в векторе char. Однако это соображение довольно спорно, если вы сжимаете данные на диске.

Если ваши значения достаточно короткие, не забывайте о возможности использования .Q.j10, .Q.x10, .Q.j12 и .Q.x12. Это будет использовать меньше места, чем вектор символов. И он не зависит от файла sym, который в сложных средах может избавить вас от необходимости повторного перечисления, если вы, скажем, копируете таблицы между hdbs, файлы sym которых не синхронизированы.

Если вам не хватает места, всегда сжимайте данные на диске.

mollmerx 21.04.2014

Таблица Char vs Symbol KDB разделена на части

Ответы (2)

Вопросы по теме