Индексы в основном используются в системах OLTP для извлечения определенной или небольшой группы значений. Напротив, системы OLAP извлекают большой набор значений и выполняют агрегирование для большого набора значений. Индексы не подходят для систем OLAP. Вместо этого он использует вторичную структуру, называемую зонными картами с ключами сортировки.
Индексы работают с B-деревьями. В разделе «Жизнь без btree» в блоге ниже на примерах объясняется, как индекс, основанный на btree, влияет на рабочие нагрузки OLAP.
https://blog.chartio.com/blog/understanding-interleaved-sort-keys-in-amazon-redshift-part-1
Комбинация хранения по столбцам, кодирования сжатия, распределения данных, сжатия, компиляции запросов, оптимизации и т. Д. Обеспечивает Redshift возможность работать быстрее.
Реализация вышеуказанных факторов сокращает количество операций ввода-вывода в Redshift и, в конечном итоге, обеспечивает лучшую производительность. Чтобы реализовать эффективное решение, требуются обширные знания в перечисленных выше разделах, а также в запросах, которые вы будете выполнять в Amazon Redshift.
например, для Redshift поддерживает ключи сортировки, составные ключи сортировки и ключи сортировки с чередованием. Если структура вашей таблицы - строковый элемент (заказ, номер полотна, поставщик, количество, цена, скидка, налог, возврат квартиры, дата отгрузки). Если вы выберете orderid в качестве ключа сортировки, но если ваши запросы основаны на дате отгрузки, Redshift будет работать эффективно. Если у вас есть составной ключ сортировки (порядковый номер, дата отправки) и если ваш запрос только на дату отгрузки, Redshift не будет работать эффективно. Если у вас включена программная клавиша с чередованием (orderid, shipdate) и ваш запрос
Redshift не поддерживает материализованные представления, но легко позволяет создавать (временные / постоянные) таблицы, выполняя запросы выбора к существующим таблицам. В конечном итоге он дублирует данные, но в необходимом формате для выполнения для запросов (аналогично материализованному представлению). В приведенном ниже блоге вы найдете некоторую информацию о вышеупомянутом подходе.
https://www.periscopedata.com/blog/faster-redshift-queries-with-materialized-views-lifetime-daily-arpu.html.
Redshift хорошо справляется с другими системами, такими как Hive, Impala, Spark, BQ и т. Д., Во время одного из наших недавних тестовых фреймворков.
person
Mukund
schedule
31.05.2016