Как каждую ночь загружать 5bil строк в Oracle?

Рассматриваемые подходы включают:

  • sqldr
  • внешние таблицы
  • Ab initio
  • Голдгенгейт.

Способен ли какой-либо из этих подходов удовлетворить требование 5bil строк за 6 часов?

входящие - это текстовые файлы в формате разделителя каналов. 1 файл на таблицу. 10 таблиц по 10-20 столбцов в каждой.


person Alan Jurgensen    schedule 24.04.2013    source источник
comment
зависит от количества столбцов   -  person mechanical_meat    schedule 24.04.2013
comment
какой формат входящих записей? (я имею в виду текстовый файл, xml, двоичный файл, другое?)   -  person Randy    schedule 24.04.2013
comment
также - чтобы перепроверить - вам нужно загружать 230 000 записей в секунду в течение 6 часов каждую ночь?   -  person Randy    schedule 24.04.2013
comment
Да, средняя пропускная способность получается такой:   -  person Alan Jurgensen    schedule 25.04.2013
comment
5000000000/6/60/60 = 231481,481 /сек   -  person Alan Jurgensen    schedule 25.04.2013
comment
Вы можете так быстро разобрать исходные файлы?   -  person Randy    schedule 25.04.2013
comment
Если данные доступны перед окном: загрузите данные в отдельный экземпляр Oracle по мере их доступности, а затем во время вашего ночного окна используйте перекачку данных, чтобы переместить их по ссылке базы данных.   -  person Brian    schedule 25.04.2013
comment
Внешние таблицы и серьезное оборудование должны уметь это делать, см. здесь для примера.   -  person Jon Heller    schedule 25.04.2013
comment
Первой проверкой будет измерение максимальной пропускной способности вашей подсистемы ввода/вывода. Вы должны быть в состоянии как читать, так и писать примерно (пять миллиардов * средний_размер_строки) байтов одновременно в шестичасовом окне. Что еще вам нужно сделать? Добавить какие-нибудь индексы, например? Если аппаратное обеспечение не превышает требования простого ввода-вывода, вы не сможете этого сделать. Кроме того, какая у вас версия и какие дополнения у вас есть по лицензии? Разделение? Расширенное сжатие?   -  person David Aldridge    schedule 25.04.2013
comment
Может возникнуть проблема с загрузкой более 4,2-миллиардных строк с помощью sqlloader. stackoverflow.com/ вопросов/7103260/ Но при прямой загрузке, если в вашей таблице не так много столбцов, она молниеносно быстро загружается.   -  person Wouter    schedule 23.09.2013