Вопросы по теме 'bulk-load'

Поля даты и данные загрузки Django
Можно ли загрузить дату в DateField, используя данные загрузки Django функция администратора ? У меня есть файл JSON, который я использую для массовой загрузки данных в свое приложение. При дампе данных поля даты выводятся в формате гггг-мм-дд ....
559 просмотров
schedule 01.10.2022

повышение производительности файла данных загрузки mysql
Я пытаюсь массово загрузить около 12 миллионов записей в таблицу InnoDB в (локальном) mysql, используя LOAD DATA INFILE (из CSV), и обнаружил, что это занимает очень много времени. Тип первичного ключа — UUID, и ключи в файлах данных не...
4877 просмотров
schedule 23.10.2022

Массовая загрузка XML, относящаяся к автоинкременту родительского идентификатора
Вкратце : я хочу выполнить массовую загрузку XML в базу данных SQL Server (2008) и сгенерировать идентификаторы автоинкремента для родительского элемента, которые можно использовать в дочернем элементе. Это кажется ограниченным объемом: родительский...
3160 просмотров
schedule 22.05.2023

Массовая вставка/загрузка в MySQL и HBase
У меня есть система с двумя процессами, один из которых выполняет одиночную вставку, а другой — массовую вставку. Очевидно, что второй процесс быстрее, и я работаю над переносом первого процесса на механизм массовой вставки, но сегодня утром меня...
389 просмотров
schedule 17.07.2023

Большие записи вызывают нестабильность в кольце Cassandra
Я пытаюсь загрузить большой объем данных в кольцо Cassandra с 10 узлами. Сценарий, выполняющий вставки, получает около 4000 вставок в секунду, предположительно заблокированных на сетевом вводе-выводе. Я запускаю 8 из них на одной машине, и...
1200 просмотров

Массовая вставка MS SQL
У меня есть требование вставить большой файл 2 GB CSV в мою базу данных MS SQL. большую часть строк при этом вставлять не требуется. Я не нашел ничего для фильтрации строк при массовой вставке. Для этого я использую команду массовой вставки MS...
3084 просмотров
schedule 11.06.2023

Импорт DB2 с измененным форматом метки времени для времени с прикрепленным к нему EDT/EST
У меня есть файл import_file.csv с указанным ниже форматом метки времени. Oct/21/2013 09:45:01 AM EDT Dec/04/2013 04:41:01 PM EST Я создал таблицу в IBM DB2 v9.7 create table table_import_timestamp ( my_timestamp timestamp ) А затем...
2311 просмотров
schedule 27.02.2023

Лучшая стратегия для гигантской массовой вставки SQL Server — высокочастотная или низкочастотная
Лучше загружать N пакетов данных по 1 МБ (высокая частота) или 1 пакет данных X МБ (низкая частота)? Проблема для меня в том, что синтаксический анализ и обработка данных также требуют времени, поэтому кажется, что параллельный синтаксический...
369 просмотров
schedule 28.09.2022

Массовая загрузка MonetDB с автоматическим приращением
Я пытаюсь загрузить файлы csv в таблицы monetdb с автоматическим увеличением столбцов PK / Id, используя copy into <table> from file... . В таблице есть столбец PK с автоматическим приращением. В таблице больше столбцов, чем в входящих...
405 просмотров
schedule 02.11.2023

Самый быстрый способ заполнить тестовые данные для модуля cassandra?
Я использую модуль cassandra для тестирования в своем проекте (Java), и это здорово, но проблема в том, что загрузка тестовых данных занимает довольно много времени (100 секунд для ~ 25 000 простых вставок). У меня есть некоторые идеи, но они не...
518 просмотров

Параллельный импорт данных в SQL Server
У меня есть более 100 файлов для импорта на сервер sql, и большинство из них имеют размер 500 МБ. Я хочу использовать утилиту параллельного импорта SQL-сервера и прочитал несколько веб-страниц, например следующие: Как загрузить 1 ТБ данных за 30...
1329 просмотров

Массовая вставка Redis: протокол против встроенных команд
Для моей задачи мне нужно как можно быстрее загрузить большую часть данных в Redis. Похоже, эта статья правильно описывает мой случай: https://redis.io/topics/mass-insert Статья начинается с примера использования нескольких встроенных команд...
862 просмотров
schedule 05.02.2023

Есть ли ограничение по времени для одного вызова синхронизации в Eloqua?
Мне нужно получить 1000 тыс. записей из Eloqua в mule esb, я делаю следующие 3 вызова в Eloqua для получения данных: Создайте определение экспорта Синхронизируйте исходящие данные во временную промежуточную область Получить данные В...
163 просмотров
schedule 19.10.2022

Проблемы со искрой при создании hfiles — добавлен ключ, лексически не превышающий предыдущую ячейку.
Я пытаюсь создать hfiles для массовой загрузки в Hbase, и он продолжает выдавать ошибку с ключом строки, хотя все выглядит нормально. Я использую следующий код: val df = sqlContext.read.format("com.databricks.spark.csv") .option("header",...
2186 просмотров
schedule 28.09.2022

Массовая загрузка в Cassandra, проблема грязного чтения и ее влияние на кластер
Наш вариант использования — загрузка больших объемов данных в наш работающий производственный кластер Cassandra. Нам приходится ежедневно загружать большие объемы данных в Cassandra. Мы наткнулись на sstableloader. У нас есть несколько запросов...
311 просмотров

«Обнаружение компрессора может быть вызвано только для некоторых байтов xcontent или сжатых байтов xcontent» ошибка при индексировании списка словарей
Этот вопрос связан с другим: Как с помощью python читать данные из списка и индексировать определенные значения в Elasticsearch? Я написал сценарий для чтения списка (фиктивного) и индексации его в Elasticsearch. Я преобразовал список в список...
361 просмотров
schedule 03.06.2023