Вопросы по теме 'bzip2'

Как увеличить количество задач карты для MapReduce с помощью формата ввода bzip2
Я разработал mr, который правильно работает с текстовым файлом, выполняя несколько задач карты, но мне нужно запускать работу либо в архивах. Мой выбор - архив bzip2. С такими архивами моя работа работает только с одной картографической задачей....
811 просмотров
schedule 28.05.2023

Захват завершения BZIP2 в Perl
Вот что у меня есть до сих пор: #!/usr/bin/perl use strict; use warnings; use IO::Compress::Bzip2 qw(bzip2 $Bzip2Error); use File::Find; use File::Basename; my $directory = "/usr/www/op1/public/server"; my @list_of_files; find sub {...
98 просмотров
schedule 07.04.2023

Заголовок блока Bzip2: 1AY&SY
Это вопрос о формате архива bzip2. Любой архив Bzip2 состоит из заголовка файла, одного или нескольких блоков и хвостовой структуры. Все блоки должны начинаться с «1AY&SY», 6 байт двоично-десятичных цифр числа Пи, 0x314159265359. Согласно...
2249 просмотров
schedule 04.03.2023

C BZ2_bzDecompress намного медленнее, чем команда bzip2
Я использую mmap/read + BZ2_bzDecompress для последовательной распаковки большого файла (29 ГБ). Это сделано потому, что мне нужно проанализировать несжатые данные xml, но мне нужны только небольшие их фрагменты, и казалось, что было бы намного...
480 просмотров
schedule 24.07.2023

bzip2 — сжатие всех файлов внутри папок (Windows)
У меня на компьютере есть утилита bzip, но она архивирует только те файлы, которые находятся внутри каталога «compress». Как мне сделать так, чтобы файлы во всех каталогах внутри каталога сжатия были заархивированы? Пример...
1832 просмотров
schedule 26.04.2023

Как позволить EMR сначала выполнить клиентскую банку
Поскольку hadoop 1.0.3 не поддерживает распаковку bzip2, я скопировал те же классы из hadoop 2.2 в свой проект, но мой проект (или мы называем его jar) все еще работает в кластере hadoop 1.0.3. Я обнаружил, что Hadoop все еще выполняет классы из...
320 просмотров
schedule 01.10.2022

Извлечь файл bz2 в R
У меня есть куча .csv.bz2 файлов, которые мне нужно загрузить, извлечь и прочитать в R. Я скачал файл и хочу извлечь его в текущий рабочий каталог, а затем прочитать его. unz(filename,filename.csv) но это не работает. Как я могу это сделать?...
35366 просмотров
schedule 27.04.2022

GoLang: распаковать bz2 в горутине, использовать в другой горутине
Я новичок в SWE, изучаю Go (и люблю его). Я создаю парсер для файлов дампа Википедии - в основном огромный XML-файл, сжатый bzip2 (~ 50 ГБ без сжатия). Я хочу выполнять как потоковую декомпрессию, так и синтаксический анализ, что звучит...
1197 просмотров
schedule 19.05.2022

Копирование локальных данных базы данных SQL-сервера в Azure в формате Parquet
Архитектурный / перфорационный вопрос здесь. У меня есть локальная база данных SQL-сервера, в которой есть ~ 200 таблиц общим объемом ~ 10 ТБ. Мне нужно сделать эти данные доступными в Azure в формате Parquet для анализа данных через HDInsight...
1826 просмотров

configure: error: переустановите дистрибутив BZip2
Я пытаюсь скомпилировать php из исходного кода на Mac с расширением bzip2 и все время получаю сообщение об ошибке проверка наличия BZip2 в пути по умолчанию ... не найдена Я пробовал установить LDFLAGS и CPPFLAGS, но, похоже, это не...
1874 просмотров
schedule 06.02.2023