Как установить Куду?

Я знаком с компонентами Hadoop, такими как hive, hbase, hdfs и т. д. Но я новичок в Apache Kudu.

До сих пор из моих исследований я понял, что куду — это не что иное, как столбчатое хранилище, такое как паркет. Также это быстрее, чем Hbase.

Но я все еще не могу найти эффективный документ для установки kudu. Даже мне интересно, действительно ли мне нужно установить какой-либо отдельный пакет для kudu или его встроенный в hadoop (EMR или Dataproc).

Пожалуйста, помогите, как я могу начать практические занятия по куду.


person Joseph N    schedule 04.06.2020    source источник
comment
Очень плохой подход к делу. Например, он изменчив.   -  person thebluephantom    schedule 04.06.2020


Ответы (1)


Kudu - это НЕ формат файла, а скорее другой механизм хранения. Считайте, что это параллельная/альтернативная файловая система для вашей HDFS (или S3). Да, для этого НЕОБХОДИМО установить главный и планшетный серверы, см. Обзор архитектуры на веб-сайте Apache. .

Поскольку это проект Apache с открытым исходным кодом, инструкции по установке также можно найти на веб-сайте Apache: https://kudu.apache.org/docs/installation.html.

person mazaneicha    schedule 04.06.2020
comment
@thebluephantom С точки зрения того, чтобы быть слишком грубым, все или ничего? Да, это правда... Надеюсь, с интеграцией Ranger все станет лучше docs.cloudera.com/runtime/7.1.1/administering-kudu/topics/ - person mazaneicha; 04.06.2020
comment
Спасибо @mazaneicha за ваш ответ. Могу ли я установить kudu на только что созданную машину EC2, где не существует Hadoop? или мне нужно установить куду поверх хаупа? - person Joseph N; 05.06.2020
comment
Сам по себе Kudu не зависит ни от какой части экосистемы Hadoop. Хотя Spark, Impala и Hive Metastore могут быть инструментами для обработки данных, хранящихся в Kudu. - person mazaneicha; 05.06.2020