У меня есть 2 вопроса для Hadoop в качестве системы хранения.
У меня есть кластер Hadoop из 3 узлов данных, и я хочу направить разбиение огромного файла, скажем, размером 128 МБ (при условии, что размер разделения составляет 64 МБ) на мой выбор узла данных. Вот как в таком случае контролировать, какой раздел идет к какому DataNode. Я имею в виду, скажем, у нас есть 3 узла данных (т.е. D1, D2, D3), и нам нужен определенный раскол (скажем, «A»), который я хочу переместить в определенный узел данных, пусть это будет D2.
Как мы можем это сделать ?
Каков наименьший возможный размер разделения файловой системы Hadoop. Как мы можем настроить его на наименьший размер разделения.