Я использую Delta Lake 0.4.0 с Merge, например:
target.alias("t")
.merge(
src.as("s"),
"s.id = t.id
)
.whenMatched().updateAll()
.whenNotMatched().insertAll()
.execute()
src читает из папки с тысячами файлов. Результаты слияния также генерируют множество небольших файлов. Есть ли способ контролировать номер файла в результатах слияния, например эффект перераспределения (1) или объединения (1)?
Спасибо