Я использую webhdfs для загрузки данных из локальной файловой системы в HDFS. Теперь я хочу обеспечить целостность файлов, загруженных в HDFS.
Как я могу убедиться, что передаваемые файлы не повреждены/изменены и т.д.?
Я использовал приведенную ниже команду webhdfs, чтобы получить контрольную сумму файла.
curl -i -L --negotiate -u: -X GET "http://$hostname:$port/webhdfs/v1/user/path?op=GETFILECHECKSUM"
Как мне использовать указанную выше контрольную сумму для обеспечения целостности загруженных файлов? пожалуйста, предложите
Ниже приведены шаги, которые я выполняю
>md5sum locale_file
740c461879b484f4f5960aa4f67a145b
>hadoop fs -checksum locale_file
locale_file MD5-of-0MD5-of-512CRC32C 000002000000000000000000f4ec0c298cd6196ffdd8148ae536c9fe
Контрольная сумма файла в локальной системе отличается от того же файла в HDFS. Мне нужно сравнить контрольную сумму, как я могу это сделать?