Я пишу работу Hadoop, которая сканирует страницы. Библиотека, которую я использую, использует файловую систему для хранения данных сканирования во время сканирования. Я был уверен, что библиотеку придется модифицировать для использования HDFS, поскольку для взаимодействия с HDFS необходимо использовать совершенно другой набор классов, в то время как используемая мной библиотека сканера использует java.io.
Однако, когда коллега использовал hdfs://localhost/path/to/storage, для пути к папке хранилища сработал краулер, и он смог записать в файловую систему. Я пытаюсь понять, почему это работает, есть ли что-то другое в jvms на основе hadoop, что заставляет их разрешать пути с префиксом hdfs:// к пути в HDFS?