Что такое строго типизированный API и нетипизированный API по отношению к наборам данных Spark?
Чем наборы данных похожи/отличаются от фреймов данных?
Что такое строго типизированный API и нетипизированный API по отношению к наборам данных Spark?
Чем наборы данных похожи/отличаются от фреймов данных?
API-интерфейсы Dataframe являются нетипизированными API, поскольку тип будет известен только во время выполнения. Принимая во внимание, что API наборов данных — это типизированные API, для которых тип будет известен во время компиляции.
df.select("device").where("signal > 10") // using untyped APIs
ds.filter(_.signal > 10).map(_.device) // using typed APIs