Я работаю в Microsoft Azure Databricks с двумя фреймами данных.
У меня уже есть Dataframe, который содержит мои «Masterdata». Я также ежедневно получаю полный пакет данных со «всеми» записями. Но те, кто находится в этом фрейме данных, могут быть изменены в записях, и записи также могут быть удалены и добавлены.
Каков наилучший и, возможно, самый простой способ получить эту дельту или изменение данных между двумя фреймами данных?
ОБНОВЛЕНИЕ DataFrame 1 -> которое я получаю каждый день
customer score
MERCEDES 1.1
CHRYSLER 3.0
DataFrame 2 -> мой хозяин
customer score
BMW 1.1
MERCEDES 1.3
Итак, что мне нужно получить:
customer score
BMW 1.1 -> cause was deleted in receiving data
MERCEDES 1.3 -> cause was value changed
CHRYSLER 3.0 -> cause was added new