У меня есть проект, в котором значительная часть пирога будет заключаться в том, чтобы определить, где запись дублируется в базе данных (Sql Server 2005). Я знаю очевидные способы найти дубликат записи. Однако в этом случае мы хотим быть достаточно умными в этом процессе. Таблица (таблицы) будет содержать информацию о потенциальном клиенте (лиде). Начальные столы будут принимать все лиды. Затем мы пройдем процесс дублирования, который проверит, является ли лид дубликатом, сопоставив несколько полей. Например, мы можем захотеть сопоставить фамилию, имя, адрес электронной почты и почтовый индекс. Это всего лишь пример, но по сути мы хотим создать ключ, используя различные поля, чтобы знать, существует ли этот человек. Записи, не являющиеся дубликатами, попадут в финальную таблицу.
Я хотел бы использовать SSIS для этого, но я не уверен, что это лучший способ использовать SSIS для этого. Может ли кто-нибудь направить меня в правильном направлении или предоставить ссылку на пример, который использует SSIS для борьбы с дубликатами путем проверки комбинации полей?