Duplikate erkennen

Duplikate zum Datensatz im gleichen Formular: Was ist ein Duplikat?

∅ 4 / 1 Bewertungen

Was ist ein Duplikat?

Auf dieser Seite

Zuerst müssen Sie festlegen, ab wann ein Datensatz als Duplikat gelten soll. Am einfachsten wäre es sicherlich, die identischen Inhalte aller vorkommenden Felder zu fordern. Dann müssten die Benutzer aber erst einen kompletten Datensatz eingegeben haben, bevor er als überflüssig erkannt werden kann.

Das wäre allerdings nicht besonders benutzerfreundlich. Außerdem würden Sie geänderte Adressen übersehen, wenn alles außer der Anschrift gleich bleibt (wie es sich beispielsweise nach einem Umzug ergibt).

Da eine Entscheidung, ob es sich wirklich um ein Duplikat handelt, letztlich nur per Augenschein getroffen werden kann, sollen lieber zu viele "verdächtige" Datensätze angezeigt werden als zu wenige. Diese Datensätze sollen hier als mögliche Duplikate gelten, wenn zwei Felder gleiche Teile enthalten. Dieser Filter lässt sich für Ihre Zwecke nach Belieben später noch enger formulieren.

Beispiel-Daten

Als Beispiel für die Daten nehme ich hier einfach die Tabelle Kunden aus der Nordwind-Datenbank. Sie enthält ursprünglich 91 Datensätze ohne Duplikate.

Für Übungszwecke steht eine Datenbank zum Download bereit: Datenbank "Duplikate" (.mdb, 212 kB).