Levenshtein-Entfernungsrechner

Berechnen Sie den Bearbeitungsabstand zwischen zwei Zeichenfolgen und sehen Sie sich die Operationen an, die erforderlich sind, um eine in die andere umzuwandeln.

Erste Zeichenfolge

Zweite Zeichenfolge

So verwenden Sie den Levenshtein-Entfernungsrechner

Geben Sie die erste Zeichenfolge in das Feld „Erste Zeichenfolge“ ein.
Geben Sie die zweite Zeichenfolge in das Feld „Zweite Zeichenfolge“ ein.
Klicken Sie auf Berechnen – der Bearbeitungsabstand, der Ähnlichkeitsprozentsatz und die Vorgangsliste werden sofort angezeigt.
Erweitern Sie die Distanzmatrix, um die vollständige dynamische Programmiertabelle anzuzeigen, die für die Berechnung verwendet wurde.

Schnellreferenz

Von	Nach
Kätzchen → sitzend	Entfernung: 3
Samstag → Sonntag	Entfernung: 3
Hallo → Hallo	Abstand: 0 (identisch)
abc → xyz	Entfernung: 3 (alle ersetzt)
cat → Warenkorb	Abstand: 1 (r einfügen)
Buch → zurück	Entfernung: 2

Anwendungsfälle

•Erstellen Sie Vorschläge zur Rechtschreibprüfung, indem Sie Wörterbuchwörter finden, die einer falsch geschriebenen Eingabe am nächsten kommen.
•Vergleich von DNA- oder Proteinsequenzen in der Bioinformatikforschung.
•Implementierung der Fuzzy-Suche in Datenbanken und Suchmaschinen.
•Messung der Ähnlichkeit zwischen vom Benutzer eingereichten Texten und Referenzantworten in Bildungs-Apps.

Formel

Der Levenshtein-Abstand zwischen zwei Zeichenfolgen ist die Mindestanzahl an Einzelzeichenbearbeitungen – Einfügungen, Löschungen oder Ersetzungen –, die erforderlich sind, um eine Zeichenfolge in die andere umzuwandeln.

Häufig gestellte Fragen

Was ist die Levenshtein-Entfernung?

Levenshtein-Distanz (auch Bearbeitungsdistanz genannt) ist eine Metrik zur Messung, wie unterschiedlich zwei Saiten sind.

Wie wird der Ähnlichkeitsprozentsatz aus der Bearbeitungsentfernung berechnet?

Ähnlichkeit wird aus der Levenshtein-Distanz mithilfe der Formel abgeleitet: Ähnlichkeit = (1 − Distanz / max(len1, len2)) × 100 %.

Was sind häufige Anwendungen der Levenshtein-Distanz?

Levenshtein-Distanz wird häufig in Rechtschreibprüfungen verwendet, um Korrekturen vorzuschlagen, bei der DNA-Sequenzausrichtung für die Bioinformatik, beim Fuzzy-String-Matching für Suchmaschinen, in Tools zur Plagiatserkennung und bei der Verarbeitung natürlicher Sprache für Aufgaben wie die Erkennung benannter Entitäten und die Bewertung maschineller Übersetzungen.