Levenshtein-Entfernungsrechner
Berechnen Sie den Bearbeitungsabstand zwischen zwei Zeichenfolgen und sehen Sie sich die Operationen an, die erforderlich sind, um eine in die andere umzuwandeln.
So verwenden Sie den Levenshtein-Entfernungsrechner
- Geben Sie die erste Zeichenfolge in das Feld „Erste Zeichenfolge“ ein.
- Geben Sie die zweite Zeichenfolge in das Feld „Zweite Zeichenfolge“ ein.
- Klicken Sie auf Berechnen – der Bearbeitungsabstand, der Ähnlichkeitsprozentsatz und die Vorgangsliste werden sofort angezeigt.
- Erweitern Sie die Distanzmatrix, um die vollständige dynamische Programmiertabelle anzuzeigen, die für die Berechnung verwendet wurde.
Schnellreferenz
| Von | Nach |
|---|---|
| Kätzchen → sitzend | Entfernung: 3 |
| Samstag → Sonntag | Entfernung: 3 |
| Hallo → Hallo | Abstand: 0 (identisch) |
| abc → xyz | Entfernung: 3 (alle ersetzt) |
| cat → Warenkorb | Abstand: 1 (r einfügen) |
| Buch → zurück | Entfernung: 2 |
Anwendungsfälle
- •Erstellen Sie Vorschläge zur Rechtschreibprüfung, indem Sie Wörterbuchwörter finden, die einer falsch geschriebenen Eingabe am nächsten kommen.
- •Vergleich von DNA- oder Proteinsequenzen in der Bioinformatikforschung.
- •Implementierung der Fuzzy-Suche in Datenbanken und Suchmaschinen.
- •Messung der Ähnlichkeit zwischen vom Benutzer eingereichten Texten und Referenzantworten in Bildungs-Apps.
Formel
Der Levenshtein-Abstand zwischen zwei Zeichenfolgen ist die Mindestanzahl an Einzelzeichenbearbeitungen – Einfügungen, Löschungen oder Ersetzungen –, die erforderlich sind, um eine Zeichenfolge in die andere umzuwandeln.
Häufig gestellte Fragen
Was ist die Levenshtein-Entfernung?
Levenshtein-Distanz (auch Bearbeitungsdistanz genannt) ist eine Metrik zur Messung, wie unterschiedlich zwei Saiten sind.
Wie wird der Ähnlichkeitsprozentsatz aus der Bearbeitungsentfernung berechnet?
Ähnlichkeit wird aus der Levenshtein-Distanz mithilfe der Formel abgeleitet: Ähnlichkeit = (1 − Distanz / max(len1, len2)) × 100 %.
Was sind häufige Anwendungen der Levenshtein-Distanz?
Levenshtein-Distanz wird häufig in Rechtschreibprüfungen verwendet, um Korrekturen vorzuschlagen, bei der DNA-Sequenzausrichtung für die Bioinformatik, beim Fuzzy-String-Matching für Suchmaschinen, in Tools zur Plagiatserkennung und bei der Verarbeitung natürlicher Sprache für Aufgaben wie die Erkennung benannter Entitäten und die Bewertung maschineller Übersetzungen.