レーベンシュタイン距離計算機
2 つの文字列間の編集距離を計算し、一方をもう一方に変換するために必要な操作を確認します。
レーベンシュタイン距離計算機の使用方法
- 最初の文字列フィールドに最初の文字列を入力します。
- 2 番目の文字列を「2 番目の文字列」フィールドに入力します。
- 「計算」をクリックします — 編集距離、類似率、および操作リストが即座に表示されます。
- 距離行列を展開すると、計算に使用される完全な動的プログラミング テーブルが表示されます。
クイックリファレンス
| 変換元 | 変換先 |
|---|---|
| 子猫 → 座っています | 距離: 3 |
| 土曜日 → 日曜日 | 距離: 3 |
| こんにちは → こんにちは | 距離: 0 (同一) |
| abc → xyz | 距離: 3 (すべて交換) |
| 猫 → カート | 距離: 1 (r を挿入) |
| 本 → 戻る | 距離: 2 |
使用例
- •スペルミスの入力に最も近い辞書の単語を見つけてスペルチェックの候補を作成します。
- •バイオインフォマティクス研究における DNA またはタンパク質の配列の比較。
- •データベースと検索エンジンにおけるあいまい検索の実装。
- •ユーザーが送信したテキストと教育アプリの参照回答の間の類似性を測定します。
計算式
2 つの文字列間のレーベンシュタイン距離は、一方の文字列をもう一方の文字列に変換するために必要な単一文字の編集 (挿入、削除、置換) の最小回数です。
よくある質問
レーベンシュタイン距離とは何ですか?
レーベンシュタイン距離 (編集距離とも呼ばれます) は、2 つの文字列がどの程度異なっているかを測定するための指標です。
類似性のパーセンテージは編集距離からどのように計算されますか?
類似度は、次の式を使用してレーベンシュタイン距離から導出されます: 類似度 = (1 − 距離 / max(len1, len2)) × 100%。
レーベンシュタイン距離の一般的な用途は何ですか?
レーベンシュタイン距離は、修正を示唆するスペル チェッカー、バイオインフォマティクスの DNA 配列アラインメント、検索エンジンのあいまい文字列マッチング、盗作検出ツール、および固有表現認識や機械翻訳の評価などのタスクの自然言語処理で広く使用されています。