Tag: 自然言語処理 日本語
レーベンシュタイン距離(Levenshtein Distance)は,ある文字列と別の文字列の最小編集距離で表される距離である.
今回は類似度を用いて二つの単語を評価することで、表記揺れの問題に対処してみます。
コンピューターで自動生成された、文法的には正しいが、単語の使い方がでたらめなために意味が通らない文章