C#實現Levenshtein distance最小編輯距離演算法

來源:互聯網
上載者:User

標籤:相同   字元   動態規劃   插入   ati   targe   ref   nbsp   maxlength   

Levenshtein distance,中文名為最小編輯距離,其目的是找出兩個字串之間需要改動多少個字元後變成一致。該演算法使用了動態規劃的演算法策略,該問題具備最優子結構,最小編輯距離包含子最小編輯距離,有下列的公式。

其中d[i-1,j]+1代表字串s2插入一個字母才與s1相同,d[i,j-1]+1代表字串s1刪除一個字母才與s2相同,然後當xi=yj時,不需要代價,所以和上一步d[i-1,j-1]代價相同,否則+1,接著d[i,j]是以上三者中最小的一項。

演算法實現(C#):

假設兩個字串分別為source,target,其長度分別為columnSize,rowSize,首先申請一個(columnSize+1)*(rowSize+1)大小的矩陣,然後將第一行和第一列初始化,matrix[i,0]=i,matrix[0,j]=j,接著就按照公式求出矩陣中其他元素,結束後,兩個字串之間的編輯距離就是matrix[rowSize, columnSize]的值,代碼如下:

    public class StringComparator    {        public static int LevenshteinDistance(string source, string target)        {            int columnSize = source.Length;            int rowSize = target.Length;            if (columnSize == 0)            {                return rowSize;            }            if (rowSize == 0)            {                return columnSize;            }
int[,] matrix = new int[rowSize + 1, columnSize + 1]; for (int i = 0; i <= columnSize; i++) { matrix[0, i] = i; } for (int j = 1; j <= rowSize; j++) { matrix[j, 0] = j; }
for (int i = 0; i < rowSize; i++) { for (int j = 0; j < columnSize; j++) { int sign; if (source[j].Equals(target[i])) sign= 0; else sign = 1; matrix[i + 1, j + 1] = Math.Min(Math.Min(matrix[i, j] + sign, matrix[i + 1, j]), matrix[i, j + 1] + 1); } } return matrix[rowSize, columnSize]; } public static float StringSimilarity(string source, string target) { int distance = LevenshteinDistance(source, target); float maxLength = Math.Max(source.Length, target.Length); return (maxLength - distance) / maxLength; } }

 

C#實現Levenshtein distance最小編輯距離演算法

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.