字符串相似度(编辑距离、余弦定理)对比

本文发布于 6 年前,部分内容可能已经失去参考价值。


编辑距离余弦定理
"ab"与"ac"0.5
0.5
"ab"与"abc"0.6666666666666670.816496580927726
"aa"与"a"0.51
"aab"与"a"0.3333333333333330.894427190999916

一些总结:

  • 交换两个字符串的顺序,结果不变。

  • 如果要把一些词汇按在某篇文章中出现频率排序,那么应选择余弦定理。

xoyozo 6 年前
转载请注明出处
可能相关的内容