字符串相似度(编辑距离、余弦定理)对比
本文发布于 6 年前,部分内容可能已经失去参考价值。
编辑距离 | 余弦定理 | |
"ab"与"ac" | 0.5 | 0.5 |
"ab"与"abc" | 0.666666666666667 | 0.816496580927726 |
"aa"与"a" | 0.5 | 1 |
"aab"与"a" | 0.333333333333333 | 0.894427190999916 |
一些总结:
交换两个字符串的顺序,结果不变。
如果要把一些词汇按在某篇文章中出现频率排序,那么应选择余弦定理。
可能相关的内容
编辑距离 | 余弦定理 | |
"ab"与"ac" | 0.5 | 0.5 |
"ab"与"abc" | 0.666666666666667 | 0.816496580927726 |
"aa"与"a" | 0.5 | 1 |
"aab"与"a" | 0.333333333333333 | 0.894427190999916 |
一些总结:
交换两个字符串的顺序,结果不变。
如果要把一些词汇按在某篇文章中出现频率排序,那么应选择余弦定理。