数据科学中常见的9种距离度量方法,内含欧氏距离、切比雪夫距离等( 三 )


用例:半正矢距离通常用于导航 。 例如 , 你可以使用它来计算两个国家之间的飞行距离 。 请注意 , 如果距离本身不那么大 , 则不太适合 。
S?rensen-Dice系数

数据科学中常见的9种距离度量方法,内含欧氏距离、切比雪夫距离等
文章图片
S?rensen-Dice系数 。
S?rensen-Dice系数与雅卡尔指数非常相似 , 都是度量样本集的相似性和多样性 。 尽管它们的计算方法相似 , 但是S?rensen-Dice系数更直观一些 , 因为它可以被视为两个集合之间重叠的百分比 , 这个值在0到1之间:

数据科学中常见的9种距离度量方法,内含欧氏距离、切比雪夫距离等
文章图片
缺点:正如雅卡尔指数 , S?rensen-Dice系数也夸大了很少或没有真值的集合的重要性 , 因此 , 它可以控制多集合的平均得分 , 还可以控制多组平均得分并按相关集合的大小成反比地加权每个项目 , 而不是平等对待它们 。
用例:用例与雅卡尔指数相似 , 它通常用于图像分割任务或文本相似性分析 。
—THEEND—
编辑∑Gemini
来源:towardsdatascience
?从金庸的武侠到数学的江湖
?丘成桐谈几何:从黎曼、爱因斯坦到弦论
?实例详解贝叶斯推理的原理
?漫谈高数曲线积分的物理意义
?相对论的根源
?人人都能读懂的编译器原理