python 弗雷歇距离弗雷效应距离

转载

mob64ca1404ed65 2024-02-02 08:35:03

文章标签 python 弗雷歇距离 python 动态规划大数据最小值 文章分类 Python 后端开发

弗雷歇距离的原理及python代码实现（动态规划）

在网上看了很多关于弗雷歇距离的介绍，结合自己的理解，出一版更通俗易懂、更清晰具体的解释。

最简单的解释自然是最短狗绳长度，但我将从另一个角度来解释它。

python 弗雷歇距离弗雷效应距离_最小值

图中人牵着狗在走，人走直线，狗走得自由且散漫。为了能拴住狗，任何时刻狗绳的长度都应该大于人狗距离，于是有最短狗绳长度等于最大人狗距离。

现在我们假定人只能走蓝色轨道，狗只能走红色轨道且都只能向前走，但是具体怎么走——中途停不停、走多快是未知的，然后我们对时间进行采样，将得到人、狗轨迹的离散序列，计算两序列中对应离散点的距离，距离的最大值即这一次遛狗所需的最短狗绳长度。

基于这个理解，上图显示的便是一次遛狗所得到的人、狗轨迹离散序列，虚线连接了两序列中对应的离散点，最大虚线长度便是这次遛狗所需的最短狗绳长度。下一次遛狗得到的离散序列可能就大不相同，例如，人走到中间时，狗已经走到红色轨道的终点并在那等着主人，那么这一次遛狗所需的最短狗绳长度就大于上一次的。在无数次遛狗中，最短狗绳长度的最小值就是弗雷歇距离！

注：对于两条连续轨迹，不可能遍历所有人狗轨迹离散序列，因此只能求下界，对于两条离散轨迹，取最小值即可。

python 弗雷歇距离弗雷效应距离_python_02

动态规划计算弗雷歇距离：

设甲、乙两人的离散轨迹序列分别为Ta、Tb，Ta、Tb的长度分别为M、N，两轨迹之间的弗雷歇距离为Fd[M][N]。假设Ta、Tb的最后一个点分别是A、B，那么可以有三种行走情形：

甲、乙两人都在最后时刻到达终点A、B，那么此时Fd[M][N] = max(Fd[M-1][N-1], d(A,B))
甲先到达终点A并在那等着乙到达终点B，那么此时Fd[M][N] = max(Fd[M][N-1], d(A,B))
乙先到达终点B并在那等着甲到达终点A，那么此时Fd[M][N] = max(Fd[M-1][N], d(A,B))

由此我们可以得到传递函数：
$python 弗雷歇距离弗雷效应距离_最小值_03$

$python 弗雷歇距离弗雷效应距离_python 弗雷歇距离_04$

python代码实现()：

import math
import numpy as np


def calculate_euclid(point_a, point_b):
    """
    Args:
        point_a: a data point of curve_a
        point_b: a data point of curve_b
    Return:
        The Euclid distance between point_a and point_b
    """
    return math.sqrt((point_a - point_b) ** 2)


def calculate_frechet_distance(dp, i, j, curve_a, curve_b):
    """
    Args:
        dp: The distance matrix
        i: The index of curve_a
        j: The index of curve_b
        curve_a: The data sequence of curve_a
        curve_b: The data sequence of curve_b
    Return:
        The frechet distance between curve_a[i] and curve_b[j]
    """
    if dp[i][j] > -1:
        return dp[i][j]
    elif i == 0 and j == 0:
        dp[i][j] = calculate_euclid(curve_a[0], curve_b[0])
    elif i > 0 and j == 0:
        dp[i][j] = max(calculate_frechet_distance(dp, i - 1, 0, curve_a, curve_b),
                       calculate_euclid(curve_a[i], curve_b[0]))
    elif i == 0 and j > 0:
        dp[i][j] = max(calculate_frechet_distance(dp, 0, j - 1, curve_a, curve_b),
                       calculate_euclid(curve_a[0], curve_b[j]))
    elif i > 0 and j > 0:
        dp[i][j] = max(min(calculate_frechet_distance(dp, i - 1, j, curve_a, curve_b),
                           calculate_frechet_distance(dp, i - 1, j - 1, curve_a, curve_b),
                           calculate_frechet_distance(dp, i, j - 1, curve_a, curve_b)),
                       calculate_euclid(curve_a[i], curve_b[j]))
    else:
        dp[i][j] = float("inf")
    return dp[i][j]


def get_similarity(curve_a, curve_b):
    dp = [[-1 for _ in range(len(curve_b))] for _ in range(len(curve_a))]
    similarity = calculate_frechet_distance(dp, len(curve_a) - 1, len(curve_b) - 1, curve_a, curve_b)
    # return max(np.array(dp).reshape(-1, 1))[0]
    return similarity


if __name__ == '__main__':
    Ta = [1, 2, 3, 4]
    Tb = [7, 8, 9]
    print(get_similarity(Ta, Tb))

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。