
二分图的最优匹配(km算法).doc
3页二分图的最优匹配(二分图的最优匹配(KM 算法)算法)KM 算法用来解决最大权匹配问题: 在一个二分图内,左顶点为 X,右顶点为 Y,现对于每组左右 连接 XiYj 有权 wij,求一种匹配使得所有 wij 的和最大基本原理基本原理该算法是通过给每个顶点一个标号(叫做顶标)来把求最大权匹配的问题转化为求完备匹配的问 题的设顶点 Xi 的顶标为 A[ i ],顶点 Yj 的顶标为 B[ j ],顶点 Xi 与 Yj 之间的边权为 w[i,j]在 算法执行过程中的任一时刻,对于任一条边(i,j),A[ i ]+B[j]>=w[i,j]始终成立 KM 算法的正确性基于以下定理: 若由二分图中所有满足 A[ i ]+B[j]=w[i,j]的边(i,j)构成的子图(称做相等子图)有完备匹配, 那么这个完备匹配就是二分图的最大权匹配 首先解释下什么是完备匹配,所谓的完备匹配就是在二部图中,X 点集中的所有点都有对应的匹配 或者是 Y 点集中所有的点都有对应的匹配,则称该匹配为完备匹配 这个定理是显然的因为对于二分图的任意一个匹配,如果它包含于相等子图,那么它的边权和 等于所有顶点的顶标和;如果它有的边不包含于相等子图,那么它的边权和小于所有顶点的顶标和。
所以相等子图的完备匹配一定是二分图的最大权匹配 初始时为了使 A[ i ]+B[j]>=w[i,j]恒成立,令 A[ i ]为所有与顶点 Xi 关联的边的最大权,B[j] =0如果当前的相等子图没有完备匹配,就按下面的方法修改顶标以使扩大相等子图,直到相等子图 具有完备匹配为止 我们求当前相等子图的完备匹配失败了,是因为对于某个 X 顶点,我们找不到一条从它出发的交 错路这时我们获得了一棵交错树,它的叶子结点全部是 X 顶点现在我们把交错树中 X 顶点的顶标 全都减小某个值 d,Y 顶点的顶标全都增加同一个值 d,那么我们会发现: 1)两端都在交错树中的边(i,j),A[ i ]+B[j]的值没有变化也就是说,它原来属于相等子图,现在仍属于相等子图2)两端都不在交错树中的边(i,j),A[ i ]和 B[j]都没有变化也就是说,它原来属于(或不属于)相等子图,现在仍属于(或不属于)相等子图 3)X 端不在交错树中,Y 端在交错树中的边(i,j),它的 A[ i ]+B[j]的值有所增大它原来不属于相等子图,现在仍不属于相等子图 4)X 端在交错树中,Y 端不在交错树中的边(i,j),它的 A[ i ]+B[j]的值有所减小。
也就说,它原来不属于相等子图,现在可能进入了相等子图,因而使相等子图得到了扩大针对之后例子中 x1->y4 这条边)现在的问题就是求 d 值了为了使 A[ i ]+B[j]>=w[i,j]始终成立,且至少有一条边进入相等子图, d 应该等于: Min{A[i]+B[j]-w[i,j] | Xi 在交错树中,Yi 不在交错树中}改进改进以上就是 KM 算法的基本思路但是朴素的实现方法,时间复杂度为 O(n4)——需要找 O(n)次增 广路,每次增广最多需要修改 O(n)次顶标,每次修改 顶标时由于要枚举边来求 d 值,复杂度为 O(n2) 实际上 KM 算法的复杂度是可以做到 O(n3)的我们给每个 Y 顶点一个“松弛量”函数 slack,每次 开 始找增广路时初始化为无穷大在寻找增广路的过程中,检查边(i,j)时,如果它不在相等子图中,则 让 slack[j]变成原值与 A[ i ]+B[j]-w[i,j]的较小值这样,在修改顶标时,取所有不在交错树中的 Y 顶点的 slack 值中的最小值作为 d 值即可但还要注意一点:修改顶标后,要把所有的不在交错树中的 Y 顶点的 slack 值都减去 d(因为:d 的定义为 min{ (x,y)| Lx(x)+ Ly(y)- W(x,y), x∈ S, y∉ T }(关键,关键),此时属于S 的 X 均已经减去 d 了,所以不属于 T 的 y 也要减去 d,防止下次循环更改出错)。
Kuhn-Munkras 算法流程: (1)初始化可行顶标的值 (2)用匈牙利算法寻找完备匹配 (3)若未找到完备匹配则修改可行顶标的值 (4)重复(2)(3)直到找到相等子图的完备匹配为止已知 K5,5 的权矩阵为 y1 y2 y3 y4 y5 x1 3 5 5 4 1 x2 2 2 0 2 2 x3 2 4 4 1 0 x4 0 1 1 0 0 x5 1 2 1 3 3求最佳匹配,其中 K5,5 的顶划分为 X={xi},Y={yi},i=1,2,3,4,5. 解: (1)取可行顶标 l(v)为 l(yi)=0,i=1,2,3,4,5;l(x1)=max{3,5,5,4,1}=5,l(x2)=max{2,2,0,2,2} =2,l(x3)=max(2,4,4,1,0}=4,l(x4)=max{0,1,1,0,0}=1,l(x5)=max{1,2,1,3,3}=3.(2) Gl 及其上之匹配见图 7.12 这个图中 ο(G-x2)=3,由 Tutte 定理知无完备匹配需要修改顶标 (3) u=x4,得 S={x4,x3,x1},T={y3,y2},N(S)=T,于是 al=min(l(x)+l(y)-w(xy)}=1. (x∈S,y∈T) x1,x2,x3,x4,x5 的顶标分别修改成 4,2,3,0,3;y1,y2,y3,y4,y5 的顶标分别修改成 0,1,1,0,0。
4) 用修改后的顶标 l 得 Gl 及其上面的一个完备匹配如图 7.13图中粗实线给出了一个最佳匹配,其 最大权是 2+4+1+4+3=14我们看出:al>0;修改后的顶标仍是可行顶标;Gl 中仍含 Gl 中的匹配 M;Gl 中至少会出现不属于 M 的 一条边,所以会造成 M 的逐渐增广得到可行顶标后求最大匹配:得到可行顶标后求最大匹配:书上这部分没讲,实际上是这样的,对于上面这个例子来说,通过 Kuhn-Munkres 得到了顶标 l(x)= {4,2,3,0,3},l(y)={0,1,1,0,0},那么,对于所有的 l(xi)+l(yj) = w(i,j),在二分图 G 设置存在边 w(i,j)再用匈牙利算法求出最大匹配,再把匹配中的每一边的权值加起来就是最后的结果了 1 2 3 || 3 2 4 || 2 3 5 |若要对这个完全二分图求最佳匹配初始化:Lx(1)= max{ y| w(1,y), 1 Y 3-> X 1我们把寻找增广路径失败的 DFS 的交错树中,在 X 部顶点集称之为 S, 在 Y 部的顶点集称之为 T则 S= { 1, 2 },T= { 3 }。
现在我们就通过修改顶标值来扩大等价子图,如何修改1) 我们寻找一个 d 值,使得 d= min{ (x,y)| Lx(x)+ Ly(y)- W(x,y), x∈ S, y∉ T },因些,这时 d= min{Lx(1)+Ly(1)-W(1,1), Lx(1)+Ly(2)-W(1,2), Lx(2)+Ly(1)-W(2,1), Lx(2)+Ly(2)-W(2,2) }=min{ 3+0- 1, 3+0-2, 4+0-3, 4+0-2 }= min{ 2, 1, 1, 2 }= 1寻找最小的 d 是为了保证修改后仍满足性质对于边 有 Lx(x)+ Ly(y)>= W(x,y)2) 然后对于顶点 x1. 如果 x∈ S 则 Lx(x)= Lx(x)- d2. 如果 x∈ T 则 Ly(x)= Ly(x)+ d3. 其它情况保持不变如此修改后,我们发现对于边,顶标 Lx(x)+ Ly(y) 的值为1. Lx(x)- d+ Ly(y)+ d, x∈ S, y∈ T2. Lx(x)+ Ly(y), x∉ S, y∉ T3. Lx(x)- d+ Ly(y), x∈ S, y∉ T。
4. Lx(x)+ Ly(y)+ d, x∉ S, y∈ T易知,修改后对于任何边仍满足 Lx(x)+ Ly(y)>= W(x,y),并且第三种情况顶标值减少了 d,如此定会使等价子图扩大就上例而言: 修改后 Lx(1)= 2, Lx(2)= 3, Lx(3)= 5, Ly(1)= 0, Ly(1)= 0, Ly(2)= 0, Ly(3)= 1这时 Lx(2)+Ly(1)=3+0=3= W(2,1),在等价子图中增加了一条边,等价子图变为:如此按以上方法,得到等价子图的完美匹配另外计算 d 值的时候可以进行一些优化定义 slack(y)= min{ (x,y)| Lx(x)+ Ly(y)- W(x,y),x∈ S, y∉ T }这样能在寻找增广路径的时候就顺便将 slack 求出。
