同余最短路

一、引言:问题的起源
在算法竞赛的数学部分中,同余理论是一个重要部分。它以一种优雅的方式将无限的整数世界映射到有限的剩余类中,为我们处理与整除、余数、周期性相关的问题提供了独特的视角。而当我们将同余理论与图论中的最短路算法相结合时,一个精巧的算法模型——同余最短路——便应运而生。
这个模型专门解决一类特定形式的问题:给定
这类问题最经典的形式或许是“购物凑单”或“邮票面值”问题,更学术化的名称是**弗罗贝尼乌斯硬币问题 (Frobenius Coin Problem)**。
弗罗贝尼乌斯硬币问题:
给定一组互质的正整数,求不能由这组数的非负整数线性组合构成的最大整数。这个最大数被称为弗罗贝尼乌斯数,记作 。
当
如果我们尝试用动态规划来解决,可能会定义
这正是同余最短路大显身手的舞台。其核心思想在于,我们不需要关心每一个具体的数值,而是关心这些数值在模某个数意义下的“性质”。通过将无限的数值集合根据余数进行分组,我们将一个看似无限的问题转化为了一个在有限顶点图上的最短路问题。
二、核心思想:构建同余图
同余最短路的威力源于其巧妙的建模过程。我们将一步步拆解这个过程,揭示其背后的数学原理。
1. 选取模数
我们的目标是利用同余的性质来压缩状态。第一步,也是最关键的一步,是选取一个模数
为什么选择
- 状态压缩:我们即将把所有整数按模
的余数分为 个类。选择最小的 作为模数,意味着我们将要构建的图的顶点数最少,从而降低了算法的时空复杂度。 - 结构简化:将
作为模数后,它在模型中的角色会变得特殊而简单,我们只需要关注其他 个数 的影响。
2. 定义图的顶点
选定模数
- **顶点集合
**: 。 - 顶点
的含义:顶点 代表所有形如 ( ) 的整数集合。例如,如果 ,顶点 就代表 这个集合。
3. 定义图的边与权值
我们的目标是找到能被凑出的数。考虑一个已经被凑出的数
这个加法操作在我们的同余图上如何体现呢?
- 设
。 - 那么
。
这意味着,从一个属于剩余类
- **边的集合
**:对于图中的任意一个顶点 ,以及给定的任意一个整数 ( ),我们都构建一条有向边。 - **边的权值
**:这个跳跃的“代价”是多少呢?我们为了实现这个状态转移,付出的代价是加上了数值 。所以,这条边的权值就是 。
至此,一个带权有向图已经构建完成。这个图有
4. 最短路的含义
图建好了,但最短路是什么?它和我们最初的问题有什么关系?
让我们重新定义一下我们要求解的目标。对于每一个剩余类
我们将这个最小数记为
- 如果
存在,那么任何其他模 余 的数 (其中 ),是否也能被凑出呢?答案是肯定的。因为 是 的倍数,而 本身就是可用的“硬币”。所以我们可以通过在 的基础上加若干个 来得到 。 - 因此,
成为了一个分界点。对于所有模 余 的数,小于 的都凑不出来,大于等于 的都能凑出来。
现在,我们把
- **源点 (Source)**:我们从哪里开始凑数?自然是从
开始,不选任何数时的总和是 。数字 模 余 。所以,我们可以不费任何代价地“得到”一个在剩余类 中的数,这个数就是 本身。因此,我们将图的源点设为顶点 ,并且它的初始“距离”为 。 的图论解释: 正是从源点 出发,到达顶点 的最短路径长度。
为什么?
考虑一条从源点
这条路径对应的操作是:从初始值
路径的总长度(所有边权之和)就是
这条路径的终点是
最短路算法(如Dijkstra)正是为我们寻找一个总和最小的边权序列,使得从源点
5. 算法流程总结
现在,我们可以将整个算法流程串联起来:
- 预处理:在给定的
个数 中,找到最小的数,记为 。不妨假设 。 - 建图:
- 创建一个包含
个顶点的图,编号为 。 - 对于每个顶点
和每个 ( ),添加一条从 到 的有向边,边权为 。
- 创建一个包含
- 初始化:
- 创建一个距离数组
,大小为 。 。 对于所有 。
- 创建一个距离数组
- 求解:
- 以顶点
为源点,在该图上运行一次单源最短路算法。 - 由于所有边权
都是正数,使用 Dijkstra 算法是最高效的选择。
- 以顶点
- 解释结果:
- 算法结束后,
的值就是能被 凑出的、模 余 的最小非负整数。 - 如果某个
仍然是 ,说明任何模 余 的数都无法被凑出。这种情况仅在 时才可能发生。若 ,则所有能凑出的数都必须是 的倍数,因此那些模 余数不是 的倍数的顶点将不可达。
- 算法结束后,
这个模型的时间复杂度主要由 Dijkstra 算法决定。使用优先队列优化的 Dijkstra,时间复杂度为
三、经典模型与代码实现
我们通过一个具体问题来实践同余最短路的核心思想。这个问题完美地诠释了如何将一个看似与图论无关的数论问题,转化为高效的最短路求解。
问题:跳楼机 (洛谷 P3403)
题意概括:
你在一座层高的大楼的第1层。有三种移动方式:向上移动 层、向上移动 层、向上移动 层。问你总共能到达多少个不同的楼层(包括第1层)。
解题思路
这个问题可以被转化为:求形如
这等价于求解:非负整数线性组合
选取模数: 我们从
中选择最小的一个作为模数 。为了方便,我们先将这三个数排序,令 为另外两个数。我们选择 。构建模型:
- 顶点: 我们的图有
个顶点,编号为 。顶点 代表所有可以通过 组合出的、模 余 的数值集合。 - 最短路含义: 我们定义
为,能凑出的、模 余 的最小数值。 - 边: 我们从数值
开始构造。如果当前已经能凑出数值 ,再向上走 层,就得到 。这个操作在图上体现为一条边。对于任意顶点 ,我们连接两条边:- 一条从
指向 ,边权为 。 - 一条从
指向 ,边权为 。
为什么不考虑 ?因为 是模数,它的作用是填充。一旦我们得到了模 余 的最小数 ,所有其他模 余 的可达数都可以通过在 的基础上加若干个 得到。这个填充步骤在最后统计答案时处理。
- 一条从
- 顶点: 我们的图有
运行Dijkstra:
- 以顶点
为源点,因为不进行任何移动时,我们能达到的数值是 (对应楼层是1),它模 余 。所以 。 - 其他所有
初始化为无穷大。 - 运行一次Dijkstra算法,计算出从源点
到所有其他顶点 的最短路径长度,即 的值。
- 以顶点
计算最终答案:
- 算法结束后,
就是能凑出的、模 余 的最小偏移量。对应的楼层是 。 - 对于每个余数
,所有可达的、模 余 的偏移量为 。 - 我们要统计这些偏移量中有多少个小于等于
。 - 如果
,那么这个余数对应的所有楼层都无法到达,贡献为 。 - 如果
,那么满足条件的偏移量 为 。解得 。 - 由于
是非负整数,它可以取 。总共有 个值。 - 将所有余数
的贡献累加起来,即为总共可以到达的楼层数。
- 算法结束后,
C++ 代码实现
1 |
|
- 代码解释
a
数组存储 ,排序后a[0]
作为模数。d[i]
存储凑出模a[0]
余i
的最小数值和。dijk
函数实现了Dijkstra算法,用a[1]
和a[2]
作为图的边权进行松弛操作。- 最终答案的计算中,
h > d[i]
判断了最小可达楼层1+d[i]
是否在范围内。h-1
是偏移量的上限。 (h - 1 - d[i]) / a[0] + 1
计算了在余数i
这一类中,有多少个可达的楼层。
- 复杂度分析
- 时间复杂度:
。其中 是 中的最小值。图的顶点数是 ,边数是 。Dijkstra算法的复杂度为 。 - 空间复杂度:
。主要由距离数组d
、访问数组v
和优先队列pq
决定。
- 时间复杂度:
问题:墨墨的等式 (国家集训队)
题意概括:
给定个非负整数 和一个区间 。求有多少个整数 ,使得关于 的方程 存在非负整数解。
解题思路
这个问题等价于,求由集合
预处理与模数选择:
- 方程中的
项对能表示出的数值集合没有贡献(除了0本身,但本题区间从1开始),可以忽略。 - 我们从所有正的
中,选取最小的那个作为模数 。将这个最小数记为a[0]
。
- 方程中的
构建模型与求解:
- 与前例完全一致,我们构建一个以
为顶点的图。 表示能凑出的、模 余 的最小值。- 以
为源点,用其他 ( ) 作为边权,运行Dijkstra算法,求出所有的 。
- 与前例完全一致,我们构建一个以
区间统计:
- 我们的目标是计算区间
内的可达数。直接计算区间较为繁琐,我们可以利用前缀和思想,将问题转化为count(r) - count(l-1)
,其中count(T)
函数计算在闭区间 内有多少个可达数。 count(T)
的计算方法如下:- 遍历所有余数
。 - 对于每个
,最小可达数是 。 - 如果
,那么在 内,这个剩余类贡献的可达数有 只要它们 。 - 数量为
。 - 将所有余数的贡献累加即可。
- 遍历所有余数
- 我们的目标是计算区间
C++ 代码实现
1 |
|
代码解释
- 程序首先读入数据,并过滤掉所有为0的
,因为它们对构造正整数没有帮助。 - 接着对有效的
排序并去重,a[0]
自然成为最小的非零系数,被用作模数。 dijk
函数的逻辑与前例相同,构建并求解同余最短路模型。cnt(T)
函数实现了计算 区间内可达数数量的逻辑。- 最终答案通过
cnt(r) - cnt(l - 1)
计算得出,体现了前缀和思想。
- 程序首先读入数据,并过滤掉所有为0的
复杂度分析
- 时间复杂度:
。其中 是所有正 中的最小值。Dijkstra算法是主要耗时部分。 - 空间复杂度:
。用于存储图相关的数组。
- 时间复杂度:
四、模型变种与拓展
掌握了基本模型后,我们来看一些常见的变种。同余最短路的强大之处在于其模型的灵活性,通过微调图的定义或最终答案的计算方式,可以解决一系列相关问题。
变种一:区间内可表示数的数量
题意概括:
给定个正整数 和一个上限 。问在闭区间 内,有多少个整数可以被这 个数通过非负整数线性组合表示出来?
解题思路
这个问题的前半部分与之前完全相同。我们依然需要求解出每个剩余类
运行同余最短路: 照常选取最小的数
作为模数,运行Dijkstra算法,得到所有 。分剩余类统计: 对于每个剩余类
:- 我们知道,这个类中能被表示的数是
。 - 我们需要统计这些数中有多少个是小于等于
的。 - 首先,如果
,那么这个剩余类中所有能被表示的数都大于 ,对答案的贡献是 。 - 如果
,那么能被表示的数是 。 - 解不等式
,得到 。 - 由于
是非负整数,所以 可以取 。 - 总共有
个可行的 值。 - 因此,对于这个剩余类
,在 区间内(如果 ,它本身不在[1,T]内,但我们通常求的是总价值,如果题目严格要求在[1,T]内,计算时需注意)能表示的数的数量就是 。
- 我们知道,这个类中能被表示的数是
汇总答案: 将所有剩余类的贡献加起来,就是最终答案。
如果题目要求的是 ,而我们算出的 了,那么总数需要减1(如果 )。不过一般这类问题求的是能凑出的价值种类数,0是否计入看题意。我们这里的代码将计算所有小于等于T的非负整数。
C++ 代码实现
1 |
|
代码注释与解释
- 前半部分的Dijkstra与前一示例完全一致。
- 核心区别在于
main
函数的后半部分。 - 我们遍历所有剩余类
。 - 对于每个
,检查d[i]
(即 ) 是否超过了上限t
。 - 如果
t >= d[i]
,则计算这个类对答案的贡献(t - d[i]) / a[0] + 1
,并累加到ans
。 unique
函数在这里是可选的,但如果输入数据可能包含重复的数值,这是一个好习惯。它将重复的元素移动到数组末尾并返回一个指向不重复范围末尾的迭代器。
复杂度分析
- 时间复杂度:
。瓶颈依然是Dijkstra算法。 - 空间复杂度:
。
- 时间复杂度:
变种二:带限制的组合 (初步探讨)
一个更复杂也更常见的拓展是,当某些或所有物品的数量是有限的时候,问题就从“无限背包”过渡到了“多重背包”。如果物品的种类、数量、以及背包容量都很大,经典的多重背包DP(无论是二进制拆分还单调队列优化)都会失效。
同余最短路可以与背包DP结合,形成一种强大的“混合”解法。
问题雏形:
假设有种物品,其中 种物品(价值为 )可以无限使用,但第1种物品(价值为 )只有 个。问能凑出的总价值有多少种?
这是一个简化的混合背包问题。直接使用同余最短路模型会遇到困难,因为我们不能再无限制地使用
思路转换:
既然
第一步: 暂时忽略受限物品
。对所有无限物品 运行同余最短路。- 模数
。 - 图的顶点是
。 - 边是基于
构建的。 - 运行Dijkstra后,得到
,表示仅使用无限物品时,凑出模 余 的数的最小代价。
- 模数
第二步: 引入受限物品
的影响。- 现在我们有
个 可以使用。这 个 可以看作是一个独立的多重背包问题。 - 我们可以定义一个新的DP状态,例如
表示使用了 个 后,凑出的数模 余 的最小代价。但这似乎又回到了二维DP的复杂境地。
- 现在我们有
一个更巧妙的视角是,把对
- 初始时,我们有
数组。 - 现在考虑增加一个
。对于图上任意一个顶点 ,如果我们当前能凑出的最小代价是 ,那么加上一个 后,我们就到达了 这个状态,代价是 。 - 这不就是又一次松弛操作吗?
- 我们可以把
个 的使用过程,看成 轮更新。但这样做效率不高。
正确的处理方式通常是分层图或者直接在DP状态上想办法。让我们考虑一个更直接的DP。
令
显然,初始时
然后我们用
我们可以把 for (int i = 0; i < m; ++i) f[(i + k*a1)%m] = min(f[(i + k*a1)%m], f[i] + k*a1);
但这需要保证更新顺序,以防一个物品被重复使用。正确的背包式更新应该是 for (int i = m-1; i>=0; --i)
的倒序循环(01背包思想)。
更高效的做法是利用单调队列。对于
五、同余最短路与背包问题的深度融合
之前我们探讨了所有物品数量都无限的理想情况。然而,在更具挑战性的问题中,往往会出现部分物品数量有限,部分物品数量无限的混合背包模式。当数据规模使得传统动态规划方法(如二进制拆分、单调队列优化多重背包)因状态空间过大而失效时,同余最短路便成为了破局的关键。
其核心思路是:利用同余最短路处理无限物品,再将有限物品视作对结果的“扰动”或“更新”。
题意概括:
给定种物品,其中 种物品(价值为 ,数量为 )是有限的,另外 种物品(价值为 )是无限的。求能凑出的最大不可达价值,或是在某个范围内能凑出多少种价值。
为了简化模型,我们通常选择一个无限物品的价值作为模数,假设是
基础框架: 首先,完全不考虑有限物品,只用无限物品
跑一次同余最短路。得到数组 ,表示仅用无限物品凑出模 余 的最小代价。这是我们的初始状态。引入有限物品: 现在,我们要把有限物品的效果加进来。假设有一个有限物品,价值为
,数量为 。我们可以用它来更新当前的 数组。一个朴素的想法是,对于每个 ,做 次更新,每次更新都像01背包一样遍历所有状态。这等价于对每个物品 做 次01背包。更进一步,我们可以用二进制拆分把数量为
的物品拆成 个独立的01背包物品。对于每个拆分出的价值为 的物品,我们对整个 数组做一次更新:
为了避免一个拆分出的物品在一个更新轮次中被多次使用,这个更新需要倒序遍历 。这个方法可行,但当有限物品种类较多时,复杂度依然可能很高。
最高效的方法是利用单调队列。
单调队列优化更新
当我们引入一个价值为
它可以由原来的
即:
这个式子具有明显的滑动窗口最小值的特征,是单调队列优化的绝佳场景。
具体操作如下:
我们将所有顶点
为什么这么分组?因为在一个组内,例如所有模
因此,对价值为
对于每个组
- 构造一个序列,包含该组的所有顶点:
。 - 对于这个序列上的每一个点
,我们要求 。 - 这是一个标准的滑动窗口问题。窗口大小为
。我们需要求窗口内d[v] - k*b
的最小值,其中v
是窗口内的点,k
是从窗口起点开始的偏移量。 - 使用单调队列,对每个组的更新可以在线性时间内完成。
总的更新复杂度:对于一个价值为
示例:[Codeforces 510D] Fox And Jumping
题意概括:
有张卡片,每张卡片有一个数字 。还有一个代价 。你可以选择一个卡片子集。所选子集的 必须为 1。求满足条件的子集的最小总代价。
这个问题看起来和同余最短路关系不大,但我们可以转换视角。
题目要求
换个思路,我们要求
让我们回到问题的核心:我们选择了一些卡片,它们的 mask
所代表的素因子时的最小代价。这个 mask
太大了。
正确的打开方式是发现
假设我们选择了第
这等价于,我们需要用其他卡片凑出一个数
这个问题可以转化为:我们有一堆物品,价值是
这依然很复杂。但同余最短路提供了一个全新的视角。
我们将问题看作一个最短路问题。
- 顶点:
的所有可能值。由于 ,因子可能很多。不行。
让我们换个角度。如果我们将一张卡片的代价看作是边权,那么我们是在一张图上找一条路径。
- 状态/顶点: 当前已选卡片集合的
。 - 初始状态: 可以选择任意一张卡片
作为起点,当前状态为 ,代价为 。 - 状态转移: 如果当前状态为
(即 ),再选一张卡片 ,新状态为 ,总代价增加 。 - 目标: 找到一条从某个初始状态到状态
的最短路。
这正是一个最短路问题!图的顶点是所有可能出现的
- 图的顶点: 所有
的因子。 - 距离数组:
d[g]
表示使得当前 为 的最小代价。 - Dijkstra流程:
- 初始化
d[g] = infinity
for allg
,d[0] = 0
(或者一个虚拟源点)。 - 将所有卡片作为初始路径:对于每张卡片
,d[l_i] = min(d[l_i], c_i)
,并将(c_i, l_i)
压入优先队列。 - 跑 Dijkstra。每次取出
(cost, g)
,遍历所有卡片 ,用d[g] + c_j
更新d[gcd(g, l_j)]
。
- 初始化
这个做法的顶点数是所有 g
-> gcd(g, l_j)
,g
只会变小或不变。这提示我们也许不需要完整的 Dijkstra。
我们可以将所有卡片按代价从小到大排序。
但最直接的同余最短路模型是:
选择一个数
这个题中,每个物品的代价不同,不能直接作为边权。
- 模数:
选谁?选 ? - 边: 对于每个顶点
,以及每张卡片 ,连边 ,边权为 。 - 源点:
。 。
跑 Dijkstra,得到 。现在我们有了一系列(余数,最小代价)对。
对于每个 ,我们知道凑出模 余 的数至少需要 的代价。我们凑出的实际数值是 。我们不知道 具体是多少,只知道 且 是通过价值总和为 的卡片凑成的。
这似乎无法处理 条件。
这道题的正确解法是状态为
让我们回到一个更标准的混合背包问题。
题意概括:
有种物品。一种价值为 的大物品,无限量。 种价值为 ,数量为 的小物品。给定背包容量 ,问不超过 的容量,最多能装多大价值的物品?
- 无限物品处理: 大物品是无限的,选它作模数
。 - 有限物品处理: 小物品是有限的。我们定义
为只用小物品,凑出价值模 余 时,所需的最小实际价值。初始时 。 - 多重背包DP: 对于每一种小物品
,我们用它来更新 数组。这是一个多重背包问题,可以用单调队列优化。for
每一个小物品for
from to- 用单调队列更新组
内的 值。
- 最终统计: 经过所有小物品的更新后,
存储了只用小物品凑出模 余 的最小总价值。 - 现在考虑大物品。对于每个余数
,我们已经用价值 的小物品凑出了模 余 。如果 ,那么我们可以用大物品 来填充剩余的容量。 - 我们可以填充
个大物品。总价值是 。 - 这个值等于
。 - 最终答案就是
。
C++ 代码实现 (混合背包)
1 |
|
代码解释:
m
是无限物品的价值,作为模数。V
是背包总容量。d[i]
含义如上所述。solve(w, c)
函数用一个数量为c
价值为w
的物品来更新d
数组。- 内部按
__gcd(w, m)
分组。 - 对每个组,我们遍历其中的点
u
。u
可以看作是链上的第i
个点。我们要找的是d[u-j*g]
的某个最优值。通过变换d[u] = min(d[u_k] + (i-k)*w)
,转化为求min(d[u_k] - k*w) + i*w
。所以单调队列维护d[u_k] - k*w
的最小值。 val[u] = d[u] - (ll)i * w
就是这个要维护的值。- 最终的答案统计逻辑如理论推导。
复杂度分析:
- 时间复杂度: 每个有限物品的更新是
。若有 个有限物品,则为 。 - 空间复杂度:
。
- 时间复杂度: 每个有限物品的更新是
六、另一视角:分层图与状态扩展
同余最短路本质上是一种状态压缩,将无穷多的整数值压缩到
分层图最短路是一种建模技巧,当图中边的使用会消耗某种资源,或者通过边时会改变某种状态时,可以把这个资源/状态维度加入到图的顶点表示中。
问题雏形:
给定个整数 和一个特殊操作。普通操作是加上任意一个 ,代价为 。特殊操作可以执行最多 次,例如,将当前值翻倍,代价为 。求凑出某个目标值 的最小代价,或能凑出的值的某些性质。
这里,除了当前值的余数外,我们还需要记录特殊操作的使用次数。
- 状态:
,表示当前凑出的值模 余 ,且已经使用了 次特殊操作。 - 图的顶点: 顶点集合是
。图的大小是 。 - 图的边:
- 普通边: 对于每个状态
,以及每个 ,连接一条边到 ,边权为 。这代表不使用特殊操作,只在第 层内部转移。 - 特殊边/层间边: 对于每个状态
,如果 ,可以执行一次特殊操作。假设操作是将值 变成 ,代价为 。那么我们连接一条从 到 的边,边权为 。- 这里的
是个麻烦点。如果 的值依赖于 本身而不仅仅是 ,比如 ,那么新状态的余数是 。但我们只知道 ,不知道 的确切值。 。所以新余数是 。这是一个从一个状态 连接到另一个状态 的边。- 这种边的终点依赖于当前的最短路长度,这意味着图的结构是动态变化的。这使得标准的 Dijkstra 算法失效。
- 这里的
- 普通边: 对于每个状态
但是,如果特殊操作对余数的影响是固定的,问题就简化了。
例如,特殊操作是“加上一个特殊的数值
- 层间边: 从
到 ,边权为 。
示例: 小明的游戏 (洛谷 P4554)
题意概括:
在一个的棋盘上,分布着两种类型的格子。从一个起点移动到终点,规则如下:移动到相邻的同类型格子,花费为0;移动到相邻的不同类型格子,花费为1。求从起点到终点的最小总花费。
此问题虽然不涉及数论,但它完美地展示了另一个与最短路算法紧密相关的重要思想:根据图的特性选择最高效的算法。同余最短路的核心引擎是Dijkstra算法,但当图的边权结构非常特殊时(例如本题中只有0和1),我们可以采用更为高效的专门算法,如0-1广度优先搜索。
解题思路
这是一个典型的边权仅为0或1的最短路问题。对于这类问题,使用双端队列(deque
)实现的0-1广度优先搜索(BFS)是最佳选择。它比标准的Dijkstra算法(使用优先队列)效率更高。
状态与距离: 状态就是棋盘上的坐标
(x, y)
。我们用数组d[x][y]
记录从起点到(x, y)
的最小花费。0-1 BFS 核心:
- 创建一个双端队列
q
。 - 将起点入队,其距离
d[sx][sy]
初始化为0。 - 从队列头部取出一个状态
(x, y)
进行扩展。 - 遍历其所有相邻格子
(nx, ny)
:- 计算移动的费用
w
(如果格子类型不同则w=1
,相同则w=0
)。 - 如果发现一条更短的路径 (即
d[nx][ny] > d[x][y] + w
),则更新d[nx][ny]
。 - 关键:如果
w=0
,将(nx, ny)
插入到队头;如果w=1
,则插入到队尾。
- 计算移动的费用
- 创建一个双端队列
原理: 将0花费的移动插入队头,保证了队列中的节点始终按距离大致有序。任何时候,队头元素的花费总是最小的(或与之后元素相等),这使得我们可以像普通BFS一样处理节点,而不需要优先队列的对数时间开销。
C++ 代码实现
1 |
|
代码解释
- 主函数处理多组测试数据,循环直到输入
n=0, m=0
。 bfs
函数实现了0-1广度优先搜索。- 使用
deque
作为核心数据结构。 d[x][y]
存储到达(x, y)
的最小花费。- 松弛操作后,根据花费
w
的值决定新节点是从队头还是队尾入队。
- 主函数处理多组测试数据,循环直到输入
复杂度分析
- 时间复杂度:
。每个格子最多入队出队一次,每次扩展是常数时间。 - 空间复杂度:
。主要由距离数组d
和双端队列q
占用。
- 时间复杂度:
七、实践中的考量与陷阱
理论是完美的,但实践中总会遇到各种细节问题。
1. 模数的选择
- 常规选择: 总是选择给定的可无限使用的数中最小的那个,设为
。这使得图的规模 ( 个顶点, 条边) 最小,从而优化时空复杂度。 - 无无限物品: 如果所有物品都有限,同余最短路模型不直接适用。需要转为纯粹的多重背包问题。
- 特殊情况: 如果题目中只有一个数
,那么能表示的数就是 。如果有一堆数,但其中一个特别小,比如 ,那所有正整数都能表示出来,问题变得平凡。同余最短路在 都相对“正常”大小时最能发挥威力。
2. 处理非互质情况
我们之前大多假设
- 可达性: 任何由
线性组合出的数 ,必然是 的倍数,因为每个 都是 的倍数。 - 模型影响: 在以
为模数的图上,我们从源点 出发,经过边 ,边权 。由于 是 的倍数,所以我们能到达的所有顶点的编号 都必须是 的倍数。 - 结果: 对于所有
,如果 ,那么 将永远是 。 - 解题影响:
- 求最大不可达数: 如果
,那么有无穷多个数无法表示(例如所有不是 的倍数的数)。这种情况下问题通常会保证互质,或者问法会改变。 - 求区间内可达数: 我们的统计公式依然有效。对于
的情况, ,贡献为0,这是正确的。只需照常计算即可。
- 求最大不可达数: 如果
3. 数据范围与溢出
long long
的必要性: 最短路长度 可能会很大。 的一个粗略上界是 。如果 和 是 级别,int
足够。但如果它们更大,或者在混合背包模型中,有限物品的价值或数量很大,那么 很容易超过int
范围。始终使用long long
存储距离是一个安全的习惯。- INF 的取值: 无穷大
INF
的值需要足够大,要大于任何可能出现的合法路径长度。一个安全的做法是设为 这种量级,或者直接设为1e18
。 - 中间计算: 在区间统计问题中,涉及
(T - d[i]) / m
这样的计算。如果 是long long
,要确保整个表达式都以long long
类型计算,避免中间溢出。
4. Dijkstra 与 SPFA
- Dijkstra 的优势: 在同余最短路的基本模型和大多数变种中,边权(即
的值)都是正数。因此,使用优先队列优化的 Dijkstra 是最高效和稳妥的选择。其复杂度 通常优于 SPFA。 - SPFA 的可能性: SPFA 也能解决单源最短路问题。其期望复杂度是
,但在特殊构造的图上可以被卡到 。在同余最短路的图中,顶点和边分布较为均匀,被卡的风险相对较低。但没有理由不使用更稳定高效的 Dijkstra。 - 何时必须 SPFA: 只有当模型中出现了负权边时,才必须使用 SPFA。例如,某个特殊操作是“减去一个值”,代价为正,但数值变化为负。这种情况在标准同余模型中极为罕见。
八、写在最后
同余最短路,这个名字完美地概括了它的两个核心要素:同余理论与最短路算法。它为我们提供了一套优雅的范式,用以解决一类关于整数线性组合的计数与最值问题。
其精髓在于降维和转化:
- 通过选取模数
,它将一个在无限整数集上的问题,巧妙地映射到一个只有 个状态的有限空间中。每一个状态(顶点)代表一个完整的剩余类。 - 通过将加法操作定义为图的边,它将寻找“最小可达数”的组合问题,转化为图论中经典的单源最短路问题。
我们从最基础的弗罗贝尼乌斯硬币问题出发,看到了如何构建图、定义最短路的含义,并计算出最大不可达数。接着,我们拓展了模型,解决了区间内可达数的计数问题,展现了模型结果的强大解释力。
更进一步,我们深入探讨了它与背包DP的深刻联系。当面对混合背包问题时,同余最短路可以作为处理无限物品的基石,而有限物品则通过单调队列优化的动态规划过程,对最短路的结果进行高效的迭代更新。这种组合拳式的解法,是处理大规模混合背包问题的利器。
最后,通过分层图的视角,我们理解了如何将额外的约束(如操作次数限制)融入模型,进一步拓宽了其应用边界。
掌握同余最短路,不仅仅是学会一个算法模板。更重要的是理解其背后化无限为有限的数学思想,以及将代数问题图论化的建模技巧。这种思维方式,在算法竞赛的诸多领域,从数论到动态规划,再到计算几何,都无处不在,是通往更高层次解题能力的关键阶梯。
附录:例题选讲
AT_arc084_b Small Multiple
题意概括:
给定一个整数。求一个 的正整数倍中,数位之和最小的那个,并输出这个最小的数位和。
解题思路
这个问题可以被看作一个最短路问题。我们想要找到一个目标数,这个数需要满足两个条件:是
- 状态定义: “是
的倍数”这个条件,提示我们用模 的余数作为图的状态。我们建立一个有 个顶点的图,顶点编号为 。 - 最短路含义: 我们的优化目标是“数位和最小”。因此,我们定义
为,所有模 余 的数中,最小的数位和是多少。我们的最终目标就是 。 - 构建图 (状态转移): 我们如何从一个数得到另一个数?可以考虑两种基本操作来构建任意正整数:
- 乘以10: 如果我们有一个数
,我们可以得到 。如果 ,那么 。这个操作不改变数位和。因此,这对应一条从顶点 到 的边,权重为 0。 - 加1: 如果我们有一个数
,我们可以得到 。如果 ,那么 。这个操作使数位和增加1。这对应一条从顶点 到 的边,权重为 1。
- 乘以10: 如果我们有一个数
- 算法选择: 图中只有权重为0和1的边。这是0-1 BFS的经典应用场景,使用双端队列可以做到线性时间复杂度。
- 算法流程:
- 初始化距离数组
为无穷大。 - 起点是1。因为我们要找正整数倍。数1模
余1,数位和为1。所以d[1]=1
。 - 将状态1放入双端队列。
- 循环处理队列,每次从队首取出状态
u
。 - 对于
*10
操作,得到新状态v = (u*10)%K
。若d[v] > d[u]
,更新d[v]=d[u]
,并将v
推入队首。 - 对于
+1
操作,得到新状态v = (u+1)%K
。若d[v] > d[u]+1
,更新d[v]=d[u]+1
,并将v
推入队尾。 - 算法结束时,
d[0]
就是答案。
- 初始化距离数组
C++ 代码实现
1 |
|
代码解释
d[i]
存储模 余 的最小数位和。- 使用
deque
实现0-1 BFS。 - 从状态1开始,因为它代表了最小的正整数。
*10
转移对应0权边,放入队首;+1
转移对应1权边,放入队尾。- 最终
d[0]
就是所求的最小数位和。
复杂度分析
- 时间复杂度:
。每个顶点最多进出双端队列一次。 - 空间复杂度:
。用于存储距离数组和双端队列。
- 时间复杂度:
P2662 牛场围栏
题意概括:
有种长度为 的木料,每种无限。每根木料可以被截短 到 的任意整数长度。问用这些处理后(或不处理)的木料拼接,无法组成的最大围栏长度是多少。
解题思路
这个问题是弗罗贝尼乌斯硬币问题的一个直接但更复杂的应用。首先,我们需要确定我们拥有的所有“硬币”的面值,即所有可能使用的木料长度。
确定可用长度集合: 对于每一种原始长度为
的木料,我们都可以通过截短得到长度为 的新木料。我们将所有这些可能的新长度(且为正整数)汇集起来,形成一个大的可用长度集合 。选取模数: 同余最短路的标准做法是选择集合中最小的元素作为模数。我们首先找出集合
中最小的正整数,设为 。如果原始木料按长度升序排序为 ,那么最小的可用正长度显然是 。特殊情况: 如果我们计算出的最小可用长度
,这意味着我们可以凑出长度为1的围栏。因此,通过重复使用长度1的木料,我们可以凑出任意正整数长度的围栏。在这种情况下,不存在无法修建的最大长度,答案应为-1。构建模型:
- 我们建立一个有
个顶点的图,顶点编号为 。 的含义是:能凑出的、模 余 的最小总长度。- 图的边由集合
中的元素(除 自身外)确定。对于 中每一个不同于 的可用长度 ,它都对应着图中的一组转移:从任意顶点 可以到达 ,代价是增加了长度 。这对应着一条从 到 ,权重为 的边。
- 我们建立一个有
算法流程:
- 首先,生成所有唯一的、正的可用长度,并存入一个集合,同时确定最小可用长度
作为模数。 - 以
为模数,构建一个同余最短路图。由于需要为每个顶点和每个可用长度添加一条边,图的边数会非常多。 - 一个更高效的实现方式是,在Dijkstra算法的执行过程中动态地考虑这些边。当从优先队列中取出顶点
u
时,我们遍历所有可用长度j
,并尝试用d[u] + j
来松弛d[(u+j)%m]
。 - 以顶点
为源点,d[0]=0
,运行Dijkstra算法。 - 算法结束后,如果存在某个
仍然是无穷大,说明该余数无法被凑出,这意味着存在无穷多个长度无法修建,答案为-1。 - 否则,所有
都是有限值。无法修建的最大长度由弗罗贝尼乌斯数的公式给出: 。
- 首先,生成所有唯一的、正的可用长度,并存入一个集合,同时确定最小可用长度
C++ 代码实现
1 |
|
代码解释
- 首先读入数据,并将原始木料长度排序。
- 使用
std::set
来高效地生成所有唯一的、正的可用长度。set
的首个元素*s.begin()
即为最小可用长度。 - 该最小可用长度被选为模数
mod
。 - 检查特殊情况:如果集合为空(不可能,因为
)或最小可用长度为1,则输出-1。 dijk
函数实现了Dijkstra算法。与之前模型不同的是,边的信息(所有可用长度ual
)是全局的,在每次松弛时遍历使用。- 主函数在调用
dijk
后,检查是否有无法到达的余数(d[i] == INF
),若有则说明gcd > 1
,输出-1。 - 最后,根据公式
计算并输出答案。
复杂度分析
- 时间复杂度:
。其中mod
是最小可用正长度,|ual|
是唯一可用长度的数量。在题目约束下,mod
和|ual|
均不超过3000,该复杂度可以接受。 - 空间复杂度:
。主要用于存储距离数组和可用长度列表。
- 时间复杂度:
- Title: 同余最短路
- Author: YZY
- Created at : 2025-07-02 02:20:27
- Updated at : 2025-07-02 02:20:27
- Link: https://blog.dtoj.team/2025/07/02/同余最短路/
- License: 三金家的Y同学