中文

压缩字符串中更快的子序列识别

数据结构与算法 2011-11-10 v4 计算复杂性 离散数学

摘要

压缩字符串上的计算是处理海量数据集的关键方法之一。我们考虑由直式程序 (SLP) 压缩的字符串上的局部子序列识别问题,这与 Lempel--Ziv 压缩密切相关。对于长度为 mˉ\bar m 的 SLP 压缩文本和长度为 nn 的未压缩模式,C{\'e}gielski 等人给出了一种运行时间为 O(mˉn2logn)O(\bar mn^2 \log n) 的局部子序列识别算法。我们将运行时间改进为 O(mˉn1.5)O(\bar mn^{1.5})。我们的算法也可用于在 O(mˉn1.5)O(\bar mn^{1.5}) 时间内计算压缩文本与未压缩模式之间的最长公共子序列;而模式也被压缩的同一问题已知是 NP 难的。

关键词

引用

@article{arxiv.0707.3407,
  title  = {Faster subsequence recognition in compressed strings},
  author = {Alexander Tiskin},
  journal= {arXiv preprint arXiv:0707.3407},
  year   = {2011}
}
R2 v1 2026-06-29T02:01:59.280Z