压缩字符串中更快的子序列识别

Alexander Tiskin

压缩字符串中更快的子序列识别

数据结构与算法 2011-11-10 v4 计算复杂性离散数学

作者: Alexander Tiskin

摘要

压缩字符串上的计算是处理海量数据集的关键方法之一。我们考虑由直式程序 (SLP) 压缩的字符串上的局部子序列识别问题，这与 Lempel--Ziv 压缩密切相关。对于长度为 $\bar m$ 的 SLP 压缩文本和长度为 $n$ 的未压缩模式，C{\'e}gielski 等人给出了一种运行时间为 $O(\bar mn^2 \log n)$ 的局部子序列识别算法。我们将运行时间改进为 $O(\bar mn^{1.5})$ 。我们的算法也可用于在 $O(\bar mn^{1.5})$ 时间内计算压缩文本与未压缩模式之间的最长公共子序列；而模式也被压缩的同一问题已知是 NP 难的。

关键词

string algorithms succinct data structure source coding

引用

@article{arxiv.0707.3407,
  title  = {Faster subsequence recognition in compressed strings},
  author = {Alexander Tiskin},
  journal= {arXiv preprint arXiv:0707.3407},
  year   = {2011}
}

相关论文

查看更多相关论文 →