无重采样的噪声排序
数据结构与算法
2007-07-10 v1
摘要
本文研究了无重采样的噪声排序问题。在该问题中,存在一个未知顺序 aπ(1)<...<aπ(n),其中 π 是 n 个元素上的排列。输入是 (2n) 个形式为 q(ai,xj) 的查询状态,其中若对于所有 i=j 的对都有 π(i)>π(j),则 q(ai,aj)=+ 的概率至少为 1/2+\ga,这里 \ga>0 是常数,且对于所有 i 和 j 有 q(ai,aj)=−q(aj,ai)。假设误差是独立的。给定查询状态,目标是找到最大似然顺序。换言之,目标是找到一个排列 σ,使得满足 q(σ(i),σ(j))=− 且 σ(i)>σ(j) 的对数最小化。如此定义的问题是输入分布上的反馈弧集问题,每个输入都是一个由线性顺序的噪声扰动获得的竞赛图。注意,当 \ga<1/2 且 n 很大时,不可能恢复原始顺序 π。已知竞赛图上的加权反馈弧集问题通常是 NP-hard 的。在此,我们提出了一种运行时间为 nO(γ−4) 且采样复杂度为 Oγ(nlogn) 的算法,该算法以高概率解决无重采样的噪声排序问题。我们还表明,如果 aσ(1),aσ(2),...,aσ(n) 是问题的最优解,那么它与原始顺序“接近”。更正式地说,以高概率成立 ∑i∣σ(i)−π(i)∣=Θ(n) 且 maxi∣σ(i)−π(i)∣=Θ(logn)。我们的结果在排名应用中具有意义,例如体育排名或基于专家比较的搜索项目排名。
引用
@article{arxiv.0707.1051,
title = {Noisy Sorting Without Resampling},
author = {Mark Braverman and Elchanan Mossel},
journal= {arXiv preprint arXiv:0707.1051},
year = {2007}
}