Processing math: 0%

2023年2月4日土曜日

モーメント母関数を使わないChernoff boundの証明

Chernoff boundは, 独立な確率変数X_1,\dots,X_nの和X_1+\dots+X_nが期待値から外れる確率がnに関して指数的に小さくなることを主張する不等式です. Chernoff boundの証明はモーメント母関数\mathbf{E}[\exp(\lambda X)]の評価し, それとマルコフの不等式を組み合わせることで与えられます (例えばこのページ参照)

本記事ではImpagliazzoとKabanets(2010)によって与えられた面白い証明を紹介します.

定理.
X_1,\dots,X_n\{0,1\}値をとる独立な確率変数で\mathbf{E}[X_1]=pとする. 任意のc>0に対して
\begin{align*} \Pr[X_1+\dots+X_n\geq cn] \leq \mathrm{e}^{-nD(c||p)}.\end{align*}
ここで, D(c||p)=c\log\frac{c}{p} + (1-c)\log\frac{1-c}{1-p}\geq 2(c-p)^2.

(証明)
パラメータq\in[0,1]に対し, 各i\in[n]を独立に確率qで含むランダムな部分集合Sを考え, 確率変数
\begin{align*}Z = \prod_{i\in S}X_i \end{align*}
とします (SXのランダムネスを考える). 定義より
\begin{align*}\mathbf{E}[Z]&=\mathbf{E}_S\left[\mathbf{E}_X\left[\prod_{i\in S}X_i\right]\right] \\ &= \mathbf{E}_S\left[p^{|S|}\right] \\ &= (qp+1-q)^n.\end{align*}
\mathcal{E}X_1+\dots+X_n\geq cnという事象とします. \mathcal{E}で条件づけたとき,
\begin{align*}\mathbf{E}[Z|\mathcal{E}] &= \mathbf{E}_X\left[\mathbf{E}_S\left[\prod_{i\in S}X_i\middle|\mathcal{E}\right]\middle|\right] \\ &=\mathbf{E}_X\left[\Pr_S[\overline{S}\text{ contains all }i\text{ satisfying }X_i=0|\mathcal{E}]\middle|\mathcal{E}\right] \\ &\geq (1-q)^{(1-c)n}.\end{align*}
最後の不等式は, \mathcal{E}で条件づけたときにX_i=0となるiは高々(1-c)n個あり, それら全てが\overline{S}に含まれる確率で下から抑えることで得ています.

条件付き期待値の性質から\mathbf{E}[Z]\geq\mathbf{E}[Z|\mathcal{E}]\Pr[\mathcal{E}]より
\begin{align*}\Pr[X_1+\dots+X_n\geq cn]\leq \frac{(pq+1-q)^n}{(1-q)^{(1-c)n}}\end{align*}
を得ます. 右辺はq=\frac{c-p}{c(1-p)}のとき最小となり, \mathrm{e}^{-D(c||p)}となる. (証明終)

参考文献

R. Impagliazzo and V. Kabanets, Constructive Proofs of Concentration Bounds, RANDOM2010.


0 件のコメント:

コメントを投稿

講義資料をNotionで書いてみた

 プログラミング応用という名前の講義を受け持っており, そこで組合せ最適化のベーシックな話題とそのPythonでの実装を教えているのですが, 資料をNotionで書いてみました. 講義資料をNotionで公開しているのでアルゴリズムの基礎とかNP困難性とかを勉強したい人はどう...