Definition: 条件概率
设$(\Omega, \mathscr{F}, P)$是一个概率空间,$B \in \mathscr{F}$且$P(B) > 0$,则对任意$A \in \mathscr{F}$,记
\[P(A \mid B) = \frac{P(A \cap B)}{P(B)}\]并称$P(A \mid B)$为在事件$B$发生的条件下事件$A$发生的条件概率。
Definition: 全概率公式
对$A_i, \cdot ,A_n \in \mathscr{F}$,设$A_i \cap A_j = \varnothing(i \neq j), A_1 \cup A_2 \cup \cdots \cup A_n = \Omega$,则对任意事件$B \in \mathscr{F}$,有$B = \sum_{i=1}^{n}A_iB$,则$P(B) = \sum_{i=1}^{n}P(A_i)P(B \mid A_i)$。
Definition: 贝叶斯公式
若事件$B \in \mathscr{F}$能且只能与两两互不相容的事件$A_1, A_2, \cdots, A_n, \cdots$之一同时发生,即
\[B = \bigcup_{i=1}^{\infty} (B \cap A_i)\]由于\[P(A_i \cap B) = P(B) P(A_i \mid B) = P(A_i) P(B \mid A_i)\]故
\[P(A_i \mid B) = \frac{P(A_i) P(B \mid A_i)}{P(B)}\]再利用全概率公式即得
\[P(A_i \mid B) = \frac{P(A_i) P(B \mid A_i)}{\sum_{i=1}^{\infty} P(A_i) P(B \mid A_i)}\]这个公式称为贝叶斯公式。
Definition: 独立事件
对事件$A$及$B$,若
\[P(A \cap B) = P(A) P(B)\]则称它们是统计独立的,简称独立的(independent)。
Definition: 多事件独立
对$n$个事件$A_1, A_2, \cdots, A_n$,若对于所有可能的组合$1 \leq i < j < k < \cdots \leq n$成立着
\[\begin{cases} P(A_i \cap A_j) = P(A_i) P(A_j) \\ P(A_i \cap A_j \cap A_k) = P(A_i) P(A_j) P(A_k) \\ \vdots \\ P(A_1 \cap A_2 \cap \cdots \cap A_n) = P(A_1) P(A_2) \cdots P(A_n) \end{cases}\]则称$A_1, A_2, \cdots, A_n$相互独立。
{注}: 上面任何一个式子都不能省略.
Definition: 独立试验
若对于任意的
\[A^{(1)} \in \mathscr{F}_1, A^{(2)} \in \mathscr{F}_2, \cdots, A^{(n)} \in \mathscr{F}_n\]均成立
\[P(A^{(1)} \cap A^{(2)} \cap \cdots \cap A^{(n)}) = P(A^{(1)}) P(A^{(2)}) \cdots P(A^{(n)})\]则称试验$E_1, E_2, \cdots, E_n$是相互独立的。
在此都假设事件是独立同分布的.
事件 $A$ 第一次发生在第 $k$ 次试验的概率, 记为$g(k;p)$.
由于 $g(k;p)$ 是几何级数的一般项,所以有
在离散型分布中,几何分布是唯一具有无记忆性的分布.
记$q_k = P(\eta>k)$和 $p_k=P(\eta = k)$,则$p_{k+1} = q_k - q_{k+1} = P(\eta>k) - P(\eta > k+1)$,则$P(\eta =k+1 \mid \eta >k) = \frac{P(\eta = k+1, \eta > k)}{P(\eta > k)} = \frac{p_{k+1}}{q_k} = \operatorname{const}$,令$p = \frac{p_{k+1}}{q_k}$,则$\frac{q_{k+1}}{q_k} = 1 - p$,则$q_k = (1-p)^k q_0 = (1-p)^k$,则$p_k = (1-p)^{k-1} p$,这就是几何分布。
第$r$次成功发生在第$k$次试验的概率, 记为$f(k;r,p)$.
$n$重伯努利实验中事件$A$发生$k$次的概率, 记为$b(k;n,p)$.
当 $k=\lfloor (n+1)p \rfloor$ 时值最大
可以证明 $b(m;n,p)\approx (2\pi npq)^{-\frac{1}{2}}$
$n$重伯努利实验中事件$A_1,A_2,\cdots,A_r$分别发生$k_1,k_2,\cdots,k_r$次的概率, 记为$m(k_1,k_2,\cdots,k_r;n,p_1,p_2,\cdots,p_r)$.
事件$A$在单位时间内发生$k$次的概率, 记为$p(k;\lambda)$.
由于二项分布在$n$很大的时候, 其计算较为复杂, 所以引入泊松分布.
对于$n$很大, $p$很小的情况, $\lambda = np$适中的情况, 可将泊松分布作为二项分布的近似.
Theorem: Poisson 分布
在独立试验中,以$p_n$代表事件$A$在试验中出现的概率,它与试验总数$n$有关,如果$n p_n \rightarrow \lambda$,则当$n \rightarrow \infty$时,
\[b(k; n, p_n) \rightarrow \frac{\lambda^k}{k!} e^{-\lambda}\]
记$\lambda_n = n p_n$,则
由于对固定的$k$有
因此
证毕.
由证明可知, 这里$p$应该较小.
当$p$较小时(一般小于0.1), 可用如下近似公式:
由于泊松分布可以看作二项分布的近似,所以其极大值出现在$k = \lfloor \lambda \rfloor$处。
下面研究泊松过程, 其代表事件间隔$\Delta t$内事件发生$k$次的概率.
Lemma: 柯西定理
若函数连续且 $f(x)$ 满足 $f(x+y) = f(x) f(y), \text{ for } \forall x, y \in \mathbb{R}$, 则 $f(x) = a^x$.
Definition: 泊松过程
考虑一个事件$A$,其满足如下性质:
- 平稳性:$[t_0,t)$ 时间内,$k$ 与 $t_0$ 无关,只与 $t$ 有关
- 独立增量性:$[t_0,t_1)$ 与 $[t_1,t_2)$ 是独立的
- 普通性:充分小时间内,最多发生一次
则称事件$A$为泊松过程。
记$P_k(t)$为时间$t$内发生$k$次的概率, 利用如上公式求$P_k(t)$.
对$\Delta t > 0$, 考虑$[0, t+\Delta t)$中事件发生$k$次的概率$P_k(t + \Delta t)$, 由独立性和全概率公式有:
当 $k=0$ 时,有 $P_0(t+\Delta t) = P_0(t)P_0(\Delta t)$
由引理2.4.1可知
若$a=0$, 则$P_0(t) = 0$, 则$t \rightarrow 0$时, 事件也会发生, $\Delta t$内事件发生无穷次, 在此不考虑这种情况. 当$a = 1$时, 代表事件永不发生, 也不考虑这种情况. 所以$0 < a < 1$. 令$\lambda = -\ln a$, 则有 $P_0(t) = e^{-\lambda t}$.
因此当 $\Delta t \rightarrow 0$ 时,我们有
故:
因此
令 $\Delta t \rightarrow 0$, 得
由于已知$P_0(t) = e^{-\lambda t}$, 故有 $P_1'(t) = \lambda [e^{-\lambda t} - P_1(t)]$, 可解得 $P_1(t) = \lambda t e^{-\lambda t}$.
这样下去, 可解得一切 $P_k(t) = \frac{(\lambda t)^k}{k!} e^{-\lambda t}$。
泊松过程描述了时间间隔$t$内事件发生$k$次的概率,可以看出泊松分布是$t=1$的特殊情况,即单位时间随机事件发生的次数的概率分布。