程序员的数学-概率统计

时间

2019/09/25

摘要

概率是一种面积

已上帝视角看待每一个平行世界。

(上帝视角)—–>完全确定的面积问题 —->面积的答案

(人类视角)—–>结果不确定的概率问题 —->概率的答案

随机变量

  • 联合概率 : P(x=a,y=b)

  • 边缘概率 : P(x=a) 或 P(y=b)

  • 条件概率 : P(x=a|y=b) :在条件y=b下x的条件分布

1
P(A,B)=P(A|B)*P(B)=P(B|A)*P(A)
  • 贝叶斯公式: 应用条件概率来解决逆问题。
1
P(A|B)=P(B|A)*P(A)/P(B)
1
2
3
4
通信:根据含有噪声的接收信号Y推测发送信号X
语言识别:根据麦克风识别音频波形数据Y推测语言信息X
文字识别:根据扫描仪读取的图像数据Y推测用户书写的文字X
邮件自动过滤:根据接收到的邮件文本Y推测邮件的类型X(是否是广告等)
  • 独立性:多个随机变量之间是否真的存在关联

离散

  • 期望值 E[X] (或 μ) : 所有世界每次可能的结果乘以其结果概率的总和。

  • 方差:V[X]=E[(X-μ)*(X-μ)]

  • 标准差: 方查的开方

平均数和期望值的区别:

期望值是多个平行世界的观测结果,因为生活在某一个平行世界的人类无法知晓该值。

平均值测量的是一个特定世界的值。

然后,手握大数定律后,即使我们只能观测某个特定的世界,只要观测平均值,就能知晓只有上帝才能观测的期望值μ。 是不是很神奇?

正态分布与中心极限定律

upload successful

练习题1 使用林德伯格定理:

upload successful

练习题2 使用拉普拉斯定理

1
2
3
现抛掷一枚正反概率恰好各为一半的硬币100次,估计正面朝上的次数小于等于60次的概率。

(60-100/2)/根号(100*1/2*(1-1/2) = 2, 标准正态分布查表θ(2)~~0.982