php 置信区间 计算,深度学习篇-如何理解置信区间
关于其在正态分布上的应用……正态分布的θ=(μ,σ^2)(这两个指标也是整个总体的均值和方差),而用n个服从同一正态分布的随机变量进行最大似然估计的结果是Argmax L(θ)=(x bar,s^2)(也就是样本的均值和方差)……根据中心极限定理,当n趋于无穷时(x bar−μ)/(σ/sqrt(n))的分布收敛于标准正态分布……使用σ(总体的标准差)的最大似然估计值s(样本的标准差)来替代σ,根
关于其在正态分布上的应用……
正态分布的θ=(μ,σ^2)(这两个指标也是整个总体的均值和方差),而用n个服从同一正态分布的随机变量进行最大似然估计的结果是Argmax L(θ)=(x bar,s^2)(也就是样本的均值和方差)……
根据中心极限定理,当n趋于无穷时(x bar−μ)/(σ/sqrt(n))的分布收敛于标准正态分布……使用σ(总体的标准差)的最大似然估计值s(样本的标准差)来替代σ,根据标准正态分布,即可求出μ(总体的均值)的95%置信区间……
最终计算出来的结果长这样:( , )
其中,c是95%置信度所对应的critiacl value值,M为样本量。都是已知量,假设最后结果为(0.45,0.55),这个结果代表:彩票的中奖率是0.45-0.55之间,这个结果只有95%的可能性是对的,这个结果解释需要明确两点。
1.如果继续采样,也就是再叫一个兄弟买100张彩票,他的中奖率很大可能(95%)是落在0.45-0.55之间的。
2.总体的彩票中奖率是不是一定在0.45-0.55之间?也不一定,只能说,极大概率是在0.45-0.55内,总体的结果在没有拿到确切总量计算之前都是很难确定的,所以说,该方法计算出来的只是一个概率值。
置信区间和人工智能
高等数学之前认为,数学非0即1,如果只是一个概率很难称之为科学(数学本来就不是科学),用哲学来形容更好一些。这恰好就是人工智能应用的根本算法。
人工智能学科很复杂,其本质是仿人类的反应,学习,动作。而人类对事物的判断就源于生存经验和逐渐纠正学习。当人的思维经验判断某件事发生的概率为95%的时候,就是一个大概率事件,做出相应的反应。
python计算
python是深度学习的主流语言,封装了很多算法包,写一个计算概率的程序非常简单。
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
N = 10000
x = np.random.normal(0, 1, N)
# ddof取值为1是因为在统计学中样本的标准偏差除的是(N-1)而不是N,统计学中的标准偏差除的是N
# SciPy中的std计算默认是采用统计学中标准差的计算方式
mean, std = x.mean(), x.std(ddof=1)
print(mean, std)
# 计算置信区间
# 这里的0.9是置信水平
conf_intveral = stats.norm.interval(0.9, loc=mean, scale=std)
print(conf_intveral)
这里一共就两个函数,一个是随机获取符合正态分布的10000个数据 np.random.normal,另一个是计算置信区间的 stats.norm.interval
计算结果:(-1.6297070531642777, 1.6429401188504407)
完

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐
所有评论(0)