“
在循证医学、临床流行病学领域,经常用到两个概念:置信区间,可信区间。许多同道对这两个概念的区别并不了解,经常将两者混用。部分教材资料,包括一些学术论著,也对这两个概念不进行区分。实际上将置信区间和可信区间当作同一个概念是错误的。
01
class
什么是置信区间
定义:设总体X的分布函数F(x; θ)含有一个位置参数θ,θ∈A(A是θ的取值空间),对于给定值α(0< α θ1< θ2),对于任意θ∈A满足:P{θ1(X1, X2,…,Xn)< θ =1-α,则称随机区间(θ1,θ2)是θ的置信水平为1-α的置信区间。
用人话说就是:在经典统计过程中,对于一个未知参数,除了要求获得其近似值估计(点估计,Point estimation)外,我们还希望估计一个范围,同时希望这个范围包含参数真实值的可信程度,这个范围,即该参数的置信区间(Confidence interval)。
注意:置信区间的概念是对应频率学统计,也既是经典统计学。
02
class
什么是可信区间
定义:可信区间(Credibility interval)对应的则是贝叶斯统计学。当参数θ的后验分布π(θ|x)获得以后,给定一个区间[θ1,θ2],使得θ落在这个区间[θ1,θ2]的后验概率为1-α置信区间的意义,则称这个区间为参数θ的可信区间。
人话版:可信区间的概念比较容易理解,就不翻译成人话版了~
03
class
有什么区别呢?
可能很多人问,这两个概念很类似置信区间的意义,有什么区别呢?
首先,第一个区别是学派区别。置信区间是频率学学派的“专利”,可信区间则是贝叶斯学派的“专利”。
其次,两者概念有很大区别!假设某指标95%置信区间为(28, 36),对于置信区间,根据经典频率统计学的思想,表示进行100次随机抽样,其中有95次这个区间(28,36)会盖住这个指标。经典统计强调多次抽样,有多少次会发生。因此对于只进行一次或者两次的(或者对于个体而言),经典统计是无意义的。而对于可信区间,则可解释为:某指标落在(28,36)这个区间的可能性为95%。可见在我们生活中,所描述的某事情发生的可能性,其实就是高大上的贝叶斯统计的范畴。
延伸一点,为什么贝叶斯网状Meta分析可以对不同干预措施的优先性进行排序(rank)?排的就是可能性,也就是贝叶斯~
再延伸一点,以后参加网状Meta分析培训班,别管人家怎么吹,先问问老师,“老师,能不能问下什么是置信区间什么是可信区间,它们有什么区别?“,老师如果答不上,可能你选了个假的老师…,
,等等,别说是我们告诉你的…
参考资料: