|

楼主 |
发表于 2010-11-4 18:28
|
显示全部楼层
[原创]量子色荷云流传奇
三、量子色动能预测的贝叶斯概率思考
但最终的判据是实验,然而这类实验的事实却是概率中有概率---无论氘化丙酮的高温、闪光实验,还是王洪成及马成金的“水基燃料”实验,或者磁单极子实验,不是次次都能成功的。这类似放风筝,有风或有气流等一些因素,不全是我们人为能掌握的。所以预测此类实验能否成功,涉及到类似贝叶斯技术,即贝叶斯概率问题。
1、计算概率方法很多,为什么更偏重贝叶斯概率呢?外源性量子色动力学的量子色荷云流及量子色动能实验研究,不但涉及概率中有概率,而且现实生活也会遇到概率中有概率的问题。两者之间的相似性,为解决不合常规的外源性量子色动能实验提供了启示。例如,当一家公司向你推荐产品的时候,其推荐系统是基于概率;而你使用信用卡付款时,信用卡的支票欺诈也存在概率;另外,当这家公司向你发送电子邮件确认时,其垃圾邮件过滤器也是基于概率;因此,基于概率的处理器非常有用,它能大大简化此类系统的数学运算需求。
A)贝叶斯概率,即贝叶斯技术应用于垃圾邮件的过滤上,使用的是贝叶斯垃圾邮件过滤器,它采用电子邮件的一个参考集合来定义什么是最初被认为垃圾邮件的。定义了参考之后,过滤器使用参考中的特点来将新的邮件,判定为垃圾邮件或有效邮件。新电子邮件作为新的信息出现,并且如果用户在垃圾邮件和有效邮件的判定中发现错误,这个新的信息会更新初始参考集合中的信息,以期将来的判定可以更为精确。
B)即使计算机中,也需要贝叶斯技术。例如二进制计算适合操作系统、数据库和电子表格等任务,但是,目前越来越多的任务,比如加快网络搜寻速度、侦测诈骗、过滤垃圾邮件、建立金融模式、分析基因序列等,都没有明确的答案,只能从多种可能性中挑选出概率最高的可能性。而且,在解决这些任务时,若使用传统处理器的计算方式,将消耗大量资源,效率也极其低下。因此也希望开发一种新型处理器,更迅速有效地完成这类计算任务。其次,传统芯片的晶体管主要用于搭建数字与非门,这是一种基本的逻辑电路,主要使用一系列“0”和“1”来执行数字逻辑功能。而在概率处理器上,晶体管被用于搭建贝叶斯与非门,也就是概率与非门。
C)贝叶斯概率以英国统计学家艾托马斯•贝叶斯而命名,他于18世纪提出了贝叶斯理论,描述了当已知一个事件发生,预测另一件事也发生的概率的方法。贝叶斯本人只证明了现在称为贝叶斯定理的一个特例。贝叶斯概率是由贝叶斯理论所提供的一种对概率的解释,它采用将概率定义为某人对一个命题信任的程度的概念。贝叶斯理论同时也建议贝叶斯定理可以用作根据新的信息导出或者更新现有的置信度的规则。拉普拉斯最先证明了贝叶斯定理的一个更普遍的版本,并将之用于解决天体力学、医学统计中的问题。但是拉普拉斯并不认为该定理对于概率论很重要。他还是坚持使用了概率的经典解释。1931年在《数学基础》中首次建议将主观置信度作为概率的一种解释,视这种解释为概率的频率解释的一个补充;而频率解释在当时更为广泛接受。在1954年《统计学基础》中,更将概率的频率解释作为一种可能的代替。
2)贝叶斯概率和频率概率之争。贝叶斯概率有一些变种,这来源于有人试图将“置信度”的直观概念,进行形式化的定义和应用。最普通的应用是基于打赌:置信度反映在行为主体愿意在命题上下注的意愿上。当信任有程度的时候,概率计算的定理测量信任的理性程度,就像一阶逻辑的定理测量信任的理性程度一样。很多人将置信度视为经典的真值(真或假)的一种扩展。
A)主观概率,认知概率和逻辑概率描述了通常成为贝叶斯学派的思想中的一些个人概率。这些概念互相重叠,但有不同的侧重。这里指贝叶斯概率应该测量某一个体对于一个不确定命题的置信程度,因此在这个意义下是主观的。但有些人并不接受这种主观性。
B)逻辑(或客观认知)概率,希望将能够在两个有相同关于某个不确定命题的真实性相关的信息的人,计算出同样的概率的技术规律化。这种概率不和个人相关,而只和认知情况相关,因此位于主观和客观之间。但其推荐的方法也有争议。有批评者说,对这个在关于相关事实的信息缺乏的时候,更偏好某一个置信度是有现实依据的。另一个问题是,迄今为止的技术对于处理实际问题还是不够的。
C)贝叶斯学派和频率学派在概率解释上的分歧,在统计学实践上有重要的结果。贝叶斯概率和频率概率相对,是它从确定的分布中观测到的频率或者在样本空间中的比例来导出概率。1933年《概率论基础》采用频率概率来通过勒贝格积分,为测度论中的概率奠定数学基础,其他一些学者自1950年以来则发展了贝叶斯概率。自1950年代以来,贝叶斯理论和贝叶斯概率通过考克斯定理、Jaynes的最大熵原理以及荷兰书论证得到了广泛的应用。在很多应用中,贝叶斯方法更为普适,也似乎较频率概率能得出更好的结果。贝叶斯因子也和奥卡姆剃刀一起使用,有些人将贝叶斯推论视为科学方法的一种应用。
D)因为通过贝叶斯推论来更新概率,要求从对于不同假设的初始信任度出发,采集新的信息(例如通过做试验),然后根据新的信息调整原有的信念。调整原有的信念可以意味着(更加接近)接受或者推翻初始的假设。例如,在用同样的数据比较两个假设的时候,假设测试理论基于概率的频率解释,它允许基于错误推出数据更支持另外那个模型/假设的概率,来否定或接受一个模型/假设(零假设)。出现这种错误的概率称为一类误差,它要求考虑从同样的数据源导出的假想的数据集合,要比实际观测到的数据更为极端。这个方法允许论断或者两个假设不同,或者观测到的数据是误导性的集合。相对应的是,贝叶斯方法基于实际观测到的数据,因此能够对于任何数量的假设直接赋予后验概率。对于代表每个假设的模型的参数,必须赋予概率的要求是这种直接方法的代价。贝叶斯提出了先验概率和后验概率的概念:可以根据新的信息对先验概率加以修改,从而得出后验概率。因此,贝叶斯理论被用于将新信息结合到分析当中。
3)对于贝叶斯概率解释,曾有过的一个批评,是一个单独的概率赋值,不能给出信念的真实性,即它有多少科学实证?考虑如下的这些情况:
A)你有一个装了白球和黑球的盒子,但是不知道它们的数量时,令θ = p代表下一球为黑的概率为p这一命题,一个贝叶斯概率论者会赋予一个Β先验分布。而假设取出的球用二项式分布建模,则后验分布P(θ | m,n),在取出m个黑球和n个白球之后依然是一个Β分布,其参数αB = 1 + m, αW = 1 + n。Β分布的参数的一个直观的解释是两个事件的设想记数。
B)你有一个盒子,你从中取了n个球,黑白各半时,令θ = p 代表下一球为黑的概率为p这一命题,一个贝叶斯概率论者会赋予一个Β先验分布,Β(N / 2 + 1,N / 2 + 1)。θ的极大后验概率是:θ=(N/2+1)/(N+2)。这恰好就是拉普拉斯逐次法则。
C)你有一个盒子,并且你知道黑球和白球的数量相等时,p(θ)=G(Β-1/2)。下一个取出的球是黑球的贝叶斯概率,对于以上所有三种情况都是0.5。
Keynes称这为“证据的权重”问题。一个反映这些证据支持的区别的方法,就是如上对于这些概率本身赋予概率(所谓的“元概率”)。
|
|