概率论与数理统计课程论文
浅谈概率论与数理统计
在化学中的应用
课程名称: 概率论与数理统计
授课教师:
院 系:
专 业:
班 级:
姓 名:
学 号:
2013年 12 月 09 日
摘要:概率论与数理统计在自然科学,尤其是化学领域应用广泛,且对化学发展有重要作用。因此本文以概率论在化学中的应用为出发点,从概率论在化学中取得应用的原因、意义及化学中常用的分布函数几方面进行阐述,在一定程度上加深和拓展了对概率论的认识与应用。 关键词:概率论与数理统计;化学;应用
一、引言
概率论与数理统计是研究随机现象及其规律性的一门数学学科。概率论是基于给出随机现象的数学模型,用数学语言来描述它们,并找出其内在规律。而数理统计是以概率论为基础,基于有效地观察、收集、整理、分析带有随机性的数据来研究随机现象,进而对所观察的问题做出推断和预测。
至今,概率论与数理统计的理论与方法已广泛应用于自然科学、社会科学及人文科学等各个领域中,并且随计算机的普及,概率论与数理统计已成为处理信息、制定决策的重要理论与方法。它们不仅是许多新兴学科的数学理论基础学科,还和其他领域相交叉而产生了许多新的分支和边缘学科。总之,概率论与数理统计作为理论严谨、应用广泛、发展迅速的数学分支正越来越引起广泛的重视。
二、概率论在化学中的应用
1、原因
化学作为一门以测量为基础的实验科学,一直被认为是有着很大欠缺的,那就是欠缺严格性、逻辑性以及精确性的理论,因为测量具有随机可变性、不确定性、模糊性。诚然,测量是有着重要性的,在美国芝加哥大学社会科学研究馆的正面,刻有这样一段铭文:“假若你不能测量,你的知识就是贫乏和不能令人满意的。”但是我们不能片面地追求所谓精确性,其结果只能是将认识过程加以近似化、简单化,最终会走向形而上学,乃至神秘主义。所以这句话还应该这样补充:“假如你只懂得测量,那么你对世界的认识将是可怜的。”
为了解决这一问题,概率论和数理统计开始应用于化学研究领域。其具体原因如下:
(1)实验的研究对象只能是极小一部分样品,其最后结果也只能从这一小部分样品的研究结果出发并做出统计推断,也就是运用概率论和数理统计方法推断出研究对象的全体。
(2)实验中不可避免地会存在着大量随机误差的问题,要从这些随机现象中去得出准确可靠的研究结果,就只能依赖于概率论和数理统计的方法和原理。
(3)随着现代科学研究的发展,各种测量仪器的计算机化给我们带来了“数据爆炸”,而要处理这些大量的数据,并从这些数据中获取更多的甚至意想不到的信息,只有数学和统计学技术才能给我们以可靠的保证。
2、意义
化学这一学科基本上还是一门实验学科,所以化学工作者掌握概率论和数理统计的原理及其应用就显得尤为重要。只有正确运用概率论和数理统计,我们才能够从表面杂乱无章的实验现象里去找出有意义的统计结论来;才能使我们能更有成效地进行科学研究,并确保取得可靠、准确的结果,进而得以发现客观规律;才能使我们从大量的实验数据、实验资料中去揭示和获取更多的化学信息。
三、化学中常用的分布函数
1、二项式分布
每次试验只有两种可能结果而不受以前试验结果影响,两种事件的概率为p、q。如在n次独立试验下,求A出现次数x的概率分布,其概率质量函数为:
P(x) = Cnxpxqn-x(x = 0,1,2 „ n,0<p<1 )
这就叫二项式分布。二项分布在化学中可用于计算质谱中同位素峰的强度比以及推导气液色谱的流出曲线。
1.1计算质谱中同位素峰的强度比
多卤素化合物的同位素峰强度,可利用(a+b)二项展开来表示,其中a为轻同位素的丰度,b为重同位素的丰度,n为卤素原子的数目。例如,CHCl3中含有3个氯原子,35Cl的丰度为75.4%,37Cl的丰度为24.6%,二者的丰度比为3:1,所以(a+b)=27+27+9+1,这表明氯仿质谱中的分子离子峰与同位素峰的强度比为:27:27:9:1。 1.2 推导气液色谱的流出曲线
由塔板理论,待分离组分流出色谱柱时的浓度沿时间呈二项式分布,当色谱柱的塔板数很高时,二项式分布趋于正态分布。则流出曲线上组分浓度与时间的关系可表示为:
c_t=c_0/(σ*√(2π))*e^(-(t-t_R)^2/(2*σ^2))
这一方程称作流出曲线方程,式中c_t为t时刻的组分浓度;c_0为组分总浓度,即峰面积;σ为半峰宽,即正态分布的标准差;t_R为组分的保留时间。
2、泊松分布
当某事件出现的概率很低(P>1)时,二项分布就成为泊松分布,它适合于描述单位时间内随机事件发生的次数。如某一服务设施在一定时间内到达的人数,汽车站台的候客人数,自然灾害发生的次数等。
例1. 400ml微生物溶液中含微生物的浓度是0.5只/ml,抽出1ml,其中所含微生物的只数x服从什么分布?含3只及以上微生物的可能性多大?
解:溶液中共有微生物n = 0.5×400 = 200只,每一只微生物落入抽检的1毫升溶液3n
中的概率p = 1/400,不落入的概率q = 399/400。看有几只微生物落入抽检的1毫升溶液中就相当于一个n = 200的独立试验模型,故x服从二项分布。
又 = np = 0.5较小,可用泊松分布来计算。
P(n≥3) = 1 - P(n<3) = 1 - P(n=0) - P(n=1) - P(n=2)
= 1 – e-0.5 – 0.5e-0.5 – 0.5e2-0.5 /2
= 0.0144
3、正态分布
假设一定条件下,对x进行无限多次重复的等精度测量,得到一系列数据x1,x2,„ xn,则各测量值的频数密度分布将变成一条平滑的曲线,该曲线的分布就称为正态分布。
例2. 30-40岁男子血清胆固醇值(mmol/l)极近正态分布N(4.72,0.77),试求:该年龄健康男子血清胆固醇值(1)大于6.20的概率;(2)大于4.00且小于5.50的概率。
解:μ=4.72 δ= =0.8774 U=(x-4.72)/0.8774
(1) x>6.20 U=1.687 查表 p=0.0458
(2) P(4.00≤x≤5.50)=Φ(-0.8206)-Φ(0.8890)=1-0.2059-0.1870=0.6071
参考文献:
1. 数理统计方法在化学中的应用 李振华2010
2. 《概率论与数理统计》哈尔滨工业大学数学系 王勇主编 高等教育出版社
3. 《滑移色谱机理研究》 科技咨询导报2007年 第28期