郑州大学毕业设计 ( 论文 )
题目:特征值与特征向量的特点及应用 指导老师:陈铁生 职称:副教授
学生姓名: 洪天麟 学号[1**********] 专业:数学与应用数学 院系:数学与统计学院
完成时间:2015年5月10日
目录
摘要...........................................1
§1 线性变换的特征值与特征向量,特征多项式和特征子空间
的定义..........................................2
§2 特征值与特征向量的计算以及不变子空间的问
题.............................................10
§3 矩阵的公共特征向量与同时三角化........................14
§4 特征值与特征向量的运用........................................20
参考文献..............................................................................23
致谢......................................................................................24
特征值与特征向量的特点及应用
摘要:这篇文章阐述了特征值与特征向量的特点及应用,给出了特征值与特征向量、特征多项式、特征子空间等的概念和性质定理。并且给出了特征值与特征向量在物理学当中的应用,提供了一些经典习题的解答方法。还给出了特征值与特征向量在实际生产生活当中的应用。
关键词:特征值,特征向量,特征多项式,不变子空间,特征子空间
Abstract: this article expounds the characteristics of the eigenvalue and eigenvector and applications of eigenvalue and eigenvector is given, and characteristic polynomial, such as feature subspace concept and nature of the theorem. And eigenvalue and eigenvector are given in the application of physics, provides some classical problem solution method. Eigenvalues and eigenvectors are also in the actual application of production and living. Key words: eigenvalues, eigenvectors and characteristic polynomial, invariant subspace, feature subspace
矩阵的特征值和特征向量在现实实际拥有广泛的应用,矩阵的特征值和特征向量理论在经济分析、信息科学、天文物理学、生命科学和环境保护等领域都有联系。结合数学模型来研究等一系列问题,我们主要从三方面着手:线性变换的特征值与特征向量,特征多项式和特征子空间的定义;矩阵的公共特征向量与同时三角化;特征值与特征向量的运用。
§1线性变换的特征值与特征向量,特征多项式和特征子空间的定义
若存在非零向量
ξV, 使得对于某个λ∈K,有Aξ=λξ, 则称ξ是A的属于特征值λ的特征向量。从数学的直观解析几何角度来看,特征向量的方向线性变换后,还是在一条直线,要么
方向不变(大于0
)要么方向相反(小于0
),在等于0时,特征向量被线性变换变成0.ξ是线性变换错误!未找到引用源。的属于特征值错误!未找到引用源。的特征向量,那么ξ的任意一个非零背书kξ也是A的属于错误!未找到引用源。的特征向量。因为由Aξ=错误!未找到引用源。ξ推出A(k
ξ)=错误!未找到引用源。(kξ)特征向量不是被特征值所唯一决定的。相反,特征值确是被特征向量唯一决定,一个特征值向量只能属于一个特征值。
数学上,线性变换的特征向量(本征向量)是一个非退化的向量,其方向在该变换下不变。该向量在此变换下缩放的比例称为其特征值(本征值)。一个变换通常可以由其特征值和特征向量完全描述。特征空间是相同特征值的特征向量的集合。
这些概念在纯数学和应用数学的很多领域发挥着巨大的作用—在线性代数,泛函分析,甚至在一些非线性的情况中也有着显著的重要性。
“特征”一词来自德语的eigen。1904年希尔伯特首先在这个意义下使用了这个词,更早亥尔姆霍尔兹也在相关意义下使用过该词。eigen一词可翻译为“自身的”,“特定于...的”,“有特征的”或者“个体的”—这强调了特征值对于定义特定的变换有多重要。
空间上的变换—如平移(移动原点),旋转,反射,拉伸,压缩,或者这些变换的组合;以及其它变换—可以通过它们在向量上的作用来显示。向量可以用从一点指向另一点的箭头来表示。
例子
随着地球的自转,每个从地心往外指的箭头都在旋转,除了在转轴上的那些箭头。考虑地球在一小时自转后的变换:地心指向地理南极的箭头是这个变换的一个特征向量,但是从地心指向赤道任何一处的箭头不会是一个特征向量。因为指向极点的箭头没有被地球的自转拉伸,它的特征值是1。
另一个例子是,薄金属板关于一个固定点均匀伸展,使得板上每一个点到该固定点的距离翻倍。这个伸展是一个有特征值2的变换。从该固定点到板上任何一点的向量是一个特征向量,而相应的特征空间是所有这些向量的集合。
但是,三维几何空间不是唯一的向量空间。例如,考虑两端固定的拉紧的绳子,就像弦乐器的振动弦那样(图2.)。振动弦的原子到它们在弦静止时的位置之间的带符号那些距离视为一个空间中的一个向量的分量,那个空间的维数就是弦上原子的个数。
如果考虑绳子随着时间流逝发生的变换,它的特征向量,或者说特征函数(如果将绳子假设为一个连续媒介),就是它的驻波—也就是那些通过空气的传播让人们听到弓弦和吉他的拨动声的振动。驻波对应于弦的特定振动,它们使得弦的形状随
着时间变化而伸缩一个因子(特征值)。和弦相关的该向量的每个分量乘上了一个依赖于时间的因子。驻波的振幅(特征值)在考虑到阻尼的情况下逐渐减弱。因此可以将每个特征向量对应于一个寿命,并将特征向量的概念和共振的概念联系起来。
设A 是数域P上的一个n级矩阵,是一个数字。矩阵EA的行列式
a11
a21
..a12...a1na2na22....
|EA|=an1an2....ann
称为A的特征多项式,这是数域P上的一个n次多项式。 上面的分析说明,如果0是线性变换Д
的特征值,那么
一定是矩阵A
的特征多项式的一个根;反过来,如果
是矩阵A的特征多项式在数域P中的一个根,即|0E-A|=0.
命题 线性空间V中属于确定的特征值λ的特征向量(添加上零向量)构成子空间。证明 设
,
是属于的特征向量,任意
k,lK,则
A(k
+k
)=kA(
)+lA()=k
λ+l
λ=λ
(k
+k).证毕。定义 线性空间V中属于确定的特征值λ的特征向量(添加上零向量)构成子空间称为属于特征值λ的特征子空间,记为.
不变子空间:空间中的任何元素经过映射映射后,新的元素仍在这个空间里,这个空间叫做这个映射下的不变空间
4.4.2关于特征值,特征向量,特征向量与特征子空间的一些性质
定理 相似的矩阵有相同特征多项式
证明 设A∽B,那么可逆矩阵X,有B=X1AX.于是
|EB|=|EX11AX|=|X(EA)X|
=|X1||EA||X|=|EA|.
此定理说明,线性变换的矩阵特征多项式与基的选择无关,它是直接被线性变换所确定的。
命题 线性变换的属于不同特征值的特征向量线性无关。 证明 设A为V/K上的线性变换,1,2,,t是两两不同的特
i(1it)是属于特征子空间V的特征向量,征值,设k1,k2,,ktK,i
使得k11k22ktt0,两边用Aj作用(i1,2,,t1),于是得到方程组
1j12j2tjt0,j0,1,,t1,
其中i的方幂组成的矩阵为
1112t1
t1t1t12t1,
i两两不同,于是此矩阵的行列式非零,矩阵非退化,于是方程组只有零解,即
k11k22ktt0,
又由于特征向量非零,则k1k2kt0,则1,2,,t线性无关。证毕。
推论 n维空间的具有n个不同特征值的线性变换的矩阵相似于对角矩阵.
证明 取每个特征值的一个特征向量作为基即可。
推论 ,,,12tA设为的两两不同的特征值,则i1tVi为直
和。
证明 只要证明零向量的表示法唯一即可。设012t,(iVi),假若某个i0,则1,2,,t线性相关,与上述命题矛盾。证毕。
定理 n维空间线性变换的矩阵相似于对角矩阵的充分必要条件是该空间等于特征子空间的直和。
证明 必要性 设V/K上的线性变换A在一组基1,2,,n下成对角形,即
d1
A(1,2,,n)(1,2,,n)d2dn,
将d1,d2,,dn中的不同的值分别记为1,2,,t,相应的基向量记为j,j,,j,j,j,,j,,j,j,,j11121s121222s2t1t2tst,记
iViL(ji1,ji2,,jis)i,易见,VVii1t,只要证明i1,2,,t,V
iVi即可。易见,“”成立;任取V,
l11l22lnn12t(1),
其中kljjljjljjVkVk1k1k2k2kskkskk,两边用A作用,得到
i1122tt(2),
用(1)乘以i与(2)相减,得到
(1i)1(2i)2(i1i)i1(i1i)i1(i2i)i2(ti)t0,
i两两不同,又属于不同特征值的特征向量线性无关,得
j0(j1,2,,i1,i1,,t)
,即有iVi。“”得证。于是ViV,
i
必要性证毕。
充分性 若K上的线性空间V可以分解成为特征子空间的直和,记号同上,则
VV1V2Vt
,
分别取个个特征子空间的基合并为V的一组基,则在此组基下,
A的矩阵成对角形。证毕。
这里加入代数重数与几何重数的概念: 1) 代数重数:若 其
中
1,2,.
rrrr
(E)(E)(E).......(E)EA123n||=
1
2
3
s
.s
.互..不.相..同
,并且
iP,ri0(i1,2,3,......,s),r1r2r3.....rsn,那么称ri为特征值i的代
数重数(i1,2,.....s).
2) 几何重数:(iEA)x=0的基础解系所含的向量个数ni为特
(i1,2,....s),并且 征值i的几何重数
(iEA). 几何重数=n-秩
3)
i为A的任意一个特征值,那么几何重数ni代数
重数i(i1,2,....s)
特征值与特征向量的计算以及不变子空间的问题 例1:
210
B131
(中国科学院)求矩阵012
的本征值i,本征矢量xi,这些矢量xi(i=1,2,3)是否为正交的?
解:本征值就是特征值,本征矢量就是特征矢量。
2
1
012
10
3
1
|EB|=
=(2)(1)(4)
B的三个特征值是12,21,34.
(2EB)y0 得基础解系(是属于特征2 当2时,由
的特征向量)为
x1(1,0,1) (1)
(EB)y0,得到属于特征值1的特征向量为 当1,由
x2(1,1,1). (2)
(4EB)y0,得到属于特征值4的特征向量为 当4,由
x3(1,2,1). (3) 由(1)(2)(3)可以得到x1,x2,x3是相互正交的(实际上BBR不同特征值之间一定是相互正交的)
33
,
例2:
(数学三,1993年) n阶方阵A具有n个不同特征值是A与对角矩阵相似的( )
(A)充分必要条件 (B)充分而非必要条件 (C)必要而非充分条件 (D)既非充分也非必要条件 答案B
用排除法。比如令A=E,其中E是n阶单位阵,则A相似于对角阵。但它的n个特征值全相同。所以不是必要条件,从而否定(A),(C).
........n再者,当A有n个不同特征值1,,2,时,它们相应的特征
..........n一定是线性无关,令P=(1,2,..........n),那么 向量1,
1
P1AP....
n,
那么A相似于对角阵,所以是充分条件,选择(B)
例3:(中国人民大学,1992年) 设A,B都是n阶矩阵,E为n阶单位阵,则下面的结论正确的是()。 一若E-AB可逆,必有E-BA可逆 例3:
(南开大学,2004年) 设V是数域P上的3维线性空间,线
性变换f:VV在V的基e1,e2,e3下的矩阵为
2-125-33
-10-2
(2)求线性变换f的特征值和特征向量:
(3)线性变换f可否在V的某组基下的矩阵为对角形,为什么?
解(2)计算得到
2
EA5
1
123302
1
202
1
2
(2)
3
3
2
5
33
(2)(3)(2)5(2)(23)
3
(1)
那么A有3个相同的特值123-1.代入特征方程,有
-31-2x1
-52-3x0{x2x302x1x30101x3
1
,1
的线性无关特征向量为-1所以属于
所以A的属于特征值1
1的所有特征向量为k,kR.
(3)线性变换f在V的任一组基下都不可能有对角阵,因为它只有一个线性无关的特征向量。 例4:
(华中科技大学) 设T是线性空间V上的线性变换,Z是V的非零向量。若向量组Z,TZ,.....Tm1Z线性无关,而 TmZ 线性相关。证明:子空间W=L(Z,TZ,.....Tm1Z)是T的不变子空间,并求在该组基下的矩阵。
证 因为Z,TZ,.....Tm1Z线性无关,而Z,TZ,.....Tm1Z,
TmZ
线性相关,那么TmZ可由Z,TZ,.....Tm1Z线性表出,是
m1
lZlTZ.......lTZ. 01m1=
TmZ
W,则
k0Zk1TZ.....km1Tm1Z,
Tk0TZk1T2Z.....km2Tm1Zkm1TmZkm1l0Z(km1l1k0)TZ.....(km1lm1km2)Tm1Z.TW,。
那么证明W是T的不变子空间。
矩阵的公共特征向量与同时三角化
引理1 若rank(ABBA)1,则A,B至少有一个公共特征向量
定理1 设A ,B, C分别是复数域n维线性空间V上的线性变换,A ,B至少有一个公共特征向量充分必要条件是
[2]
KerC,其中CABBA,A().
证:必要性 若A ,B至少有一个公共特征向量,不妨设A ,B对应于特征向量的特征值分别是,,即A(),B(),故AB()-BA()=0,又CAB-BA,所以C()0,KerC 充分性 若KerC,即C()0,又由于A(),
B())=,即C()AB()-BA()=AB()-B(),故A(
B()V,V是的B-子空间.现考虑B在V上限制的线性变换
则其在复数域必存在特征值使得BV()B().故B,
是A ,B一个公共特征向量.▊
定理2 设A ,B, C分别是复数域n维线性空间V上的线性变换,CAB-BA,且满足KerBKerC或者ImBImC,则A ,B至少有一个公共特征向量.
证:若KerBKerC,KerB,从而KerC,即
B()
0,C(则BA()AB()C()0,从而A()KerB,
即KerB是A-子空间.现考虑A在KerB上限制的线性变换AKerB,则其在复数域必存在特征值使得
AKeBr().又A()B()=0,故是A ,B一个公共特征
向量.
若ImBImC,是特征值所对应的特征向量,即
B(),从而ImB,则V,使得B(),则就有
A()A(B())BA()C(),又BA()ImB,C(),Im则
ImB是A-子空间.现考虑A在ImB上限制的线A()Im,即B
性变换AImB,则其在复数域必存在特征值使得
AI
mB(
)
A().又B(),故是A ,B一个公共特征
向量.▊
由上以证明的定理可以得到很多常见的结论,如下: 推论1 若CkA或者kB(k为任意常数),则A ,B至少有一个公共特征向量.
推论2若C0,则A ,B至少有一个公共特征向量.
推论3 若C0,且A有r个互异的特征值,则A ,B至少有r个公共特征向量.
推论4若n阶复数矩阵Aii1,2,,m两两可交换,则它们至少有一个公共特征向量.
推论5若A,B其中有一个是单纯矩阵,
定理3设A,B均是n阶复数矩阵,则A,B可同时上三角化的充分必要条件是A,B至少有一个公共特征向量.
证:充分性不妨设是一个公共特征向量,将其单位化记为1,扩充为复数域一组基1,2,,n.设A,B关于的特征向量
[1]
1特征值分别是1,1,则有A11,1B11.令
P1,2,,n),则 1(
11
PAP11
**,11 PBP11B1A1
由归纳法知,存在n1阶矩阵Q使得
2Q1AQ1
1
令PP1
2
,Q1BQ
1
n
*
n
*
1
,则P1AP
Q
nn
1
1,PBP
n
*
. n
*
必要性设存在可逆阵P
1
P1AP
,使得
n
1
1,PBP
n
*
*
设P按列分块为P(1,2,,n),上式即为
1
A(1,2,,n)(1,2,,n)
n n
*
1
B(1,2,,n)(1,2,,n)
*
则有A111,B111,故设1是一个公共特征向量. ▊
例1 (北京大学1990年) 设
131
,210
A311试证明:
(1)A在复数域上可以对角化: (2)A在有理数域上不可对角化。 证(1)计算可得
f()EA332128
2
)f(3-612
(f(),f())1,在复数数域上A相似于用辗转相除法可以证得
对角阵。
(2)若A在有理数域上可以对角化,那么A的特征值必须都是有理数,从而f()的首项系数为一,从而f()的有理根必定是整数根。由于f()的常数项为负数八,如果f()有整数根必定为正负一,正负二,正负四,正负八。用综合除法验算它们都不是f()的根,所以f()无有理根。从而证明了A在有理数域上是不可以对角化的。
例2 设A,B是实正定n阶矩阵,证明:AB是正定矩阵的充要条件是AB=BA. 证明必要性显然.
充分性由A,B是实正定n阶矩阵且AB=BA,由推论2及定理3
知设存在可逆阵P,使得
1
P1AP
1,P1BP
n
,其中,0(i1,2,,n)
ii
n
11
故P1ABP
,且0(i1,2,,n)
ii
nn
即AB是正定矩阵. 例3
(数学一,2000年) 某试验生产线每年一月份进行熟练工与非熟练工的人数统计,然后将六分之一熟练工支持其他生产部门,其缺额由招收新的非熟练工补齐,新,老非熟练工经过培训及实践至年终考核有五分之二成为熟练工,设第n年一月份统计的熟练工和非熟练工所占百分比分别为xn和yn,记成向量
xnyn
xn1xnyyn1(1)求与n的关系式并且把它写成矩阵 4-11,2
11是(2)验证
xn1xn
yyn1形式=An;
A的两个线性无关的特征向量,并求出
相应的特征值;
解:因为本题的第一问与所要讨论的主题无关,故直接给出答案,没有给出详细的解答过程,望请谅解。
9101(1)A=102535是所求关系矩阵。
411,1(2)A1对应的特征值为1=1. 11222,2112
2A对应的特征值为2=2。
不同特征值的特征向量一定线性无关2对应的特征值1
为2=2。
由本题可以看出,特征向量在是实际的生产生活当中也有广泛的应用。
特征值与特征向量的运用
特征值与特征向量在物理学当中也有广泛的应用。
特征值在物理学当中的应用:
在方矩阵A,其系数属于一个环的情况,λ称为一个右特征值如果存在一个列向量x使得Ax=λx,或者称为一个左特征值如果存在非零行向量y使得yA=yλ。
若环是可交换的,左特征值和右特征值相等,并简称为特征值。否则的话,例如当环是四元数集合的时候,它们可能是不同的。
若向量空间是无穷维的,特征值的概念可以推广到谱的概念。谱是标量λ的集合,对于这些标量,没有定义,也就是说它们使得没有有界逆。
很明显,如果λ是T的特征值,λ位于T的谱内。一般来讲,反过来并不成立。在希尔伯特空间或者巴拿赫空间上有一些算子完全没有特征向量。这可以从下面的例子中看到。在希尔伯特空间(所有标量级数的空间,每个级数使得收敛)上的双向平移没有特征向量却有谱值。
在无穷维空间,有界算子的谱系总是非空的,这对无界自共轭算子也成立。通过检验谱测度,任何有界或无界的自共轭算子的谱可以分解为绝对连续,离散,和孤立部分。指数增长或者衰减是连续谱的例子,而振动弦驻波是离散谱例子。氢原子是两种谱都有出现的例子。氢原子的束缚态对应于谱的离散部分,而离子化状态用连续谱表示。
特征向量-应用
特征向量-分子轨道
在量子力学中,特别是在原子物理和分子物理中,在
Hartree-Fock理论下,原子轨道和分子轨道可以定义为Fock算子的特征向量。相应的特征值通过Koopmans定理可以解释为电离势能。在这个情况下,特征向量一词可以用于更广泛的意义,因为Fock算子显式地依赖于轨道和它们的特征值。如果需要强调这个特点,可以称它为隐特征值方程。这样地方程通常采用迭代程序求解,在这个情况下称为自洽场方法。在量子化学中,经常会把Hartree-Fock方程通过非正交基集合来表达。这个特定地表达是一个广义特征值问题称为Roothaan方程。
特征向量-因子分析
在因素分析中,一个协变矩阵的特征向量对应于因素,而特征值是因素负载。因素分析是一种统计学技术,用于社会科学和市场分析、产品管理、运筹规划和其他处理大量数据的应用科学。其目标是用称为因素的少量的不可观测随机变量来解释在一些可观测随机变量中的变化。可观测随机变量用因素的线性组合来建模,再加上“残差项。
特征向量-特征脸是特征变量的例子特征脸
在图像处理中,脸部图像的处理可以看作分量为每个像素的辉度的向量。该向量空间的维数是像素的个数。一个标准化面部图形的一个大型数据集合的协变矩阵的特征向量称为特征
脸。它们对于将任何面部图像表达为它们的线性组合非常有用。特征脸提供了一种用于识别目的的数据压缩的方式。在这个应用中,一般只取最大那些特征值所对应的特征脸。
参考文献
[1]北京大学数学系.高等代数:第三版[M]. 北京:高等教育出版社,2003,,326
[2]樊恽,郑延履,刘合国线性代数学习指导(科学版):第一版[M].北京:科学出版社,2008:
[3]钱吉林高等代数解题精粹:修订版[M]. 北京:中央人民大学出版社,2005,480-485
[4]邵逸民矩阵的公共特征值与特征向量的研究[J],太原师范学院学报
[5]李慧陵,高等代数. 高等教育出版社
[6]高等代数 北京大学第三版. 北京大学精品课程
[7]扬子胥.高等代数习题解下册(修订版)[M].山东科技出版社
[8]美麻省理工学院。代数(英文版)[M]. 机械工业出版社
致谢
在这篇文章完成之时,得到了陈铁生老师很多的帮助和鼓励,陈老师多次询问研究进程,并为我指点迷津,帮助我开拓研究思路,精心点拨、热忱鼓励。陈老师一丝不苟的作风,严谨求实的态度,踏踏实实的精神,不仅授我以文,而且教我做人,虽历时三载,却给以终生受益无穷之道。对陈老师的感激之情是无法用言语表达的。在陈老师的悉心指导下,才让我按时完成本文。陈老师在论文中出现的一些问题提出了宝贵的修改意见,让我受益匪浅。同时,在学业上帮助过我的老师和同学,趁论文完成之时向他们表示衷心地感谢!