1离散余弦变换的原理视频编码和图像编码的对象主要是自然视频信号、图像信号或其预测残差(包括帧内和帧间)信号。
所以类似于图像信号和视频信号,残差信号也需要进行一定的处理。
变换编码的基本思路是将在空间域中描述的视频信号、图像信号或残差信号变换到另一个正交向量空间(变换域)中。
因此,对频率域变换系数编码的效率远远高于直接对空间域像素编码,从而达到图像压缩的目的。
协方差矩阵是图像统计特性的重要反映。
令NxN 的编码图像块的协方差矩阵为C:,根据正交变换的性质,在对NxN像素块作变换的同时,对其协方差矩阵C、作同样的变换就可以得到变换系数块的协方差矩阵Cy。
K一L变换就是在这种基本思路下产生的。
它根据C、的特征值求出的特征矢量作为变换矩阵的基向量,得到变换矩阵A,然后用A对C、实施下式变换,即: 由矩阵理论可知,上式变换的结果是典型的对角阵。
如果取特征值前面k个绝对值较大者,则还原后的空间域信号的均方误差最小,换言之还原图像的逼真度最佳。
但是,K一L变换的难点在于要根据图像的统计特性来决定变换矩阵,即变换矩阵与输入数据有关,需要求出C:的特征向量矩阵作为变换矩阵。
严格地说,C、并不是一个固定的矩阵,因而它反映的特征向量矩阵和参数设计的不确定性是制约它实际应用的关键。
1 离散余弦变换(Discrete Cosine Transform ,DCT)原理1)离散余弦变换定义(1)一维离散余弦变换的定义由下式表示:式中F(u)是第u 个余弦变换系数,u 是广义频率变量,u=1,2,3.....N-1,f(x)是时域N 点序列,x=0,1,2...N-1(2)一维离散余弦反变换由下式表示:(3)二维离散余弦变换的定义由下式表示:最后的式子是正变换公式。
其中f(x,y)是空间域二维向量之元素,其中x,y=0,1,2...N-1, F(u,v)是变换系数阵列之元素。
式∑-==10)(1)0(N x x f N F N u x x f N u F N x 2)12(cos )(2)(10π+=∑-=N u x u F N F N x f N u 2)12(cos )(2)0(1)(11π++=∑-=Nv y N u x y x f N v u F Nu x y x f N u F N v y y x f N v F y x f N F N x N y N y N x N x N y N x N y 2)12(cos 2)12(cos ),(2),(2)12(cos ),(2)0,(2)12(cos ),(2),0(),(1)0,0(1010101010101010ππππ+⋅+=+=+⋅==∑∑∑∑∑∑∑∑-=-=-=-=-=-=-=-=中表示的阵列为N ×N 。
(4)二维离散余弦反变换由下式表示:2) 性质: (1)余弦变换是实数、正交。
实数域上正交变换的分类一、正交变换定义1.1 设A是欧氏空间V的一个线性变换,若A保持向量的内积不变,即对于任意的α,βεV都有(Aɑ,Aβ) = (ɑv,β),则称A为V的正交变换.二、等价条件定理2.1 设A是n维欧氏空间V的一个线性变换,则下列命题等价:1)A是正交变换;2)A保持向量的长度不变,即对于V,|Aα|=|ɑ|;3)A把V的规范正交基变为V的规范正交基;4)A在规范正交基下的矩阵是正交矩阵.⇒2)对于αεV, 由证:1)(Aɑ,Aɑ)=(ɑ,ɑ),即得:|Aɑ|=|ɑ|2)⇒3)设ε1,ε2,…,εn是V的任一规范正交基,记εi+εj=ɑεV.由|Aɑ|=|ɑ|或(Aɑ,Aɑ)=(ɑ,ɑ)得(A(εi+εj),A(εi+εj))=(εi+εj,εi+εj)而(A(εi+εj),A(εi+εj))=(Aεi,Aεi)+2(Aεi,Aεj)+(Aεj,Aεj)=(εi ,εi)+2(εi ,εj)+(εj ,εj)(εi+εj,εi+εj )=(εi ,εi)+2(εi ,εj)+(εj ,εj)故 A ε1,A ε2,…,A εn 是V 的一组规范正交基. 3)⇒4)设ε1,ε2,…,εn 是V的规范正交基,A(ε1,ε2,…,εn)=(A ε1, A ε2,…,A εn)= (ε1,ε2,…,εn)A由3), A ε1,A ε2,…,A εn 是0,(,)(,)1,i j i j i j A A i j εεεε≠⎧∴==⎨=⎩V的规范正交基,故A可看作是由规范正交基ε1,ε2,…,εn到规范正交基Aε1,Aε2,…,Aεn的过渡矩阵,A是正交矩阵.4) 1)设ε1,ε2,…,εn是V 的规范正交基,且A在此基下的矩阵A为正交矩阵.由(Aε1,Aε2,…,Aεn)= (ε1,ε2,…,εn)A,知Aε1,Aε2,…,Aεn也是V的规范正交基,设α=x1ε1+x2ε2+……x nεn,Β=y1ε1+y2ε2+……y nεn,Aɑ=x1Aε1+x2Aε2+…+xnAεnAβ=y1Aε1+y2Aε2+…+ynAεn (Aα,Aβ)= x1y1+x2y2+…+xnyn(α,β)= x1y1+x2y2+…+xnyn 所以 (A α,A β)=(α,β),故A 为正交变换.三、规范正交基到规范正交基的过渡矩阵。
离散余弦变换离散余弦变换(sinuset transform)是由美国人怀尔斯于1928年首先提出来的。
在数学中,离散余弦变换(sinuset transform)是由英国数学家希尔伯特首先引入到数学中来的,是由广义指标系的差分得到的。
具体地说,它是对于数集U,用广义指标L表示集合E的一个数列A=a_{i_1},…, a_{i_r},且a_i∈I(U),而x∈I(U)。
由于f(a_{i_1},…, a_{i_r})(x)表示数集U中的所有数x,则f(x)就是对这个数集U的广义指标的一种偏序映射。
因此,称f是离散余弦变换。
在数论中,离散余弦变换也很重要,比如我们常常需要求二次差的问题。
由于实际应用中的计算量很大,对于离散余弦变换不可能作精确的理论研究,通常只能采用近似的方法。
以二维平面上的点为例,设有某点P(x, y),当y取值为0时,则称P点为左顶点,取其他值时,则称P点为右顶点,如果在某区间[-1, 1], [-1, 2], P为左、右顶点,则称在该区间内, P为上半平面,在该区间外, P为下半平面。
若P点坐标为(x, y),则在某区间[ -1, 1]和[-1, 2]内, P点称为上半平面;若P点坐标为(-1, -1),则在[ -1, 2]内, P点称为下半平面。
其中,点P在左、右两顶点处的距离称为斜率。
如果点P在左顶点与右顶点之间的距离等于斜率,那么就称P点为上半平面。
将球面三角形绕y轴旋转一个单位长度,记为a。
根据a,得到新的三角形绕x轴旋转一个单位长度,记为b,并设b为新三角形与原三角形的公共边。
因此得到新的三角形绕x轴旋转了a、 b两个单位长度。
设新三角形与旧三角形的斜率分别为h和k。
则h||k,则有||b|||a| -||b|||x||,||b|||x||=||a|||b||+||c|||a||,||c|||a||=||a||,||c ||=||b||+||a||。
离散余弦变换应用范围非常广泛,它已经成为数学的一个基本工具,因为它的特性使得它成为理解许多数学概念的有效工具。
离散余弦变换编辑本段基本介绍最常用的一种离散余弦变换的类型是下面给出的第二种类型,通常我们所说的离散余弦变换指的就是这种。
它的逆,也就是下面给出的第三种类型,通常相应的被称为"反离散余弦变换","逆离散余弦变换"或者"idct"。
存有两个有关的转换,一个就是线性正弦转换(dstfordiscretesinetransform),它相等于一个长度大概就是它两倍的实奇函数的线性傅里叶转换;另一个就是改良的线性余弦转换(mdctformodifieddiscretecosinetransform),它相等于对交错的数据展开线性余弦转换。
编辑本段主要应用线性余弦转换,尤其就是它的第二种类型,经常被信号处理和图像处理采用,用作对信号和图像(包含静止图像和运动图像)展开有损数据压缩。
这就是由于线性余弦转换具备很强的"能量分散"特性:大多数的自然信号(包含声音和图像)的能量都分散在线性余弦转换后的低频部分,而且当信号具备吻合马尔科夫过程(markovprocesses)的统计数据特性时,线性余弦转换的回去相关性吻合于k-l转换(karhunen-loève转换--它具备最优的回去相关性)的性能。
例如,在静止图像编码标准jpeg中,在运动图像编码标准mjpeg和mpeg的各个标准中都使用了离散余弦变换。
在这些标准制中都使用了二维的第二种类型离散余弦变换,并将结果进行量化之后进行熵编码。
这时对应第二种类型离散余弦变换中的n通常是8,并用该公式对每个8x8块的每行进行变换,然后每列进行变换。
得到的是一个8x8的变换系数矩阵。
其中(0,0)位置的元素就是直流分量,矩阵中的其他元素根据其位置表示不同频率的交流分类。
一个相似的转换,改良的线性余弦转换被用在高级音频编码(aacforadvancedaudiocoding),vorbis和mp3音频放大当中。
在傅立叶级数展开式中,如果被展开的函数是实偶函数,那么其傅立叶级数中只包含余弦项,再将其离散化可导出余弦变换,因此称之为离散余弦变换。
DCT原理1(21)()()()cos,0,1, (1)2Nnn kC k k x n k NNπ-=+==-∑()11,2,,1kc kk N⎧=⎪=⎨=-⎪⎩其中函数1(21)()()()cos,0,1, (1)2Nkn kx n c k C k n NNπ-=+==-二维的DCT1100(21)(21)(,)()()(,)cos cos22M Nm nm k n lY k l k c l x m nM Nππ--==++=∑∑其中m,k=0,1,…,M-1; n,l=0,1,…,N-1。
()11,2,,1kc kk M⎧=⎪=⎨=-⎪⎩其中函数()11,2,,1kc lk N⎧=⎪=⎨=-⎪⎩二维逆离散余弦变换(IDCT)的定义如下:1100(21)(21)(,)()()(,)cos cos22M NK Lm k n lx m n c k c l Y k lM Nππ--==++=∑∑DCT到DFT的映射是非常具有吸引力的,因为我们可以利用FFT类型算法的多种变化。
矿产资源开发利用方案编写内容要求及审查大纲矿产资源开发利用方案编写内容要求及《矿产资源开发利用方案》审查大纲一、概述㈠矿区位置、隶属关系和企业性质。
如为改扩建矿山, 应说明矿山现状、特点及存在的主要问题。
㈡编制依据(1简述项目前期工作进展情况及与有关方面对项目的意向性协议情况。
(2 列出开发利用方案编制所依据的主要基础性资料的名称。
如经储量管理部门认定的矿区地质勘探报告、选矿试验报告、加工利用试验报告、工程地质初评资料、矿区水文资料和供水资料等。
对改、扩建矿山应有生产实际资料, 如矿山总平面现状图、矿床开拓系统图、采场现状图和主要采选设备清单等。
二、矿产品需求现状和预测㈠该矿产在国内需求情况和市场供应情况1、矿产品现状及加工利用趋向。