容中尔甲 高原红MP3技术⽩⽪书-⾳频格式全解析
MP3的技术虽然现在已经完全公开,但是,其具体的技术细节还是有⼀定的深度,因此此次⼩编对某些技术进⾏深度解释,希望⽹友们笑纳。
采样率:
  数码⾳频系统是通过将声波波形转换成⼀连串的⼆进制数据来再现原始声⾳的,实现这个步骤使⽤的设备是模/数转换器(A/D)它以每秒上万次的速率对声波进⾏采样,每⼀次采样都记录下了原始模拟声波在某⼀时刻的状态,称之为样本。
  将⼀串的样本连接起来,就可以描述⼀段声波了,把每⼀秒钟所采样的数⽬称为采样频率或采率,单位为HZ(赫兹)。采样频率越⾼所能描述的声波频率就越⾼。 对于每个采样系统均会分配⼀定存储位(bit数)来表达声波的声波振幅状态,称之为采样分辩率或采样精度,每增加⼀个bit,表达声波振幅的状态数就翻⼀翻,并且增加6db的动态范围态,即6db的动态范围,⼀个2bit的数码⾳频系统表达千种状态,即12db的动态范围,以此类推。如果继续增加bit数则采样精度就将以⾮常快的速度提⾼,可以计算出16bit能够表达65536种状态,对应,96db ⽽20bit可以表达1048576种状态,对应120db。24bit可以表达多达16777216种状态。对应144db的动态范围,采样精度越⾼,声波的还原就越细腻。(注:动态范围是指声⾳从最弱到最强的变化范围)⼈⽿的听觉范围通常是20HZ~20KHZ。
  根据奈魁斯特(NYQUIST)采样定理,⽤两倍于⼀个正弦波的频繁率进⾏采样就能完全真实地还原该波形,因此⼀个数码录⾳波的休样频率直接关系到它的最⾼还原频率指标例如,⽤44.1KHZ的采样频率进⾏采样,则可还原最⾼为22.05KHZ的频率-----这个值略⾼于⼈⽿的听觉极限,(注: 可录MD,例R900的取样频率为44.1KHZ并且有取样频率转换器,可将输⼊的32KHz/44.1KHZ/48KHZ转换为该机的标准取样频率44.1KHZ的还原频率⾜已记⽰和真实再现世界上所有⼈再能辩的声⾳了,所以CD⾳频的采样规格定义为16bit。
44KHZ, 即使在最理想的环境下⽤现实⽣活中⼏乎不可能制造的⾼精密电⼦元器件真实地实现了16bit的录⾳,仍然会受到滤波和声特定位等问题的困扰,⼈们还是能察觉出⼀些微⼩的失真所以很多专业数码⾳频系统已经使⽤18bit甚⾄24bit 进⾏录⾳和回放了。
现有的采样⽅式:
以为林更新公布恋情了
  MP3:MP3的全称应为MPEG1 Layer-3⾳频⽂件,MPEG(Moving Picture Experts Group)在汉语中译为活动图像专家组,特指活动影⾳压缩标准,MPEG⾳频⽂件是MPEG1标准中的声⾳部分,也叫MPEG⾳频层,它根据压缩质量和编码复杂程度划分为三层,即Layer-1、Layer2、Layer3,且分别对应MP1、MP2、MP3这三种声⾳⽂件,并根据不同的⽤途,使⽤不同层次的编码。MPEG⾳频编码的层次越⾼,编码器越复杂,压缩率也越⾼,MP1和MP2的压缩率分别为4:1和6:1-8:1,⽽MP3的
压缩率则⾼达10:1-12:1,也就是说,⼀分钟CD⾳质的⾳乐,未经压缩需要10MB的存储空间,⽽经过MP3压缩编码后只有1MB左右。不过MP3对⾳频信号采⽤的是有损压缩⽅式,为了降低声⾳失真度,MP3采取了“感官编码技术”,即编码时先对⾳频⽂件进⾏频谱分析,然后⽤过滤器滤掉噪⾳电平,接着通过量化的⽅式将剩下的每⼀位打散排列,最后形成具有较⾼压缩⽐的MP3⽂件,并使压缩后的⽂件在回放时能够达到⽐较接近原⾳源的声⾳效果。(另MP3PRO:mp3PRO编码器将⾳频的录⾳分成两个部分:mp3部分和PRO部分。mp3部分分析低频段(Low Frequency Band)信息,并将其编码成通常的mp3⽂件数据流。这就使得编码器能够集中编码更少的有⽤信息,获得更佳品质的编码效果。同时,这也保证了mp3PRO⽂件同⽼的mp3播放器的兼容性。PRO部分分析的则是⾼频段(High Frequency Band)信息,并将其编码成mp3数据流的⼀部分,⽽这些通常在⽼的mp3解码器⾥是被忽略的。新的mp3PRO解码器会有效地利⽤这部分数据流,将两段(⾼频段和低频段)合并起来产⽣完全的⾳频带,达到增强⾳质的效果。)
  WMA:WMA就是Windows Media Audio编码后的⽂件格式,由微软开发,WMA针对的不是单机市场,是⽹络!竞争对⼿就是⽹络媒体市场中著名的Real Networks。微软声称,在只有64kbps的码率情况下,WMA可以达到接近CD的⾳质。和以往的编码不同,WMA ⽀持防复制功能,她⽀持通过Windows Media Rights Manager 加⼊保护,可以限制播放时间和播放次数甚⾄于播放的机器等等。WMA ⽀持流技术,即⼀边读⼀边播放,因此WMA可以很轻松的实现在线⼴播,由于是微软的杰作,
因此,微软在Windows中加⼊了对WMA的⽀持,WMA有着优秀的技术特征,在微软的⼤⼒推⼴下,这种格式被越来越多的⼈所接受。
  WAV:这是⼀种古⽼的⾳频⽂件格式,由微软开发。WAV是⼀种⽂件格式,符合 PIFF Resource Interchange File Format规范。所有的WAV都有⼀个⽂件头,这个⽂件头⾳频流的编码参数。WAV对⾳频流的编码没有硬性规定,除了PCM之外,还有⼏乎所有⽀持ACM规范的编码都可以为WAV的⾳频流进⾏编码。很多朋友没有这个概念,我们拿AVI做个⽰范,因为AVI和WAV在⽂件结构上是⾮常相似的,不过AVI多了⼀个视频流⽽已。我们接触到的AVI有很多种,因此我们经常需要安装⼀些Decode才能观看⼀些AVI,我们接触到⽐较多的DivX就是⼀种视频编码,AVI可以采⽤DivX编码来压缩视频流,当然也可以使⽤其他的编码压缩。同样,WAV也可以使⽤多种⾳频编码来压缩其⾳频流,不过我们常见的都是⾳频流被PCM编码处理的WAV,但这不表⽰WAV只能使⽤PCM编码,MP3编码同样也可以运⽤在WAV中,和AVI⼀样,只要安装好了相应的Decode,就可以欣赏这些WAV了。在Windows平台下,基于PCM编码的WAV是被⽀持得最好的⾳频格式,所有⾳频软件都能完美⽀持,由于本⾝可以达到较⾼的⾳质的要求,因此,WAV也是⾳乐编辑创作的⾸选格式,适合保存⾳乐素材。因此,基于PCM编码的WAV被作为了⼀种中介的格式,常常使⽤在其他编码的相互转换之中,例如MP3转换成WMA。
  Ogg Vorbis :号称MP3杀⼿!Ogg Vorbis究竟什么来头呢?OGG是⼀个庞⼤的多媒体开发计划的项
⽬名称,将涉及视频⾳频等⽅⾯的编码开发。整个OGG项⽬计划的⽬的就是向任何⼈提供完全免费多媒体编码⽅案!OGG的信念就是:OPEN!FREE!Vorbis这个词汇是特⾥·普拉特柴特的幻想⼩说《Small Gods》中的⼀个"花花公⼦"⼈物名。这个词汇成为了OGG项⽬中⾳频编码的正式命名。⽬前Vorbis已经开发成功,并且开发出了编码器。Ogg Vorbis是⾼质量的⾳频编码⽅案,官⽅数据显⽰:Ogg Vorbis可以在相对较低的数据速率下实现⽐MP3更好的⾳质!Ogg Vorbis这种编码也远⽐90年代开发成功的MP3先进,她可以⽀持多声道,这意味着什么?这意味着Ogg Vorbis在SACD、DTSCD、DVD AUDIO抓轨软件(⽬前这种软件还没有)的⽀持下,可以对所有的声道进⾏编码,⽽不是MP3只能编码2个声道。多声道⾳乐的兴起,给⾳乐欣赏带来了⾰命性的变化,尤其在欣赏交响时,会带来更多临场感。这场⾰命性的变化是MP3⽆法适应的。和MP3⼀样,Ogg Vorbis是⼀种灵活开放的⾳频编码,能够在编码⽅案已经固定下来后还能对⾳质进⾏明显的调节和新算法的改良。因此,它的声⾳质量将会越来越好,和MP3相似,Ogg Vorbis更像⼀个⾳频编码框架,可以不断导⼊新技术逐步完善。和MP3⼀样,OGG也⽀持VBR。给自己的情书
  RA:RA就是RealAudio格式,这是各位⽹⾍接触得⾮常多的⼀种格式,⼤部分⾳乐⽹站的在线试听都是采⽤了RealAudio,这种格式完全针对的就是⽹络上的媒体市场,⽀持⾮常丰富的功能。最⼤的闪烁点就是这种格式可以根据听众的带宽来控制⾃⼰的码率,在保证流畅的前提下尽可能提⾼⾳质。RA可以⽀持多种⾳频编码,包括ATRAC3。和WMA⼀样,RA不但都⽀持边读边放,也同样⽀持使⽤
特殊协议来隐匿⽂件的真实⽹络地址,从⽽实现只在线播放⽽不提供下载的欣赏⽅式。这对唱⽚公司和唱⽚销售公司很重要,在各⽅的⼤⼒推⼴
悉尼奥运会歌曲下,RA和WMA是⽬前互联⽹上,⽤于在线试听最多的⾳频媒体格式。
  APE:APE是Monkey's Audio提供的⼀种⽆损压缩格式。Monkey's Audio提供了Winamp的插件⽀持,因此这就意味着压缩后的⽂件不再是单纯的压缩格式,⽽是和MP3⼀样可以播放的⾳频⽂件格式。这种格式的压缩⽐远低于其他格式,但能够做到真正⽆损,因此获得了不少发烧⽤户的青睐。在现有不少⽆损压缩⽅案种,APE是⼀种有着突出性能的格式,令⼈满意的压缩⽐以及飞快的压缩速度,成为了不少朋友私下交流发烧⾳乐的唯⼀选择。
魏晨于玮  ACC:AAC(⾼级⾳频编码技术,Advanced Audio Coding)是杜⽐实验室为⾳乐社区提供的技术。AAC号称「最⼤能容纳48通道的⾳轨,采样率达96 KHz,并且在320Kbps的数据速率下能为5.1声道⾳乐节⽬提供相当于ITU-R⼴播的品质」。和MP3⽐起来,它的⾳质⽐较好,也能够节省⼤约30%的储存空间与带宽。它是遵循MPEG-2的规格所开发的技术。最知心的朋友
  ATRAC 3/ATRAC 3 plus:ATRAC3(AdaptiveTransformAcousticCoding3)由⽇本索尼公司开发,是MD所采⽤的ATRAC的升级版,其压缩率(约为ATRAC的2倍)和⾳质均与MP3相当。压缩原理包括同时掩蔽、时效掩蔽和等响度曲线等,与MP3⼤致相同。ATRAC3的版权保护功能采⽤的是OpenMG。
⽬前,对应ATRAC3的便携式播放机主要是索尼公司⾃⼰的产品。不过,该公司已于2000年2⽉与富⼠通、⽇⽴、NEC、Rohm、三洋和TI等半导体制造商签署了制造并销售ATRAC3⽤LSI的专利许可协议。