数字音源,也就是数字音频格式,最早指的是CD,CD经过压缩之后,又衍生出多种适于在随身听上播放的格式,这些压缩过的格式,我们可以分为两大类:有损压缩的和无损压缩的。这里所说的压缩,是指把PCM编码的或者是WAV格式的音频流经过特殊的压缩处理,转换成其他格式,从而达到减小文件体积的效果。有损/无损,是指经过压缩过后,新文件所保留的声音信号相对于原来的PCM/WAV格式的信号是否有所削减。

本文转自:果果文本库
原文标题:19种音频格式介绍及音质压缩比的比较

音频相关参数

速率

什么是速率?当然我不能直接给你解释说“速率就是比特率”。大家在用一些软件播放声音文件的时候应该注意到了一个小小的信息。比如“128Kbps”、“1411Kbps”…也有朋友知道了,通常情况下,”Kbps”前面的数字越大,声音效果越好,比如CD就是“1411Kbps”。那么,到底这些数字代表什么呢?简单的说来就是在每秒钟时间内,有多少数据被转换成声音。之所以CD的音质比MP3好,是因为CD在每一秒内的信息比MP3多。比如,128Kbps的MP3文件相比1411Kbps的CD文件,其每秒被转换的数据量,MP3比CD少了近12倍。同样的一首歌曲,CD听来就要细腻得多(当然人群中有这么一群号称“木耳”的人可能觉得效果是一样的)MP3用较少的数据表达相同的内容,其详细程度当然就不如CD了。

采样率

采样率也是很常见的一个词语。具体表现形式为“XXHz”,其中“XX”是一个具体数字。比如“44100Hz(44.1KHz)”,“32000Hz(32KHz)”等。之前已经说过了,数码音频文件是由很多个“点”来组成的,那么采样率其实就是采集这些“点”的一个“数量”标准。很显然“44100Hz”比“32000Hz”的采样率要高,所以单位时间内(1秒)搜集到的点就更多。单位时间的点越多声音的信息也就越完善,当然也就更接近于真实。所以,如果在保证速率相同的条件下,“44100Hz”的文件要好于“32000Hz”(当然,这也不是绝对的)。

有损压缩

有损压缩的音源,其实我们都比较熟悉,目前流行的有损格式主要有MP3、WMA、OGG、MP3pro、AAC、VQF、ASF等。

WMV格式

WMA的全称是WindowsMedia Audio,是微软力推的一种音频格式。WMA格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到1:18,生成的文件大小只有相应MP3文件的一半。

MP3格式

MP3的全称是MovingPicture Experts Group Audio Layer Ⅲ。简单的说,MP3就是一种音频压缩技术,由于这种压缩方式的全称叫MPEGAudio Layer 3,所以人们把它简称为MP3。它诞生于1993年,其“父母”是德国夫朗和费研究院(FaunhofeIIS)和法国汤姆生(Thomson)公司。

MP3是利用MPEGAudio Layer 3的技术,将音乐以1:10甚至1:12的压缩率,压缩成容量较小的文件,换句话说,能够在音质丢失很小的情况下把文件压缩到更小的程度。而且还非常好的保持了原来的音质。正是因为MP3体积小,音质高的特点使得MP3格式几乎成为网上音乐的代名词。每分钟音乐的MP3格式只有1MB左右大小,这样每首歌的大小只有3-4兆字节。使用MP3播放器对MP3文件进行实时的解压缩(解码),这样,高品质的MP3音乐就播放出来了。

MP3编码质量分为:固定码率(CBR),平均码率(ABR)和动态码率(VBR)。早期的MP3编码技术并不完善,很长的一段时间以来,大多数人都使用128Kbps的CBR(固定编码率)格式来对MP3文件编码,直到最近,VBR(可变编码率)和ABR(平均编码率)的压缩方式出现,编码的比特率最高可达320Kbps,MP3文件在音质上才开始有所进步,而LAME的出现,则为这一进步带来了质的飞跃。

补充:最高比特率320K,高频部分一刀切是它的缺点。音质不高!

WMA格式

WMA的全称是WindowsMedia Audio,是微软力推的一种音频格式。WMA格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到1:18,生成的文件大小只有相应MP3文件的一半。

WMA与MP3音质和体积上的对比特点,可以总结为:低比特率(小于128Kbps)时,WMA体积比MP3小,音质比MP3好;而在高比特率(大于128K)时,MP3的音质则比WMA好。

WMA相对于MP3的最大特点就是有极强的可保护性,可以说,WMA的推出,就是针对MP3没有版权保护的缺点来的。WMA可以通过DRM(Digital Rights Management)方案加入防止拷贝,或者加入限制播放时间和播放次数,甚至是播放机器的限制,可有力地防止盗版。

补充:128kbps为wma最优压缩比,128kbpswma=192kbps mp3

OGG格式

Ogg全称应该是OGGVobis(oggVorbis)是一种新的音频压缩格式,类似于MP3等现有的音乐格式。但有一点不同的是,它是完全免费、开放和没有专利限制的。OGGVobis有一个很出众的特点,就是支持多声道,随着它的流行,以后用随身听来听DTS编码的多声道作品将不会是梦想。

Vorbis 是这种音频压缩机制的名字,而Ogg则是一个计划的名字,该计划意图设计一个完全开放性的多媒体系统。目前该计划只实现了OggVorbis这一部分。

Ogg Vorbis文件的扩展名是。OGG。这种文件的设计格式是非常先进的。现在创建的OGG文件可以在未来的任何播放器上播放,因此,这种文件格式可以不断地进行大小和音质的改良,而不影响旧有的编码器或播放器。

补充:目前最好的有损格式之一,MP3部分支持,智能手机装软件部分可以支持,最高比特率500kbps。

Mp3Pro格式

在WMA刚开始流行的时候,还没有高品质的MP3,所以当时MP3的地位真的有点动摇了,于是Thomson公司在2001年6月,携手FaunhofeIIS,发布了一种新的格式MP3pro,这是对MP3格式的改良,编码算法比MP3要复杂得多,简单的说,就是分两层编码,在MP3的基础上,再与另外一种技术(SB频段复制技术)混合编码。

Mp3Pro是Mp3编码格式的升级版本。MP3Pro是由瑞典Coding科技公司开发的,在保持相同的音质下同样可以把声音文件的文件量压缩到原有MP3格式的一半大小。而且可以在基本不改变文件大小的情况下改善原先的MP3音乐音质。它能够在用较低的比特率压缩音频文件的情况下,最大程度地保持压缩前的音质。这种格式在低位率的时候,压缩效率非常高,所以在一般音质情况下,同位率的MP3pro的体积要比MP3甚至WMA都小得多,而音质却是三者中最好的。

MP3pro可以实现完全的兼容性。经过mp3Pro压缩的文件,扩展名仍旧是。mp3。可以在老的mp3播放器上播放。老的mp3文件可以在新的mp3pro播放器上进行播放。实现了该公司所谓的“向前向后兼容”。

从技术上讲,MP3pro是一种非常优秀的编码方式,但是它高昂的专利费,使它没有真正流行起来。

RA系列

RA、RAM和RM都是Real公司成熟的网络音频格式,采用了“音频流”技术,所以非常适合网络广播。在制作时可以加入版权、演唱者、制作者、Mail 和歌曲的Title等信息。

RA可以称为互联网上多媒体传播的霸主,适合于网络上进行实时播放,是目前在线收听网络音乐最好的一种格式。

MOD格式

MOD是一种类似波表的音乐格式,但它的结构却类似MIDI,使用真实采样,体积很小,音质好,在以前的DOS年代,MOD经常被作为游戏的背景音乐。现在的MOD可以包含很多音轨,而且格式众多,如S3M、NST、669、MTM、XM、IT、XT和RT等。

MD格式

MD(即MiniDisc)是SONY 公司于1992年推出的一种完整的便携音乐格式,它所采用的压缩算法就是ATRAC技术(压缩比是1∶5)。MD又分为可录型MD(Recordable,有磁头和激光头两个头)和单放型MD(Pre-recorded,只有激光头)。

强大的编辑功能是MD的强项,可以快速选曲、曲目移动、合并、分割、删除和曲名编辑等多项功能,比CD更具个性化,随时可以拥有一张属于自己的MD专辑。MD的产品包括MD随身听、MD床头音响、MD汽车音响、MD录音卡座、MD摄像枪和MD驱动器等。

ASF格式

ASF的全称是AdvancedStreaming Format,是微软所制订的一种媒体播放格式,适合在网络上播放。而WindowsMedia On-Demand Producer则是制作ASF档案的免费软件,让即使是初学者也能很轻易的利用现成的WAV或AVI档案制作ASF文件。

AAC格式

AAC实际上是高级音频编码的缩写。AAC是由Fraunhofer IIS-A、杜比和AT&T共同开发的一种音频格式,它是MPEG-2规范的一部分。AAC所采用的运算法则与MP3的运算法则有所不同,AAC通过结合其他的功能来提高编码效率。AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法(比如MP3等)。它还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。总之,AAC可以在比MP3文件缩小30%的前提下提供更好的音质。

补充:目前最好的有损格式之一。有多种编码,faac,nero为常见,比特率最高448kbps。硬件支持方面,高级mp3和现在手机普遍支持。

MID格式

MID是midi的简称,是它的扩展名。MIDI是英语MusicInstrument Digital Interface 的缩写,翻译过来就是“数字化乐器接口”,也就是说它的真正涵义是一个供不同设备进行信号传输的接口的名称。我们如今的MIDI音乐制作全都要靠这个接口,在这个接口之间传送的信息也就叫MIDI信息。MIDI最早是应用在电子合成器一种用键盘演奏的电子乐器上,由于早期的电子合成器的技术规范不统一,不同的合成器的链接很困难,在1983年8月,YAMAHA、ROLAND、KAWAI等著名的电子乐器制造厂商联合指定了统一的数字化乐器接口规范,这就是MIDI1.0技术规范。此后,各种电子合成器已经电子琴等电子乐器都采用了这个统一的规范,这样,各种电子乐器就可以互相链接起来,传达MIDI信息,形成一个真正的合成音乐演奏系统。

由于多媒体计算机技术的迅速发展,计算机对数字信号的强大的处理能力,使得计算机处理MIDI信息成为顺理成章的事情了,所以,现在不少人把MIDI音乐称之为电脑音乐。事实上,利用多媒体计算机不但可以播放、创作和实时地演奏MIDI音乐。甚至可以把MIDI音乐转变成看的见的乐谱(五线谱或简谱)打印出来,反之,也可以把乐谱变成美妙的音乐。利用MIDI的这个性质,可以用于音乐教学(尤其是识谱),让学生利用计算机学习音乐知识和创作音乐。

M4A格式

M4A是MPEG4音频标准的文件的扩展名。在MPEG4标准中提到,普通的MPEG4文件扩展名是。mp4。自从Apple开始在它的iTunes以及iPod中使用。m4a以区别MPEG4的视频和音频文件以来,。m4a这个扩展名变得流行了。目前,几乎所有支持MPEG4音频的软件都支持。m4a。最常用的。m4a文件是使用AAC格式的(文件),不过其他的格式,比如AppleLossless甚至mp3也可以被放在。m4a容器里(TC注:这个container的概念类似于。mkv文件)。可以安全的把只包含音频的。mp4文件的扩展名改成。m4a,以便让它能在你喜欢的播放器里播放,反之亦然。

VQF格式

VQF格式是由YAMAHA和NTT共同开发的一种音频压缩技术,它的核心是减少数据流量但保持音质的方法来达到更高的压缩比,它的压缩率能够达到1:18,因此相同情况下压缩后VQF的文件体积比MP3小30%~50%,更便利于网上传播,同时音质极佳,接近CD音质(16位44.1kHz立体声)。可以说VQF技术上也是很先进的,但VQF未公开技术标准,由于宣传不力,这种格式难有用武之地,至今未能流行开来。

AAC+格式

AAC+也称之为HE-AAC。

HE意思是”highefficiency”(高效性)。HE-AAC混合了AAC与SBR技术。SBR代表的是SpectralBand Replication(频段复制)。SBR的关键是在低码流下提供全带宽的编码而不会产生多余的信号。传统认为音频编码在低码流下意味着减少带宽和降低采样率(见MP3FAQ #7)或产生令人不快的噪音信号。SBR解决问题的方法是让核心编码去编码低频信号,而SBR解码器通过分析低频信号产生高频信号和一些保留在比特流中的指导信号(通常码流极低,~2kbps)。这就是采用无SBR解码器的原因,这样你的带宽(frequencyresponse)(频率响应)会被严重浪费。这也是为什么被叫做SpectralBand Replication的原因,它只是增加音频的带宽,而非重建。

AIFF与AU格式

这里顺便提一下由苹果公司开发的AIFF(Audio Interchange FileFormat)

格式和为UNIX系统开发的AU格式,它们都和WAV非常相像,在大多数的音频编辑软件中也都支持它们这几种常见的音乐格式。

无损压缩

对于我们最常说的“无损音频”来说,一般都是指传统CD格式中的16bit/44.1kHz采样率的文件格式,而知所以称为无损压缩,也是因为其包含了20Hz-22.05kHz这个完全覆盖人耳可闻范围的频响频率而得名。

音频的无损压缩,大家可能还比较陌生,但这并不意味着无损压缩技术发展得不好,相反,在无损压缩领域,早就有许多很出色的作品,比如APE、FLAC、WavPack、LPAC、WMALossless、AppleLossless、La、OptimFOG、Shoten等。

CD格式

即CD唱片,一张CD可以播放74分钟左右的声音文件,Windows系统中自带了一个CD播放机,另外多数声卡所附带的软件都提供了CD播放功能,甚至有一些光驱脱离电脑,只要接通电源就可以作为一个独立的CD播放机使用。

标准CD格式为44.1K的采样,速率88K/秒,16位量化位数,因为CD 可以说是近似无损的,因此它的声音基本上是忠于原声的,因此如果你如果是一个音响发烧友的话,CD是你的首选。它会让你感受到天籁之音。CD光盘可以在CD唱机中播放,也能用电脑里的各种播放软件来重放。但注意:不能直接的复制CD格式的文件到电脑硬盘上播放,需要使用像EAC这样的抓音轨软件把CD格式的文件转换成WAV,这个转换过程基本上是无损的。推荐大家使用这种方法。

WAV格式

WAV格式是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。WAV格式是以RIFF格式为标准的。RIFF是英文ResourceInterchange File Format的缩写,每个WAVE文件的头四个字节便是“RIFF”。WAVE文件由文件头和数据体两大部分组成。

WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数,因此WAV的音质与CD相差无几,但WAV格式对存储空间需求太大不便于交流和传播。

补充:WAV属于无损音乐格式,缺点:体积十分大!

FLAC格式

FLAC即是FreeLossless Audio Codec的缩写,全称应该叫OGGFLAC,中文可解为无损音频压缩编码。它是OGG计划的一部分,当然也就是开源、免费的了,这也难怪它这么快就得到了多家MP3厂商的支持。

FLAC是一套著名的自由音频压缩编码,其特点是无损压缩。FLAC压缩比可以达到2:1,对于无损压缩来说,这已经是相当高的比例了;而且它解码速度快,只需进行整数运算即可完成整个解码过程,对CPU的运算能力要求很低,所以普通的随身听,都可以轻松实现实时解码。

不同于其他有损压缩编码如MP3 及AAC,它不会破坏任何原有的音频资讯,所以可以还原音乐光盘音质。现在它已被很多软件及硬件音频产品所支持。简而言之,FLAC与MP3相仿,但是是无损压缩的,也就是说音频以FLAC方式压缩不会丢失任何信息。这种压缩与Zip的方式类似,但是FLAC将给你更大的压缩比率,因为

FLAC是专门针对音频的特点设计的压缩方式,并且你可以使用播放器播放FLAC压缩的文件,就象通常播放你的MP3文件一样。

补充:为无损格式,较ape而言,他体积大点,但是兼容性好,编码速度快,播放器支持更广

APE格式

APE是目前流行的、由Monkey’sAudio出品的一种数字音乐文件格式,它出现得比FLAC早,而且名气也比FLAC大。与MP3、OGG这类有损压缩方式不同,APE是目前世界上惟一得到公认的音频无损压缩格式,也就是说当您将从音频CD上读取的音频数据文件压缩成APE格式后,您还可以再将APE格式的文件还原,而还原后的音乐文件与压缩前一模一样,没有任何损失。而现在越来越多的人将它在网络传播,因为被压缩后的APE文件容量要比WAV源文件小一半多,可以节约传输所用的时间,也更方便传播!由于APE的采样率高达800kbps~1400kbps,接近于音乐CD的1411.2kbps,远远高于MP3的128kbps,因此它在压缩后的音质和源文件音质几乎毫无差异,其音质之佳已经过了严格的盲听测试,得到了全世界发烧友的公认。APE的这些特点,都是其他无损压缩格式所争相效仿的。

在APE出现之前,音乐迷们都认为以CD或者WAV来保存自己喜欢的音乐素材是最好的方法了,但APE的出现,足以使他们改变这种看法,因为APE既可以保持音乐信号的无损,又可以以比WAV高得多的压缩率(接近2:1)压缩WAV文件,而且可以无须解压而直接播放。由于压缩后的APE文件只有原文件一半左右大小,APE格式受到了许多音乐爱好者的喜爱,特别是对于希望通过网络传输音频CD的朋友来说,APE可以帮助他们节约大量的资源。APE如此流行,在网上也比较容易能下载到APE格式的文件。

补充:为无损压缩格式,较flac而言,他体积较小。编码速度偏慢。

压缩比较

压缩比

aac > ogg > mp3(wma) > ape > flac > wav(同一音源条件下)

mp3和wma以192kbps为分界线,192kbps以上mp3好,192kbps以下wma好。

音质

wav = flac = ape > aac > ogg > mp3 > wma

综合音质体积编码率

aac > ogg > flac > ape > mp3 > wav、wma