MP3 不是最好的聲音壓縮格式!有損、無損數位音訊檔案格式大閱兵

ADVERTISEMENT

常見音訊檔案格式

接下來我們會開始介紹常見的音訊檔案格式,總共分為三類:非壓縮音訊檔案格式、無失真壓縮音訊檔案格式和失真壓縮音訊檔案格式。

非壓縮音訊檔案格式

Waveform Audio Format WAV

WAV 是由微軟和 IBM 公司所開發的一種音訊編碼格式,是一種基於 RIFF 檔案格式,內部由使用小端序的多位元整數方式儲存,儲存的音訊未經過任何壓縮,為標準的線性 PCM,所以在聲音方面不會出現失真的情況。但檔案體積在眾多音訊格式中算得上是最大的,主要常見於 Windows 作業系統中,標準 WAV 副檔名是 .wav。

Audio Interchange File Format AIFF

音頻交換文件格式〈AIFF〉是由 Apple 在 1988 年基於美商藝電的交換檔案格式〈Interchange File Format〉基礎開發而成,同樣內部音訊為標準線性 PCM,目前多被用在 Apple 公司的 OS X 作業系統上。標準 AIFF 文件的副檔名是 .aiff 或 .aif,比較需要注意的是,由於標準 AIFF 格式沒有規定替代性的位元組順序,Apple 又開發了一種 AIFF-C 壓縮結構的檔案格式,理論上壓縮過的 AIFF 文件的副檔名應該是 .aifc,但是少部分還是保留 .aiff 和 .aif 副檔名。

無失真壓縮音訊檔案格式

Free Lossless Audio Codec FLAC

FLAC 就名稱上即可知道這格式是免費開放「Free」和無損音訊編碼「Lossless Audio Codec」,這個音樂壓縮格式的源碼是完全開放。也由於這個原因,FLAC 幾乎相容於所有作業系統平台,不僅在 Windows 下有非常成熟的音訊製作程式,同時也被多數第三方軟體所支援。部分公司出品的數位播放機甚至能夠支援硬體播放 FLAC,可以說是目前市面上支援度最廣泛的無損音訊壓縮格式。

FLAC 只支援定點取樣,這是為了確保沒有任何浮點運算帶來的約數錯誤而影響音質,也由於只需要整數運算,FLAC 相對於大多數編碼而言,對計算速度的要求並不會太高。同時 FLAC 具備 CRC 和 MD5 標記校驗機制,FLAC 的編碼演算法在少量檔案損壞下,依然能夠修復且正常播放。在壓縮的過程中還有 0〈最快〉至 8〈最小〉的壓縮選項,不同選項下只影響壓縮的速度和壓縮比,最終的檔案始終是無失真的音訊檔案,同時 FLAC 也支援 cue 表單和標籤;標準 FLAC 副檔名是 .flac。

Monkey’s audio APE

APE 音訊檔案格式是由軟體 Monkey's Audio 壓縮而成,其開發者為 Matthew T. Ashland,和 FLAC 相同也是源碼開放的音訊壓縮格式。Monkey's Audio 相較於其他的無損壓縮格式有其優點和缺點,優點是比其他常見的無損壓縮格式的壓縮比高,一般來說能夠達到 55% 上下,但其缺點就是解碼速度較慢。

並且由於 Monkey's Audio 使用浮點運算機制,會調動占用系統更高頻率和更高處理量的浮點運算,尤其在快速轉換播放位置時,較容易出現明顯的延遲現象。同時 Monkey's Audio 只提供查錯功能而無修復功能,如果檔案發生損壞,損壞點之後的資料有可能會遺失。

另外就是 Monkey's Audio 並非自由軟體而是準自由軟體〈Semi-free Software〉,這使得一些基於自由軟體的作業系統不能直接將其功能收入其中,所以在軟體的支援範圍會比較窄。目前官方只提供 Windows 支援,其他如 GNU/Linux 和 Macintosh 平台並沒有完整支援,標準 Monkey's Audio 副檔名是 .ape。

WavPack

WavPack 音訊檔案格式是 David Bryant 所開發,自由、開放原始碼的無失真音訊壓縮格式,WavPack 可以說是目前的後起之秀,其版本不斷地在更新中,同時支援無失真和失真壓縮模式,並且支援多聲道音訊、高取樣頻率音樂、支援 MD5 雜湊函式資料校正和快速檢索等功能。

WavPack 有多樣化的壓縮選項,允許用戶選擇 8~32 位元的整數和 32 位元浮點壓縮格式,不同的選項下演算法和壓縮比例也有很大的不同。壓縮率介於 30% 到 70% 之間,並且在失真壓縮模式下,會產生兩個檔案,其中一個為壓縮比高的有損音訊檔案,另一個為帶有回復失真資料的修正附加檔案,其後能夠再利用附加檔案來回復成無失真的原始音訊。而壓縮比較高的失真檔案也能夠單獨播放,讓用戶有著更加彈性的使用方式,標準 WavPack 副檔名是 .wv。

Windows Media Audio Lossless WMAL

Windows Media Audio Lossless 為微軟開發的一種無損音樂壓縮格式,使用者只須擁有 Windows Media Player 9.0 以上版本,即可使用這個格式來壓縮從 CD 上擷取下來的音樂,並且支援多聲道和高解析度音訊的壓縮。但由於各版本之間差異性非常高且沒有公開原始碼,使得非微軟自家的播放器往往無法正確解碼出真正的無損音訊,並且在多種播放器上的支援度也不是非常高。標準 WMALossless 的副檔名和普通有損 WMA 音樂格式同樣是 .wma,造成辨識上的不易。

Apple Lossless Audio Codec ALAC

Apple Lossless Audio Codec 是由 Apple 開發的無損音訊壓縮編碼格式,最早在 2004 年隨著 iTunes4.5 一起發布,編解碼速度和壓縮比例一般,並且缺乏錯誤修正機制,但完整支援 iTunes 標籤。而且在 2011 年已經公開原始碼,雖然非自由軟體,但在各平台間流通性還是相當不錯,標準 ALAC 副檔名是 .m4a。

True Audio TTA

True Audio 同樣也是自由、開源的無損音訊編解碼器,支援多聲道音訊壓縮和 8~24 位元,和 32  位元 IEEE 浮點型音訊 WAV 格式的無損壓縮,支援損毀檔案校正的機制,也支援持 ID3v1 和 ID3v2 兩種標籤。該音訊格式的最大目的是最佳化硬體執行編碼演算法,不過目前流通程度較其他音訊格式來得低,標準 True Audio 副檔名是 .tta。

Tom's lossless Audio Kompressor TAK

Tom's lossless Audio Kompressor 是由 Thomas Becker 所開發的無損音訊壓縮格式,直到去年才有穩定的版本出現,具有不錯的壓縮比和支援多執行緒編碼,也具備偵錯和錯誤容忍機制。但由於開發者尚未將原始碼公開,所以目前支援度並不高,標準 Tom's lossless Audio Kompressor 副檔名是 .tak。

失真壓縮音訊檔案格式

MPEG-1 or MPEG-2 Audio Layer III MP3

有損音樂格式中最出名大概就非 MP3 莫屬,其原由是 1991 年德國 Fraunhofer-Gesellschaft 組織所發明和標準化的音樂格式,是現在最流行的有損音訊壓縮格式。起初的目的是為了大幅降低資料量,使用了大量音訊刪減技術,其中包含利用心理聲學原理來判斷哪一些音訊資料可以捨棄,將人耳不易察覺的聲音訊號移除,成功達成非常高的壓縮比例。MP3 可以依據不同位元率進行調整,讓使用者自由權衡音質和檔案容量。

MP3 是一種失真壓縮技術,利用多樣的技術將音質損失下降到最小,而在 1998 年 Mike Cheng 發表遵循 LGPL 的新編碼器 LAME 後,讓音質和編碼速度又有一次改善。但在低位元率的情況下,MP3 還是有著顯著的音質衰退,但 MP3 音質瑕疵在較吵雜的環境和低階揚聲器下並不明顯,所以廣泛的被一般使用者所接受。並且在早期數位音樂的發展過程中,由於當時的儲存媒介容量都較小,壓縮比非常大的 MP3 格式因此扮演了相當重要的角色。

雖然根據 MPEG 規範,MPEG-4 標準中的 AAC(Advanced Audio Coding)將接替 MP3 成為下一代標準。但由於 MP3 廣泛流通性和大量的軟、硬體支援,目前 MP3 格式似乎沒有衰退的現象,標準 MPEG-1 或 MPEG-2 Audio Layer III 的副檔名是 .mp3。

Windows Media Audio WMA

Windows Media Audio 是微軟開的一種有損音訊壓縮格式,WMA 相容於 MP3 的 ID3 標籤並支援額外標籤,在低位元率下 WMA 有著比 MP3 更好的音質,但高位元率並不明顯。此外,Windows Media Audio Professional 可以儲存 5.1甚至 7.1 聲道音樂,讓 WMA 格式相較於 MP3 有著更多的優勢。

早期 WMA 為微軟自有的音樂格式,但在後續其他如 Apple 公司開始支援後,WMA 的流通情況也算非常普及。WMA 7 以後開始支援憑證加密,如未經授權憑證非法拷貝音樂,拷貝的音樂是無法收聽的,標準 Windows Media Audio 副檔名是 .wma。

Ogg Vorbis OGG

Ogg Vorbis 也是一個自由且開放的音訊壓縮格式,目前由 Xiph.Org 基金會所維護,而且 Ogg 比較特別的一點是,Ogg 同時也是一個開放標準的容器格式,可以納入各式自由且開放原始碼的編解碼器,包含音效、視訊、文字和後設資料處理。在音訊儲存方面,Ogg 提供 Vorbis 編解碼器作為音效層面應用,同時推出針對語音設計的壓縮編解碼器 Speex,和無損音訊壓縮 OggPCM 等作為音效層面使用,Ogg 也支持串流音訊傳輸,但整體來說單純用來保存音樂的例子較少,反倒比較常出現在一些應用程式,如遊戲軟體之類的程式中,標準 Ogg Vorbis 副檔名是.ogg。

Advanced Audio Coding AAC

Advanced Audio Coding 主要是基於 MPEG-2 音訊編碼技術而開發出來,是由 Fraunhofer IIS、杜比實驗室、AT&T、Sony 等公司共同開發的音訊壓縮編碼格式。出現於 1997 年,目的是為了取代規格較舊的 MP3 格式,然後在 2000 年又整合入 MPEG-4 標準特性。目前 AAC 可以支援最多 48 個音軌,15 個低頻音軌和 5.1 多聲道,最高採樣頻率為 96kHz、8~32bit 精度,同時具有更高的壓縮比和優異解碼效率。

比較大的問題是 AAC 格式有多種規格,目前總共分為九種規格用來適應不同的場合需求,但也造成使用上容易混亂。同時文件的副檔名也有三種,分別為 .aac 使用 MPEG-2 Audio Transport Stream,為舊版本的 AAC 編碼、.mp4 使用簡化過的 MPEG-4 進行封裝 AAC 編碼、.m4a 用來封裝純音樂的 MP4 檔案的副檔名。

 

下一頁:選擇適合的音訊檔案格式

使用 Facebook 留言

發表回應

謹慎發言,尊重彼此。按此展開留言規則