揭開 DSD 的神秘面紗:數位音訊編碼之爭 DSD vs. PCM

ADVERTISEMENT

DSD和PCM編碼比較

由上面的介紹就可以看出,DSD和PCM是兩種完全不同思維模式的編碼,而兩種規格也擁有各自的優點和缺點,底下筆者將非常淺顯的介紹DSD編碼相對於PCM編碼的優缺點。

DSD編碼優勢 

  • 1. 理論上極高的取樣頻寬:
    標準的DSD音樂使用2.8224MHz取樣頻率,理論上能夠記錄最高到1411.2kHz〈取樣頻率的一半〉的聲音,相較於傳統CD使用的44.1kHz取樣頻率,這讓DSD格式擁有非常寬廣的取樣頻寬,即便和目前錄音室常見的高規格24bit/192kHz PCM錄音相比〈取樣頻寬最高達96kHz〉,DSD也擁有超過14倍之多的取樣頻寬。
  • 2. 優良的動態範圍〈0~20kHz〉:
    DSD訊號經由高頻雜訊整形〈noise shaping〉電路處理,將DSD帶有的高頻雜訊,提升到超越人耳聆聽範圍外的頻率後,在0~20kHz的頻率範圍內,DSD擁有理論數據上高達150db的動態範圍 〈如下圖〉
    ,相較於16 bits/24 bits PCM編碼的96db/144db動態範圍,DSD編碼理論上擁有更好的動態範圍〈0~20kHz〉

揭開 DSD 的神秘面紗:數位音訊編碼之爭 DSD vs. PCM▲DSD和PCM編碼比較,紅色框格內代表24/96kHz PCM編碼可記錄的範圍,橘色為24/192kHz,綠色為24/384kHz可記錄範圍,24bit的PCM訊號底噪坐落在記錄範圍之外,理論上小於-144db;藍色線為2.8224MHz DSD在不同頻率範圍的底噪示意圖,可以發現在大約30kHz後,DSD編碼的底噪急遽上升,在接近極限頻率時達到大約-6db的響度。圖片來源:Playback Designs

  • 3. 更小的音樂容量:
    DSD編碼在儲存容量上也具有一定的優勢,隨著音質的提高,PCM音樂的檔案大小可以說是指數型成長。而DSD由於編碼上的優勢,在標準的2.8224MHz取樣頻率下,DSD的檔案容量只約略超過24/96kHz的PCM音樂一些。這使得DSD不論是在儲存或是網路下載,都比PCM格式來得有優勢。
格式 檔案大小 預計下載時間〈5Mb/sec頻寬下
紅皮書規範CD 〈16/44.1kHz〉 32MB 1 分鐘
PCM 24/88.2kHz 95MB 2.6分鐘
PCM 24/96kHz 103MB 2.8分鐘
PCM 24/176.4kHz 190MB 5分鐘
PCM 24/352.8kHz 〈DXD〉 380MB 10分鐘
DSD 2.8224MHz 127MB 3.4分鐘
  • 4. 除了上列的優勢之外,DSD音樂在播放時還具有無取樣頻率限制、直接支援DAC主要時鐘和長傳輸距離的優點。

DSD編碼缺點

上面提完DSD的主要優勢,但就跟多數的規範一樣,DSD也有其無法克服的技術缺點。而且這些實際操作上的缺點,反倒嚴重的抵銷DSD上述的優勢,並且在大多數情況下還產生更多的問題,底下就讓筆者來介紹一下DSD編碼相較於PCM編碼有甚麼樣的缺點。

  • 1. 實際上較窄的頻率範圍:
    標準的DSD編碼有一個先天的缺點,相較於CD規格的16bit/44.1kHz的-96db〈16*6db〉底噪來說,DSD的底噪高達-6db,這個現象在實際測量上也可以觀察到〈見圖X〉。DSD編碼在超過20kHz的時候,會產非常大量的高頻雜訊,如果不將這些雜訊移除,將會對後端的音響器材造成傷害。所以必定需要經過濾波技術的處理,現在的處理方式是利用雜訊整形電路,將雜訊移到人耳聆聽範圍外〈>20kHz〉。

    但這也說明後續就要由低通濾波器將這些雜訊移除,由Sony的規範書來看,DSD訊號必須經由一個截斷點為50kHz的低通濾波電路處理移除高頻雜訊。這使得現實上在播放時能使用的最大頻率範圍,大約只比30kHz高一點點,這直接影響到DSD其中一個優勢:「理論上極高的取樣頻寬」。為了減少高頻雜訊的問題,目前最新的DSD檔案都使用雙倍的取樣頻率〈DSD128〉,理論上藉由雜訊整形電路,能夠將高頻雜訊推到更高的頻率範圍,但實際上還是無法解決通過低通電路後實際能用的頻率範圍。
  • 2. 檔案經過多次格式轉換:
    由於DSD編碼是一種單位元的記錄格式,使得DSD音訊幾乎完全無法利用現在的音訊設備來編輯,因此在音樂後製的時候,DSD音訊還是必須被轉換成PCM音訊來編輯。目前的DSD音樂編輯模式,是先將DSD轉換成Digital eXtreme Definition〈DXD〉格式,DXD本質上就是352.8kHz / 24bit的PCM編碼音訊,等後製和音樂編輯完畢後,再轉換為DSD訊號。因此DSD音樂檔案反倒同時繼承DSD和PCM的缺點,並且在多次的轉換過程中,還會額外導入另一層的高頻雜訊,這使得DSD原本希望移除PCM編碼缺陷的初衷,完全不存在現在的DSD音樂中。
  • 3. 相對高解析PCM編碼沒有顯著優勢:
    DSD編碼當初的比較目標大多是CD規格的PCM音訊,但在高解析度的PCM音訊流行的當下,高解析度PCM音訊實際可用的取樣範圍和雜訊控制能力,完全優於標準的DSD格式〈見圖X〉。為了解決這個問題,剛剛提到雙倍取樣的DSD128音訊就此誕生,雖然可以些微的降低DSD雜訊過高的問題,但單位元編碼先天上的缺陷依然存在,並且雙倍取樣的DSD128音樂檔案大小,對比高解析PCM音訊來說,也變得沒有儲存容量上的優勢。
  • 4. 硬體支援度不廣泛:
    DSD處理對於目前已經習慣PCM音樂已久的音樂製作公司來說,必須投入額外的成本才能進行後製,所以嚴重的影響到DSD格式的推廣。此外目前市面上絕大多數支援DSD播放的DAC,是將DSD音訊重新編碼回PCM訊號的方式來播放,只有非常少部分的DAC支援原生播放DSD音樂。除此之外,DSD傳輸並沒有被大多數傳輸規範所納入,像是USB Audio 2.0和Mac平台的特性規範中,音訊傳輸就只有標準PCM一種格式。

    好在最近被推廣DSD-over-PCM〈DoP〉傳輸規範解決這部分的問題,這個傳輸規範使用24bit/ 176.4kHz PCM傳輸來包裝DSD訊號,利用前面8個位元來當做DSD的標記。又由於2.8224MHz取樣的DSD音訊資料量相當於16bit/176.4kHz的PCM音訊資料量,所以後面的16位元就可以用來包裝DSD音訊,讓有能力的硬體廠商自行研發DSD解決方案,並且也讓不支援DSD傳輸的iOS系統有機會播放DSD音樂。當然這樣的傳輸規範也有它的缺點,那就是由於資料是藉由PCM訊號的方式包裝,如果當硬體誤判DSD為PCM訊號時,就會在88kHz的地方產生一個大約-34db的雜音,並且播放DSD的相關操作和設定過程相當繁雜,所以DSD音樂規格還是相對地不普及。

揭開 DSD 的神秘面紗:數位音訊編碼之爭 DSD vs. PCM

▲利用16/176.4kHz PCM格式包裝標準DSD音訊的示意圖,前8個位元為識別標籤,後面16位元為DSD編碼訊號。

小結

相信看完以上的介紹文章,各位讀者對於DSD這個編碼格式都有了一定程度的了解,也許有人會問說:既然DSD有那麼多不便和缺點,為什麼最近突然有一群廠商在推廣DSD音樂格式?

筆者必須在這邊說,沒有一個格式是沒有缺點,端看實際使用和市場的反應。不過關於DSD規格會在最近被推廣的原因,筆者推測和DSD規範出現到現在已經超過十年有關,大部分的技術類專利有效期限是十年左右,所以基本上DSD格式現在已經成為一個開放式規格。再來目前主力的推廣DSD的公司,是當初開發DSD規格的Andreas Koch所任職的Playback Design,自然會希望能夠將DSD音樂推廣開來。

反倒是製造業界用於轉換DSD與PCM標準規格的瑞士數位音樂公司Weiss的老闆Daniel Weiss,在兩年前發表了一份簡短的DSD白皮書,很明白的點出DSD無法後製處理,一定要先轉換為PCM訊號,才能進行必要的後製工作。所以在錄音階段,Weiss推薦還是先用PCM格式儲存聲音訊號比較實際。

再順道回過頭看一下當初制定DSD規範的Sony,目前和日本音響協會一同制定新的「Hi-Res」認證,仔細閱讀其內部規範後,可以發現雖然DSD同樣被視為高解析音源,但是在高解析音源的定義中,並沒有對DSD格式做特別著墨,可以推敲出Sony對這個已經失去專利主導權的音訊格式的態度。

但總體而言,DSD和PCM誰好誰壞並不是真正的重點,它們都只是儲存音樂的一種格式,重要的還是裡面所包含的音樂。因為音樂的感動並不是靠音樂儲存格式來決定,一個儲存格是只要還有足夠的人在繼續使用,就有它被保留的意義存在。至於DSD和PCM到底誰會成為未來格式的霸主?就讓音樂製作公司來煩惱吧。

延伸閱讀:

MP3 不是最好的聲音壓縮格式!有損、無損數位音訊檔案格式大閱兵

Yazi
作者

小弟是一位獨立耳機相關器材評論人員,興趣是撰寫耳機相關器材之評測文章,希望能藉由分享相關資訊來和更多的音樂發燒友交流,也藉由評測之機會尋找適合自己的耳機相關器材。

使用 Facebook 留言
peter
1.  peter (發表於 2015年1月28日 18:05)
中段內容梯度太陡,
如果能舉例比喻,
或許可能有較高易讀性。
發表回應
謹慎發言,尊重彼此。按此展開留言規則