淺談數位音源原理

在講了這麼多硬邦邦的電路後,水電工先轉換一下話題,我們來看看最近流行的老話題「數位音源」。數位音源的技術發展從CD時代到目前經過了30年,重要的幾個點在於:

調變原理:從最早期8位元電腦上播放的小錄音檔的PWM,到用於CDROM等主流的PCM,到現在同樣是PWM只是做了比較多的手腳,所以承襲了PWM所有的缺點的DSD。

訊號壓縮:訊號若不壓縮占的空間實在太驚人了,而壓縮訊號方式也是經過了很多的演進,從MPEG-2到MP3,HE-AAC等等到無損壓縮的FLAC等。

錄音、播放系統的改善:任何音樂的錄製到再生都是經過錄音(數位處理)到傳輸,再播放出來,目前的錄音系統和90年代的比起來已經有相當好的進展,同樣的播放系統也是,相較於早期的數位類比轉換晶片,現在的許多產品都有非常好的線性和頻率響應。

多聲道規格:雙聲道規格立體聲很難做到環場效果,在現今的影音不再侷限於純音樂的情況下,多聲道規格的發展也變成了重要的主題。

2個條件決定資訊量

我們先來談談調變原理,目前主流中的主流各位想都不必想,就是PCM調變。這種調變方式是在固定時間上對訊號做振幅取樣,利用數值紀錄下振幅的大小。所以有2個條件決定了資訊量的大小,第一自然是取樣的時間差,第二則是振幅的大小要用多少數值去區分。

科學角度看音響8: 負回授與數位音源原理

當年發明CD時由於容量有限,因此在考量設備成本的情況下,CD的PCM就是44.1KHz/16bit取樣,大家大概也都很清楚這代表每秒取樣44.1K次,每次用1個16bit的數值去描述振幅大小,總資料量則是每聲道每秒鐘88.2Kbyte。

這個規格其實非常雞肋,因為它的中頻動態會比不上傳統的LP黑膠唱盤,而高頻又不夠清楚,因此在錄音室中很少出現這種規格的東西,所有的母帶不是用大型的類比磁帶就是用96KHz/24Bit的數位規格。所以在DVD出現後,大量的96KHz以及192KHz的音樂也都出現了,這些我們都叫做High Resolution Audio或者是High Definition Audio。

有許多教通訊原理的老師以及網頁都會提到,當我們的取樣頻率是X Hz,可以紀錄下來的聲音頻寬就是X/2Hz。所以當我們以多數人耳的最高感知頻率為22KHz為標準時,44.1KHz是可以完整紀錄音樂的,同時這個規格放出來的聲音人耳就可以完全接受。

但水電工要指出這些是不求甚解的說法。我們先來看看這個Nyquist Theory,它本來是由任職於貝爾實驗室的Harry Nyquist提出來的理論,後來幾乎在幾個月內通訊學大師Shannon也用了另一個方式計算出來。所以也有人叫它Nyquist-Shannon Sampling Theorem,這個理論用圖像式的方式來說明就如下所示:

當我們用X Hz來取樣訊號時,取樣本身就是一函數,代入原訊號就是我們的取樣結果。而取樣函數本身就是調變動作,它也有它的工作頻率,而且在它的工作頻率帶中取樣動作就是一連串的能量釋放(因為在數學上它會產生數值),所以當我們以X Hz取樣時,這個調變函數產生的能量帶就會分布在X/2及-X/2以外的地方,凡是頻率大於X/2Hz的輸入訊號都會被取樣動作產生的雜訊蓋掉,因此在取樣頻率為X的系統上能表達的實際訊號頻率只有X/2。

科學角度看音響8: 負回授與數位音源原理

類比多階濾波器的數個問題

數學上我們當然能接受這種說法,但是能表達訊號和表達得好不好絕對是兩碼子事情。好比以44.1KHz/16bit取樣的傳統數位音源,在超過22KHz的訊號中就開始混入了調變雜訊,我們在回播的最後一關必然是用低通濾波器來清除這些雜訊,但是使用一階濾波的後果是什麼呢?大部分音響設備設計時都會讓它的-3db點是在20KHz,那麼若是在26KHz有雜訊時它會變多少呢?可能頂多變-10db吧? 記得水電工說過的嗎?人耳雖然無法單獨感知到這個頻率的雜訊,但是當它混在其它人耳可聽的音頻中改變了其它音頻的相位反應時,它是會被人耳感知到的!所以-10db不夠小,水電工們辦法最多了,我們用多階低通濾波器總可以了吧?

科學角度看音響8: 負回授與數位音源原理

類比的多階濾波器問題可能比各位想像的更大,它有數個大問題:

一、對於高頻訊號(也就是接近我們設計的截止頻率的訊號),它可能反而會不正常拉高頻頻響應。

二、同樣對於高頻訊號它還會大幅讓相位角改變,人耳對這種改變最敏感了!光是一階濾波和二階濾波人耳就聽得出音場大小差很多了。更何況你還玩到多階去?

三、超過四階以上的濾波器,由於有第一點的因素在,會很容易產生自震盪,濾波器做成了振盪器,這是不允許的,不如重做一個。

再者,取樣精緻度不同而造成的誤差,我們叫做量化誤差(quantization error),它也是一種噪音,16bit取樣和24bit取樣的噪訊比就差了48db,水電工可以告訴你人耳絕對聽得出來,尤其是在音樂大聲一點的時候高下立判。

再回到音響學的世界中,各位讀者真的確定人耳無法感知到現場演奏時的超音波嗎?水電工一再強調人耳真的可以感知道極細微的相位角變化,現場演奏的人聲大概還好,但是樂器的部分一定會有許多的泛音存在,而且許多都存在於超過22KHz的範圍內。沒錯,人耳無法單獨感知到這種音頻,但是當它混入了較低頻段的聲波中時,仍然會對這個頻段的聲波產生相位差,偏偏人耳可以感應到百萬分之一秒等級的相位差。

在水電工過去實測的經驗中,幾乎所有人都可以聽出96KHz和44KHz的音樂有相當大的不同,如果只是單純的人聲那還好,一旦播放類似吉他或笛子、鋼琴等共振很多的樂器時,所有人都可以感覺到44KHz音樂的撥弦聲就是糊掉了,而96KHz則是相當清楚,甚至有吉他就擺在耳邊的感覺。依水電工的經驗,50KHz以上的取樣頻率是相當必要的,但是超過96KHz就鮮少有人分得出來,變成規格口水大戰了,目前世界上最高的PCM錄音規格就是192KHz。

使用 Facebook 留言

Max
1.  Max (發表於 2014年7月28日 10:33)
回"授"? 中國用語?

回"饋" 比較熟悉吧。

還是讚賞水電工專業的能力與熱心。
bisheng
2.  bisheng (發表於 2014年7月28日 11:59)
※ 引述《Max》的留言:

以前讀的電子工程相關課本,術語確實是用 "負回授",
不確定現在有沒有變。
sdyy
3.  sdyy (發表於 2014年7月28日 13:29)
※ 引述《Max》的留言:
> 回"授"? 中國用語?
>
> 回"饋" 比較熟悉吧。
>
> 還是讚賞水電工專業的能力與熱心。

以前電子學都是寫回授
中國用語剛查一下是反饋

回饋比較少用在電子學上,不過偶爾也是有
Max
5.  Max (發表於 2014年7月28日 19:37)
嗯,看來應該是我錯了。

negative feedback

你們學的課本說是回授就是回授了。 以你們課本為準,這方面不是我的專業,只是我學生時代另一種專業的用語。 :)
Philip Ho
6.  Philip Ho (發表於 2014年7月29日 10:59)
回饋常聽到的是 力回饋...動力回饋方向盤
回授是電子電路上常用到的詞
Philip Ho
7.  Philip Ho (發表於 2014年7月29日 11:01)
feedback
用於答覆或回覆部份。中國用詞則是「反饋」...
ex. 訊息回覆 vs 信息反饋
ex. 意見回覆 vs 意見反饋

發表回應

謹慎發言,尊重彼此。按此展開留言規則