Dc 電腦裡最容易出現的重覆檔案是什麼?數位相片絕對是最多的,因為大家都有「寧可複製一份、也不要錯殺一張」的「捨不得」心態,久而久之就造成了相片管理的困難。要怎麼在電腦裡找出重覆的相片?一張一張的比對圖像內容嗎?別傻了!不必那麼累,比對相片可以從幾個條件來著手,而且都是系統裡最基本、容易取得的檔案資訊,跟本就不必動用到什麼複雜的圖像比對演算法:

一、比「大小」

數位相機所產生的每張照片,其體積重覆的機率「非常低」,就算是用高速連拍所產生的圖像,也會因為物體或光影的細微差異而有小幅變動,差距小至Bytes,所以「比大小」可以當作照片比對過濾的第一關,如果兩張照片的體積一樣、那麼九成以上絕對就是同一張照片。

二、比「拍攝日期」

這裡的拍攝日期,其實是指「拍攝時間」。數位照片都會有EXIF,EXIF的拍攝日期小至以秒計錄,除非是高速連拍的照片,不然很少有會在同一秒所拍攝的照片。

三、比「檔案名稱」

比對檔案名稱是比較不嚴謹的作法。因為多數的相機都有「重新計數」功能,而且一台電腦裡很可能會放置好幾台不同相機所拍攝的照片,很可能會出現「檔名相同、內容卻不同」的情況出現。

四、比「雜湊值」

「雜湊值」通常指的是一個檔案的「MD5 Checksum」,什麼是MD5這裡就不多介紹,總之它可以說是每個檔案獨一無二的「指紋」,而且還是依照檔案內容所計算出的「胎記」。兩個內容不同的檔案、要有相同雜湊值的機率是非常非常小的,比剛才介紹的第一種比對法所發生的可能性還低。

要用這幾種方法來找出垃圾拷貝,Windows上相關的軟體還不少,筆者用的最順手的就是這款「Duplicate Cleaner」。不但可以找相片、任何你唸得出來的檔案類型它都能找,怕了吧!

以下,就是它的使用方式:

一、到這裡下載Duplicate Cleaner。有一個類似的軟體叫做「Duplicate File Cleaner」,會出現在Google搜尋的榜首,這兩個是不一樣的東西。

二、執行程式後,「第一步」先決定你要找尋哪種類型的檔案。以數位相片為例,使用最普遍的副檔案就是JPG、TIFF或者是NEF、CR2之類的相機RAW檔,按下「Select File Type」可以自動列出常用的副檔名。要不然你也可以自行在文字方塊內增刪屬意的目標。

三、再來,就是要決定「搜尋條件」啦!Duplicate Cleaner的搜尋速度非常快,就算你把所有的條件都勾選了,在筆者的高階雙核心平台上搜尋一萬張相片不到30秒,所以就全勾吧!不必花多少時間、又能達到最高的正確率。

四、接著,請依照圖中決定搜尋的目錄,可以一次加入好幾個,最後按下「Go!」就會開始搜尋。

五、然後……就等吧!

六、搜索完畢之後,你就可以看到藍紅相間的檔案列表。顏色的區分並不帶特殊意義,很純粹的只是要區分出相同檔案的集合而已。這時候,先別急著在檔案前的方框打勾,如果一次有幾千張照片要處理怎麼辦?請先點擊「Selection Assistant」,叫出輔助工具來選取要處理的檔案。

七、輔助工具提供的選項很多,不過我們只要點擊左下角的「Select all but one file in group」即可。這個選項的意思,是「把所有重覆出現的檔案刪掉、只留下一個」。勾選完後按下Select及右邊的Close,即見成果。

八、最後點擊「Remove Selected」,叫出刪除工具,點擊「Delete to Recycle Bin」以防萬一,然後就可以進行刪除了。需要注意的是,如果目的檔案的權限是設定成唯讀、或者是你本來就沒有更動權限,還是資源回收筒的功能跟本就沒有打開,程式並不會主動提示,是需加以留意之處。

就這樣,Duplicate Cleaner基本上並沒有什麼特殊的使用技巧。如果你覺得功能還不夠的話,也可以拉下「File」功能表,選擇把搜尋結果匯出成CSV檔再做後續處理,比如做更進階的照片分類管理等等的。

使用 Facebook 留言

E1e496c640f11eee54d7fb4a65eb2e43?size=48&default=wavatar
3.  喵喵 (發表於 2010年3月15日 20:58)
強烈抗議~這麼小哪裡算暴乳
是編輯頭腦故障還是系統容量不足
至少也要1024*768以上才行阿
726d69dbc22cd9731440f35d4499e366?size=48&default=wavatar
4.  moneyday (發表於 2010年3月15日 23:53)
完蛋了XD
編輯應該提供一個比較正常些的圖片~~
最後一張得要伸手一下XD~~
118ed642d310bc813c5ce34d61285f49?size=48&default=wavatar
7.  wellss (發表於 2010年3月24日 10:10)
昨晚注意到此軟體有簡體中文版語系 ini,所以順手弄了份繁體中文版的 lang_ct.ini 檔,
可以自此下載得到,放於語系檔目錄下開啟程式,選「正體中文」即生效:
http://www.sendspace.com/file/vnhicq

小的於 Dupluicate Cleaner 官方論壇的發帖:
http://www.digitalvolcano.co.uk/forum/viewtopic.php?forum=2&topic=124

英文破破的,不好咩!
不敢期望被採用,但諸君可自上面連結自行取用。
0db83a19f0dda1fca5130f8dddb267a1?size=48&default=wavatar
9.  東東 (發表於 2010年4月21日 08:40)
一、到這裡下載Dupluicate Cleaner,
文章中第一個英文多了一個u

發表回應

謹慎發言,尊重彼此。按此展開留言規則