幫硬碟裡的幾萬張照片「去蕪存菁」

ADVERTISEMENT

先讓檔案類型單純化

把所有的檔案都放到工作碟之後,第一步是要找出重覆的照片。為什麼會有重覆的照片?如果你習慣記憶卡還沒塞滿就把照片傳到電腦裡,又沒有立刻格式化記憶卡,存放在裡面的照片下次很可能就會重新再被複製一次,久了以後電腦裡就會有很多的「分身」,白白浪費不少空間。

時間充裕的話,筆者建議可以利用Duplicate Cleaner的MD5比對功能,把工作碟裡的照片全部掃過一次,就可以把這些分身找出來並刪除掉,不只是照片,影片也可以一併處理。

再把照片目錄「平面化」

硬碟裡的照片通常不會只存放在一個資料夾,如果之前命名的方式又不夠嚴謹,目錄的結構會變得很複雜,有時候還得一層一層像撥洋蔥似的翻找,非常麻煩。「平面化」的意思就是把所有的檔案都集中到同一層目錄,簡單的說就是砍掉重練、摧毀一個資料夾裡面的所有子目錄結構,如此一來就可以省去不少操作步驟。

很可惜的,目前在Windows環境似乎還沒有專門用來平面化目錄的軟體,比較接近的是第三方軟體「xxcopy」,不過它是命令列工具,操作起來比較麻煩,其實這個工作由Total Commander就能代勞。

Total Commander的搜尋功能很強,只要在搜索條件裡打「*.*」,再取消勾選「包含子資料夾」,就可以掏空所有的子資料夾,這時候再把搜尋結果搬移到另外一個資料夾就達到平面化的效果了。

需要注意的是,「找分身」跟「平面化」這兩個步驟最好不要逆向操作,因為在平面化的過程中如果有檔名相同的檔案,很容易會產生衝突,所以最好把這些分身都先刪除掉會比較保險。

用Lightroom重建目錄

平面化的目錄是為了確保沒有檔案會藏在子目錄裡,但是把幾萬個檔案都放在同一個目錄,要手動整理會非常辛苦。所以接下來要利用Lightroom來重建相片目錄,作法很簡單,把所有的照片都匯入Lightroom裡,它自然就會幫你用日期來分類相片,預設最小的單位是一天。

在重建目錄的時候,有個選項要特別留意,請選擇「把照片搬移到新的目錄並重新編目」,這樣子才會產生新的日期子目錄,重建完成後也才可以回到原本經過平面化的目錄去檢查有沒有漏網之魚。

最後再人工比對

重建完的目錄,拍攝日期相同的照片都會放在同一個資料夾裡,整理起來就簡單多了,一來是單次需要處理的數量會變少,如果照片太多,用日期來分類可以有助於分批整理,再來是非常相似的照片通常都是在同一個時間拍攝的,比對時也會比較快。

為什麼需要人工比對照片?因為前面提過,MD5比對法是找出「完全一模一樣的檔案」,假如今天有一張照片經過縮圖,尺寸更改了、MD5就會跟著不同,這種情況最容易發生在經過影像處理軟體後製過的照片,加上EXIF資訊有時也會遺失,這時候就要靠比對影像內容才能抓分身了。

Duplicate Photo Finder有很多衍生工具,大部份是用兩套不同的引擎在演算照片,附加功能也有差異,比如有的可以幫你找出影像內容一模一樣、體積卻比較小的檔案(因為要留就留比較大的原圖才有意義),不必人工判斷哪個是分身。筆者這次推薦的是精確度最高的一套,雖然它必須透過人工找分身,但是比對出的結果非常準確,介面也簡潔易懂,非常人性化。

誰說阿宅不溫柔
作者

大家好,我是T客邦的外稿編輯。除了寫稿之外,最常做的事是找人尻昇龍拳、釣泰國蝦,對還沒磨成醬的山葵過敏,欣賞的外國女星是娜塔莉波曼。

使用 Facebook 留言
E4b2adbc8d02e2b7ef8c31b70c2db1d7?size=48&default=wavatar
2.  toppy368 (發表於 2011年2月13日 19:54)
Duplicate Cleaner能用在其他檔案上嗎?想用來整理MP3音樂資料夾
八雲紫
3.  八雲紫 (發表於 2011年2月13日 20:19)
"「管理」照片很利害"
新注音輸入法請記得選對字
是"厲害"不是"利害","利害"是"利害關係"這成語在用的
4aaaa68909a9c1d40661fb6bfce5b5c8?size=48&default=wavatar
5.  歐酥酥 (發表於 2011年2月14日 01:44)
Duplicate Photo Finder試用版限制多多╮(╯_╰)╭
4aaaa68909a9c1d40661fb6bfce5b5c8?size=48&default=wavatar
9.  歐酥酥 (發表於 2011年2月14日 13:54)
AntiDupl.NET-1.7.0.311
VisiPics 1.30
這兩套比對重複圖片的功能都比文中所推薦的好用許多囧rz
Eafw Eaf
12.  Eafw Eaf (發表於 2011年2月15日 01:48)
給 Duplicate Cleaner 的使用者,如果中文遇到問題,請修改語系檔最開頭的作者那邊,保留如下:

[Info]
Lang_Name=Chinese Traditional
Lang_Author=wellss 原漢化:Cain

改完後儲存即可。
發表回應
謹慎發言,尊重彼此。按此展開留言規則