全球維基百科語言內容豐富度僅次於英語的語種竟是「宿霧語」，原因在於他們有一個超強的「管理員」

正如整個網路上最常用的語言是英語，英語版維基百科同樣也是全球 309 個語言版本維基百科中內容最豐富的一個。今年 1 月，英語版維基百科上的條目正式突破 600 萬條。出奇的是，擁有全球第二多條目的語言版本，並不是西班牙、法語等「大語種」維基，而是宿霧語（Cebuano）版的維基，一共有 538 萬個條目。

👉 歡迎加入T客邦telegram ( https://t.me/TechbangNEWS )

▲ 圖片來源 Boston Review

如果你沒聽過這種語言，也是正常的。

宿霧語是一種在菲律賓使用的小語種，懂得講宿霧語的人合計都沒超過兩千萬。而且，宿霧語版維基的雖然有五百多萬條條目，但管理員只有六人，活躍使用者也只有 14 人；相比之下，英語版單單是管理員就有 1143 人，活躍使用者更是超過了十萬人。

▲ 圖片來源 Honolulu Magazine

事實上，宿霧語版維基那五百多萬個條目，99% 的內容是一個名為「Lsjbot」的機器人所完成的。同時，它也是維基百科上最高產的作者。

狀態好，一天能創立 10 萬個條目

Lsjbot 的「爸爸」Sverker Johansson 是一位瑞典物理學家，而且還擁有語言學、經濟學和土木工程的學位。他的太太是菲律賓人，通曉宿霧語，因此 Lsjbot 在瑞典語和宿霧語版本的維基百科中都有創作內容。

Johansson 表示，自己一直以來都對「一切事物的起源」充滿興趣，並認為維基百科在未來應該可以「讓所有人瞭解所有事」。於是乎，他花了幾個月時間編寫了 Lsjbot，想用一種更快捷的方式將維基百科推向「囊括一切」的美好願景。

▲ Sverker Johansson，圖片來源《華爾街日報》

Lsjbot 做的事情有點像「開荒牛」，將 0 變成 0.5。

它不會撰寫系統豐盈的條目，只會簡單地創立一個條目，放上最基本的訊息，這種條目被稱為「小條目（stub）」，有待使用者進一步補充和豐富內容。Lsjbot 專注的領域也比較窄，主要都是生物物種和地理相關的內容。

▲ Lsjbot 一般製作的小條目都是這樣的，圖片來源維基百科

Lsjbot 製作內容的過程也非常程式化。首先，Johansson 會先就一個特定領域內容編寫模板，然後尋找可信、機器可讀的資料庫作為訊息來源，再讓 Lsjbot 根據模板來「填空」，並完成後期的發布工作。效率高的時候，Lsjbot 一天能完成十萬條小條目。

聽著這個工作描述，大家也能感覺到，Lsjbot 雖冠名幾百萬條條目，但內容其實都只是干巴巴的「骨幹」，缺乏人類的創造力和思考，自然惹來了部分活躍維基作者的不滿。

總的來說，我反對機器人製作的小條目。（它們）只包含或多或少正確的分類訊息，但卻缺乏像動物外觀等重要訊息。

41 歲的 Achim Raschka 說，他是德語版維基百科的積極貢獻者，常常會花好幾天時間來完成一篇關於某種植物的深度條目。

Johansson 也承認，Lsjbot 創造的內容的確很無趣，但也堅持這些內容也有自己的價值。在他看來，Lsjbot 的條目能補充一些在原本維基社群中缺乏代表的領域。

▲ 圖片來源《連線》

維基百科作者的多樣性已被詬病許久，有研究發現在維基百科上撰寫內容的人大部分都是居住在北半球開發國家的男性白領，擅長科技產品。Johansson 指出，在瑞典語版的維基百科裡，關於《魔戒》中角色的條目就有超過 150 條，但關於越南戰爭的內容卻少於 10 條：

我對托爾金沒意見，而且相對於（越戰中的）「春節攻勢」，我也更熟悉（《魔戒》中）索倫發起的戰爭，但這樣真的是一個均衡的百科嗎？

雖然 Lsjbot 的內容「乾巴巴」，但 Johansson 希望這些知識骨幹能拋磚引玉，啟發未來的維基作者探討原有社群「舒適區」以外的內容。

這也是為什麼我認為 Lsjbot 這個「開荒牛」只將 0 做成了 0.5，因為得有人類作者的創造性參與，0.5 才能走向 1。

事實上，維基百科上除了 Lsjbot 外，還有大量承載著不同職能的機器人，它們已經成為了這個社群不可或缺的成員。

維基百科的「機器人軍團」

▲ 圖片來源 imgur

「我們常開玩笑說，機器人得來一次大罷工，所有人才會懂得感恩它們對社群做出的奉獻。（如果沒有機器人）這個網站將需要我們做更多工作，編輯的工作過載率也會大大提升。」

生活在澳洲的 Chris Grant 說道，他是維基百科社群中專門負責管理機器人的組織「機器人審批組（Bot Approvals Group，以下簡稱為 BAG）」的成員。

是的，機器人在維基百科上應用的歷史悠久廣泛得內部在 2006 年就已經設立了專門審核和管理機器人的 BAG。

從流程來看，如果有維基作者想在社群應用機器人，他們必須先向 BAG 提交申請，闡述機器人的功能、程式語言以及它預計會涉及的頁面數等訊息。隨後，BAG 的成員會綜合多方面預估其可能帶來的影響，並決定是否通過。即便是已經通過審核的機器人，開發者每為它增加一個功能，機器人都必須重新提交審批。

截至 2018 年，維基百科上應用的機器人數早已破千，並且仍在不斷發展。一篇 2019 年的論文《The Roles Bots Play in Wikipedia》研究分析了維基百科上的機器人，並以職能將其分為九個大類：像 Lsjbot 般用其它數據來源製作頁面的「製作者（Generator）」、負責修復超鏈接、檔案之類的「維修者（Fixer）」、更新數據，記錄使用者狀態的「文員（Clerk）」、向維基作者提供建議的「顧問（Advisor）」等等。

▲ 維基百科上機器人的九大分類