喚醒8000萬件沉睡標本? 倫敦自然史博物館用AI搶救生物多樣性記憶's OG Image

喚醒8000萬件沉睡標本? 倫敦自然史博物館用AI搶救生物多樣性記憶

更新時間:2026/02/26 06:42
尚無人精選
icon-dot
你參觀過博物館的庫房嗎?像冰棒直挺挺的小鳥、宛如寶石的甲蟲,還有植物學家常用的臘葉標本(乾燥壓製植物)。標本是封存時光的寶庫,告訴我們過去發生什麼、推測未來的趨勢。不過,如果要數位化博物館典藏,讓資料可以保存、分享、研究者能遠端存取,將是一項費時的工程。最根本的問題是,寶庫太大、人力太少。以倫敦自然史博物館為例,館內有1250 萬件針插昆蟲、700萬件貝殻與200萬件臘葉標本,總收藏高達8000萬件。每件標本不只影像,還有標籤上的地點、時間、採集者等資訊。如果仰賴人工整理與數位化,遠遠追不上生物多樣性流失的速度。當AI在全世界刮起旋風,改寫我們習以為常的工作時。倫敦自然史博物館分享他們的最新經驗,使用AI喚醒抽屜裡沉睡的標本,一躍成為能使用和行動的最新利器。

你參觀過博物館的庫房嗎?像冰棒直挺挺的小鳥、宛如寶石的甲蟲,還有植物學家常用的臘葉標本(乾燥壓製植物)。標本是封存時光的寶庫,告訴我們過去發生什麼、推測未來的趨勢。不過,如果要數位化博物館典藏,讓資料可以保存、分享、研究者能遠端存取,將是一項費時的工程。

最根本的問題是,寶庫太大、人力太少。以倫敦自然史博物館為例,館內有1250 萬件針插昆蟲、700萬件貝殻與200萬件臘葉標本,總收藏高達8000萬件。每件標本不只影像,還有標籤上的地點、時間、採集者等資訊。如果仰賴人工整理與數位化,遠遠追不上生物多樣性流失的速度。

倫敦自然史博物館的甲蟲標本 By Natural History Museum: Coleoptera Section from South Kensingon, London, UK - beetle display-027-220714, CC BY 2.0, https://commons.wikimedia.org/w/index.php?curid=120269539
倫敦自然史博物館的甲蟲標本。圖片來源:Natural History Museum: Coleoptera Section from South Kensingon, London, UK - beetle display-027-220714(CC BY 2.0)

當AI在全世界刮起旋風,改寫我們習以為常的工作時。倫敦自然史博物館分享他們的最新經驗,使用AI喚醒抽屜裡沉睡的標本,一躍成為能使用和行動的最新利器。

機械手臂進駐庫房:當昆蟲標本坐上數位產線

標本數位化,拍照僅僅是第一步。這個工作還得有能力辨識標本、讀懂古代採集者寫的標籤,還要確認資訊是否完整,以及建置成資料庫格式。如果能有博物館小精靈,把標本從抽屜裡拿出來,放到指定位置拍照,協助檢查與判讀,再把資訊輸入電腦,全部上傳到資料庫,那就太完美了。

這可不是痴人說夢。倫敦自然史博物館正啟動史上最大的館藏數位化與AI自動標注計畫。博物館的AI與創新小組開發結合機械手臂、電腦視覺(computer vision)與語言模型的「產線化」流程,讓機械手臂從抽屜中夾取昆蟲標本、放到黑色背景的轉盤上拍攝影像、轉動角度讀取標籤,再自動擷取標籤上的文字資訊,轉成結構化資料。

機械手臂夾取蝴蝶標本。圖片來源:倫敦自然史博物館機器人與自動化首席工程師Jack D. Hollister
機械手臂夾取蝴蝶標本。圖片來源:倫敦自然史博物館機器人與自動化首席工程師Jack D. Hollister

當人力從大量的重複工作中解放,時間可以留給更需要專業判斷的任務。若系統偵測到標本脫落、損壞、標籤缺失或無法判讀時,機械手臂就會把標本放到特定區域提醒人員處理。這種「人機協作」的設計,讓數位化更快也更可靠。對博物館而言,AI不再只是「研究輔助工具」,而是成為典藏管理與資料生產的一部分。

解讀百年字跡:AI讓沈睡的檔案開口說話

如果說機械手臂加上電腦視覺能讓資料「連上線」,那另一波AI應用,則是在回答:資料上線之後,誰能用?怎麼用?

像萊姆里吉斯菲爾波特博物館(Lyme Regis Museum)這樣的地方小博物館,保留了大量「索引卡」的藏品記錄。從前,館方得花費大量人力登載卡片內容。現在透過 AI 文字擷取與資料轉換流程,可以快速掃描卡片並轉成可用的數位資料,大幅縮短作業時間。索引卡格式在英國非常普遍,模型一完成,就能與其他地方的博物館共享。AI不再是大館的專利,而成為整個博物館體系的共同工具。這對NGO與研究人員而言,代表更多地方尺度的生物資料,有機會進入公共視野。

盧森堡自然史博物館植物標本館藏索引卡。Luxembourg National Museum of Natural History, CC BY 4.0, via Wikimedia Commons
盧森堡自然史博物館植物標本館藏索引卡。圖片來源:Luxembourg National Museum of Natural History(CC BY 4.0)

打開資料、打開博物館

在與英國國家博物館利物浦館(National Museums Liverpool)的合作中,AI被用來自動生成館藏影像的替代文字(alt-text),協助視障或弱視使用者理解影像內容。從前館方很難大規模以人工撰寫替代文字,而對使用者而言,缺乏文字描述,等同被排除在數位典藏之外。

利物浦館透過 AI 協助產生描述,並搭配人工檢核與文化敏感性考量,在效率與責任之間取得平衡,展現博物館的公共使命——數位化不單只把資料上線,而要讓更多人可親近、理解和參與。

從標本櫃到海關前線:用演算法揪出非法蛇皮

當標本影像、標籤與物種資訊能被快速整理並進入資料庫,博物館的影響力就不僅僅在研究與展示。下一個關鍵問題是:這些標本的價值,能不能走出庫房,到真正需要快速判斷的現場?

倫敦自然史博物館的資料科學家Avellina Leong分享了一個跨域合作案例:博物館聯手倫敦動物學會(ZSL)、倫敦警察廳與海關,試圖用電腦視覺建立「非法蛇皮商品的物種辨識」流程。

蛇皮製成的菸盒。來源:美國紐約大都會美術館 Pierre Legrain, Public domain, via Wikimedia Commons
蛇皮製成的菸盒。圖片來源:美國紐約大都會美術館 Pierre Legrain, Public domain, via Wikimedia Commons

過去海關查緝沒收了不少蛇皮皮革製品(例如皮帶、皮包與皮鞋),但因缺乏物種鑑定,使得數位化與公開存取都相當困難。團隊一開始用蛇皮製品的照片來訓練模型,但資料量不足,表現並不理想。後來便改用活體蛇的照片來做訓練,不過活體蛇是圓筒狀,富有光澤,且花紋隨姿勢扭曲盤繞,而皮件是平面的,又經過鞣製染色,甚至被裁切得支離破碎,對 AI 來說,這根本是兩種完全不同的東西。最後,他們靈機一動,將蛇皮的圖樣裁切下來,用其特徵來訓練AI辨識蛇的品種。經過六個月的試驗,在辨識非洲岩蟒(Python sebae)的皮革製品上,準確率甚至達到近九成。

研究團隊的願景是,未來在最易攔截野生動物走私的海關、機場或港口,即使沒有爬蟲專家或分類學家的支援,仍可使用這套AI影像辨識流程,幫助執法人員快速判斷物種,提升查緝效率並降低成本。甚至可以進一步加入不同種類、不同來源的皮革製品資料,延伸不同類群的物種,擴展到其他非法商品。

但講者也坦言,要把模型轉換成第一線能使用的工具(例如APP),還需要更多的資金、時間與跨機構合作。

在博物館館藏運用自動化與機器人。圖片來源:倫敦自然史博物館機器人與自動化首席工程師Jack D. Hollister
在博物館館藏運用自動化與機器人。圖片來源:倫敦自然史博物館機器人與自動化首席工程師Jack D. Hollister

從抽屜裡的標本,到全球資料庫,再到邊境查緝現場,AI正在重新定義博物館的角色。它不只是保存過去的地方,而是成為連結研究、公共近用(Public Access)與行動的節點。當然,資料標準、系統維運、人員培力與跨機構合作,都是長期挑戰。但這些案例已經清楚顯示:當AI被用在最需要的地方,並與博物館的專業深度結合,它帶來的並不是炫目的科技展示,而是更扎實、可擴展的公共價值。

新聞