首頁 >科技週邊 >人工智慧 >清華等大學推出首個開源大模型浮水印工具包MarkLLM，支援近10種最新浮水印演算法

清華等大學推出首個開源大模型浮水印工具包MarkLLM，支援近10種最新浮水印演算法

PHPz原創: 2024-06-19 05:13:081109瀏覽

清華等大學推出首個開源大模型浮水印工具包MarkLLM，支援近10種最新浮水印演算法

AIxiv專欄是本站發布學術、技術內容的欄位。過去數年，本站AIxiv專欄接收通報了2,000多篇內容，涵蓋全球各大專院校與企業的頂尖實驗室，有效促進了學術交流與傳播。如果您有優秀的工作想要分享，歡迎投稿或聯絡報道。投稿信箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com

本文由清華大學、上海交通大學、雪梨大學、UCSB、香港中文大學、香港科技大學、香港科技大學（廣州）聯合完成。主要作者包括：潘樂怡（第一作者），清華大學本科生，研究方向為大模型水印等；劉瑤瑋，清華大學博士生，研究方向為安全可信大模型等；何志威，上海交通大學博士生，研究方向為大模型水印、大模型智能體等;高梓添，悉尼大學本科生，研究方向為大模型水印；趙宣棟，UCSB博士生，研究方向為可信生成式AI等；胡旭明，香港科技大學/香港科技大學（廣州）助理教授，研究方向為安全可信大模型、資訊抽取等；聞立傑，清華大學長聘副教授，研究方向為流程挖掘，自然語言處理。

本文介紹了由清華等校共同推出的個開源的模型印演算法。 MarkLLM提供了統的模型印演算法實現框架、直觀的印演算法機制視覺化、案例以及系統性的評估模組，旨在持研究員便地實驗、理解和評估最新的印技術展。透過MarkLLM，作者期望在給研究者提供便利的同時加深公眾對模型印技術的認知形成，進⾛推進相關研究的發展和推⼴應。

清華等大學推出首個開源大模型浮水印工具包MarkLLM，支援近10種最新浮水印演算法

理論⽂名稱：MarkLLM: An Open-Source Toolkit for LLM Watermarking
理論⽂鏈接：https://arxiv.org/abs/2405.10051
#程式碼倉庫：https://github.com/THU- BPM/MarkLLM

##⼤模型⽔印技術的發展現況& 仍⾯臨的問題

⼤模型⽔印是近期新興的⼀項技術，透過在模型⽣成⽂本過程中植⼊特定的特徵，來實現機⽣⽂本的辨別與來源追溯。它可⽤於假新聞檢測、維護學術誠信、資料和模型版權保護等場景。

⽬前主流的⼤模型⽔印演算法是在⼤模型推理階段植⼊⽔印，這類⽅法主要分為兩⼤演算法家族：

清華等大學推出首個開源大模型浮水印工具包MarkLLM，支援近10種最新浮水印演算法

####Christ 家族：在評分向量⽣成後，⽤偽隨機數⼲預採樣過程，使⽔印⽂本與此隨機數更相關，以此植⼊⽔印。 ############然⽽，就像所有新興技術⼀樣，⼤語⾔模型⽔印技術在使⽤和理解上也⾯臨⼀些挑戰。 ######1. 如何方便地使⽤各個⼤模型⽔印演算法進⾏⽔印新增與偵測？ ######各類別⼤模型⽔印演算法不斷湧現。然⽽它們的實現⼤都基於作者⾃⾝的需求，缺乏統⼀的類別和調⽤接⼝設計，使得研究⼈員和⼤眾需要投⼊⼤量精⼒去使⽤和復現這些演算法。 ######2. 如何直觀地理解各個⼤模型⽔印演算法的內部機制？ ######⼤模型⽔印演算法的底層機制相對複雜，涉及對⼤模型⽣成⽂本過程中打分向量⽣成以及採樣過程的⼲預，不便於研究者和⼤眾理解。 ######3. 如何便利、全⾯的評估各個⼤模型⽔印演算法？ ######評估⻆度和指標多樣（包含可偵測性、穩健性、對⽂本品質的影響等），且⼀次評估涉及多步驟，全⾯快速評估演算法效能極具挑戰。 #########MarkLLM：⾸個開源⼤模型⽔印多功能⼯具套件#########針對剛才提到的3 個問題，作者設計並實現了⾯向⼤語⾔模型⽔印技術的⼯具包MarkLLM。 ######MarkLLM 的主要貢獻可總結如下：#########1. 功能⻆度###############統⼀的⼤模型⽔印演算法實現框架：⽀持兩個關鍵⽔印演算法家族（KGW 家族和Christ 家族）的9 種具體演算法。 ############⼀致、⽤⼾友善的頂層調⽤接⼝：1 ⾏程式碼實作新增⽔印、偵測⽔印等各類操作。 ###

清華等大學推出首個開源大模型浮水印工具包MarkLLM，支援近10種最新浮水印演算法