我們知道,Huggingface 是 AI 領域著名的開源平台,任何人和機構都可以在該平台上發布自己以及使用他人的模型、資料集,為業界提供了研究便利。因此它深受 AI 圈的喜愛,其最受歡迎的 Transformer 庫已在 GitHub 上收穫 102k 的 Star 量。
不過近日,由 TII 開發並發佈在 Huggingface 上的一個大模型引發了廣泛爭議。這個大模型是 400 億參數的因果解碼器模型 Falcon-40B,它在 RefinedWeb 的 1000B token 上進行訓練,並使用精選資料集增強。它在 Huggingface 的 OpenLLM 排行榜上排首位,其性能優於 LLaMA、MPT、RedPajama 和 StableLM 等。
#排行榜網址:https://huggingface.co/spaces/ HuggingFaceH4/open_llm_leaderboard
#雖然Falcon-40B 模型本身很強大,但其遵循的開源協定卻在開源圈引起了軒然大波。它在一個允許商業使用的許可證下可用,即如下 TII Falcon LLM License。
#開源協定:https://huggingface.co/tiiuae/falcon -40b/blob/main/LICENSE.txt
#此授權部分基於Apache License Version 2.0#。 Apache License 2.0 協定來自著名的 Apache 基金會,它對商業應用友善。用戶可以在需要的時候修改程式碼來滿足需求並作為開源或商業產品發布 / 銷售。
但有人發現了 TII Falcon LLM License 的一些「貓膩」。推特用戶 @natfriedman 總結了它與 Apache License 2.0 開源授權的相似與不同之處。其中相似之處在於都授予使用、修改和分發許可作品的廣泛許可,要求在分發中包含許可文本和歸屬,並具有責任限制、擔保豁免權。
不過區別在於,TII Falcon LLM License 要求一旦達到收入門檻,需支付商業用途特許權使用費,而大多數開源許可不需要。 TII Falcon LLM License 對如何發布或分發作品也有額外限制, 例如要求歸屬於「Falcon LLM technology from the Technology Innovation Institute」。
同時,TII Falcon LLM License 不允許在其他不同的授權下重新授權作品,而大多數開源授權允許衍生作品根據不同的協議獲得許可。 TII Falcon LLM License 也明確地排除了 Falcon LLM 的某些版本 / 大小的許可,而開源許可通常適用於所有版本。
最後,TII Falcon LLM License 對修改原始程式碼和目標程式碼都有額外的要求,除非分發編譯的模型。總之,該許可允許開放使用和修改,但同時又保留了許多自有權利。
@natfriedman 的觀點得到了許多人的附和,另一位推特用戶@_msw_直截了當地指出,將專有授權基於受信任的Apache License 2.0 之上並稱其為「開源」(實際上不是真正的開源),這種利用Apache 軟體基金會來之不易的信譽和品牌的做法是不對的。
又有人問了,這意味著 Falcon-40B 不開源或不是免費軟體? @_msw_回覆稱它既不開源也不是免費軟體。
吃瓜群眾有的同意並認為TII Falcon LLM License 根本不是開源許可,但也有的指出TII Falcon LLM License 本就是「部分」是基於開源協定。
業內從事開源人士發表了觀點,認為魔改Apache 或其他主流開源許可證不叫開源,甚至不算開放核心。
####Falcon-40B 是否開源但又不完全開源呢?機器之心的讀者們,你們怎麼看? ######
以上是Huggingface榜首開源模型惹爭議:魔改Apache協議,達到一定門檻要收錢的詳細內容。更多資訊請關注PHP中文網其他相關文章!