今年以來,以大語言模式為代表的人工智慧,正帶來全新的科技變革,加速深入千行百業,為實體經濟創造新的發展機會。
9月7日,在騰訊全球數位生態大會上,騰訊混元大模型正式亮相,透過騰訊雲端對外開放。
至此「百舸爭流」的國產大模型賽道上,再添一位實力派選手。
海量專利支撐全鏈路自研
在AI大模型的新賽道上,國內企業以其長期的研發投入和技術積累,實現了快速起跑。 2021到2022年,騰訊先後研發千億和兆參數的NLP稀疏大模型,實現在中文理解能力上的新突破,並在實際應用中不斷優化大模型底層演算法。
據了解,此次發布的混元大模型是由騰訊全鏈路自研的通用大語言模型,擁有超千億參數規模,預訓練語料超2萬億tokens,具有強大的中文理解與創作能力、邏輯推理能力,以及可靠的任務執行能力,在解決大模型常見的「幻覺」問題上取得了顯著進步,「胡言亂語」問題獲得明顯解決。
騰訊集團副總裁蔣傑認為,混元大模型中文能力已經超過GPT3.5。
這次在發布會上,蔣傑用中國信通院《大規模預訓練模型技術和應用的評估方法》做了測試,共測評了混元大模型66個能力項,在“模型開發”和「模型能力」兩個重要領域的綜合評估都獲得了目前的最高分。在主流的評測集MMLU、CEval和AGI-eval上,混元大模型都有優異的表現。
其實,騰訊混元的優勢離不開騰訊在AI專利上的優勢。如今年4月騰訊獲授權的“AI智能聊天互動專利”,可多模態回复消息;6月“一種基於人工智能的心理諮詢/會話系統及其方法”專利獲授權;7月“語句生成方法、裝置以及電腦可讀儲存媒體」或授權等等。
從申請專利到專利授權,可以看出,騰訊在AI領域的動作很快。
全球人工智慧領域專利申請數量從2013年才開始呈現爆炸性成長,而根據機構statista數據統計,騰訊在2021年AI專利擁有數量已超越微軟,位居全球第一。
專利是企業的重要無形資產,不僅能直接為企業帶來經濟利益,也能協助品牌在產業中提高影響力和公信度。我們常看到網路資訊某企業專利曝光的新聞,從而了解到企業的創新實力、研發方向,乃至推測出企業的發展動向。
正是這些密集獲得授權的專利支撐起了混元大模型的自研之路,多年的專利累積也完善了騰訊在AI領域的技術體系。
真金白銀持續投入
#在剛過去的2023年第二季度,騰訊發布最新的財報數據,今年上半年累計研發投入已達311.91億元。自2018年至今,騰訊累計投入的研發經費更是高達2,368億元,也使得其在研發領域的人員佔比達到驚人的74%。
多年的高投入讓騰訊在技術創新上取得了顯著的突破。截至2022年末,騰訊在全球的專利申請公開總數超過6.6萬件,專利授權數更是超過3.3萬件。這些專利主要集中在人工智慧、雲端技術、大出行和即時通訊等前沿領域,為騰訊在科技領域的領先地位提供了堅實的支撐。
值得一提的是,在國內主要網路公司裡,騰訊的研發開支已經位居首位。
而這些研發投入換來的是龐大專利成就。截至今年6月,騰訊在全球主要國家及地區專利申請公開總數超過6.6萬件,專利授權數超過3.3萬件,主要集中在人工智慧、雲端技術、大出行、即時通訊等前沿領域。
其實早在2019年,騰訊在全球主要國家的專利申請數量已超過30,000件,已授權專利數量就超過10,000件。專利申請數量在國內網路公司中排名第一,在全球網路公司中排名第二,僅次於Google。
而這些研發投入和專利的取得,也說明騰訊做好大模型的決心很大,以便更好的支持了產業智慧化和幫助中國企業數位轉型。
At the Global Digital Conference, Li Qiang, Vice President of Tencent Group, said, “Tencent will firmly promote large-scale models to enter the entire industrial chain and integrate them into industrial practice, from fields to production lines, from laboratories to convenience stores, so that Large models are everywhere to help China's real economy cope with the challenges of globalization and achieve high-quality growth.
以上是騰訊混元實測竟超過GPT3.5? AI專利成騰訊大模型最大底氣的詳細內容。更多資訊請關注PHP中文網其他相關文章!