在AI科技圈,「中文語言理解」一直是個難以攻克的問題。因為在全世界所有的語言中──中文的難度係數是最高的。
舉例來講,就下面這句簡簡單單20個字的句子,都絕對能讓不少外國人深感崩潰。
下雨天,我騎車差點跌倒,好在一把把把把把住了。
然而,在最新的中文語言理解領域權威榜單CLUE中,騰訊和阿里的AI模型卻先後超越了人類的成績!實在讓人不禁感慨:這年頭,還有什麼是AI做不了的嗎?
最新一期CLUE最新排名
CLUE的全名為Chinese Language Understanding Evaluation,即「中文語言理解評測基準」。
就像英文的GLUE和SuperGLUE,CLUE是一組評估機器能夠像人類一樣理解和回應中文文字的任務,上線於3年前,也是第一個大規模的中文語言評估基準,旨在推動NLP技術的不斷進步和突破。
在CLUE的官網上,有語料庫、排行榜、預訓練模型和代表性的資料集等資料可供選擇。包括文本相似度、分類、上下文推理、閱讀理解在內的17項評測任務,其介紹在官網上都有詳盡的展示。
今年11月22日,阿里巴巴的AI模型「AliceMind」獲得了86.685的高分,穩居總排行榜首位的同時,也一舉打破了由人類(HUMAN)在該系列測試中保持的紀錄。
值得一提的是,這也是人工智慧在該系列測試中——首次超越人類。
巧合的是,短短4天后,騰訊的「混元AI大模型」在測試中以86.918的高分再次刷新了紀錄——這甚至比AliceMind的成績還要高0.233分。
中國兩大網路巨頭你方唱罷我登場,說明人工智慧在不同領域和麵向都有超越人類的能力。
上週五,阿里雲端運算部門也在一篇文章中表示,「這標誌著中國對AI模型的理解,達到了一個新的水平」。
中國的大型科技公司正努力改進他們的自然語言處理(NLP) 系統,這些系統被用於支援如阿里巴巴的語音激活虛擬助手,騰訊的小微和AliGenie,以及機器翻譯和垃圾郵件偵測等其他功能。
今年早些時候,由百度研發的AI模型“度曉曉”寫出的作文,儘管錯誤地使用了不少互聯網俚語和生僻詞,但仍在高考得分中高於絕大多數學生。
此外在最新排行榜上,中國智慧型手機製造商OPPO和外送巨頭美團的人工智慧模型,也分別排在第四和第五位。
儘管如此,一些研究人員表示:雖然機器在某些語言任務上可以比人類做得更好,但大多數人工智慧模型在真正理解語言的複雜性之前,還有很長的路要走。
去年,由美國阿拉巴馬州奧本大學和Adobe的研究部門聯合研究發現,許多在某些理解任務上表現優於人類的AI,仍無法分辨出單字被隨機打亂的句子。
參考資料:
https://www.cluebenchmarks.com/rank.html
https://www.scmp.com/tech/big-tech/ article/3201294/tencent-and-alibabas-ai-models-understand-chinese-better-humans-new-rankings-show
https://www.techtimes.com/articles/284084/20221128/tencent -alibaba-ai-tech-tops-chinese-language-comprehension-humans-ranks.htm
https://english.newstracklive.com/news/ai-models-from-tencent-and-alibaba- are-superior-to-humans-at-understanding-chinese-sc71-nu355-ta355-1259160-1.html
#以上是AI首次超越人類!騰訊、阿里的NLP模型,比你更懂中文的詳細內容。更多資訊請關注PHP中文網其他相關文章!