首頁  >  文章  >  科技週邊  >  學而思研發面向全球數學愛好者大模型MathGPT

學而思研發面向全球數學愛好者大模型MathGPT

WBOY
WBOY轉載
2023-05-11 21:55:04874瀏覽

近日,在各家大廠打得如火如荼的「ChatGPT大戰」中,學而思也加入其中。

不過,學而思另闢蹊徑選擇的是自研數學大模型“MathGPT”,以數學領域的解題和講題演算法為核心,並且已經取得了階段性成果。

對此學而思表示,基於此自研大模型的產品級應用預計會在年內推出,將面向全球數學愛好者和科研機構。

作為公司的核心項目,學而思早在今年春節之前就啟動了相應的團隊建設、數據、算力準備和技術研發,並直接交由CTO田密負責。

此外,位於美國矽谷的團隊建設目前也已經啟動,計劃成立一支海外演算法和工程團隊,在全球招募優秀的人工智慧專家加入。

MathGPT與大語言模型(LLM)的差異

#今年三月,OpenAI正式發表大語言模型GPT-4。隨後,國內百度、阿里也推出了各自的大模型產品。

然而,通用語言模型更像一個「文科生」,在語言翻譯、摘要、理解和生成等任務上有出色表現,但在數學問題的解決、講解、問答與推薦方面則有明顯不足-

「解答數學問題常出錯,有些數學問題雖然能夠解決,但方法更偏成年人,無法針對適齡孩子的知識結構和認知層次做適配。」

對此,學而思AI團隊負責人表示,這種不足是由LLM模型的自身特徵決定的。 LLM大模型來自於海量語言文本的訓練,因此最擅長語言處理。

業界偏向基於LLM大模型做閱讀、寫作類別應用,但如果想要在數學能力上有突破,就需要研發新的大模型。

因此,學而思決心組建團隊專研MathGPT——數學領域大模型,用自己在數學和AI上的多年積累,面向全球範圍內的數學愛好者和科研機構,做好AI大模型時代的數學基礎工作。

學而思希望透過MathGPT來彌補和攻克大語言模型的三個問題:

第一,題目要解對,現在GPT結果常出現錯誤;

第二,解題步驟要穩定、清晰,現在GPT的解題步驟每次都不一樣,而且生成內容經常很冗餘;

第三,解題要講的有趣、個人化,現在GPT的解釋過於「學術」和機械,對孩子的學習經驗很不友善。

做MathGPT,學而思憑什麼

學而思作為獲國家科技部批准的「智慧教育國家新一代人工智慧開放創新平台」建設單位,也是教育界唯一一家人工智慧「國家隊」成員,在人工智慧領域有著多年的深入研究,早在2017年,學而思便成立了AI lab人工智慧實驗室。

據公開資訊顯示,基於智慧教育人工智慧開放創新平台助力,學而思AI lab獲得各類頂級學術會議比賽冠軍16項,亞軍6項;發表國際期刊和會議高層次學術論文31篇,包含光學字元辨識、圖像、自然語言處理、語音以及多模態等多領域的學術研究,在電腦視覺頂會以及自然語言頂會中均有多篇論文發表;申請專利220餘項,授權專利150餘項,軟體著作權60餘項。

學而思研發面向全球數學愛好者大模型MathGPT

學而思AI lab在各類頂尖學術會議中獲獎情況

「以數學起家」的學而思至今已有20年的數學教學經驗,累積了龐大的數學相關數據,這些數據是進行MathGPT訓練的必備物料。

另外,學而思的海外業務Think Academy在全球若干國家和地區深受數學愛好者喜歡,學而思的學生在每年的IMO和AMC等國際數學競賽中表現優異,每年都有多位學生在國際奧林匹克數學競賽中拿到金牌。

所以,學而思選擇在MathGPT方向發力也順理成章。

另據了解,學而思學習機近期將會上線一款「AI助理」,涵蓋作文助理、口語助理、閱讀助手、數學助理等相關功能,該AI產品將於5月11日開啟內測。

MathGPT的挑戰與技術難題

如何運用大語言模式服務各行各業是當下社會的焦點問題。

例如在教育領域,Duolingo、Quizlet、可汗學院等產品主要和OpenAI合作,在GPT大模型上做微調和介面調用,增強原有的產品體驗。

但也有一些領域如數學、醫學等,對AI的需求是準確、清晰、具備強大的邏輯推理能力,且容錯率低,通用LLM目前的表現表現還無法在上述領域取得突破,未來是否可能取得突破尚不清楚。

以數學領域為例,目前市場上有幾個主要流派。

例如Google收購的Photomath、微軟數學、Mathway、專注數學運算的WolframAlpha等產品,主要利用非LLM的傳統AI技術加上資料庫的方式解決數學問題。

走AGI路線的公司則嘗試讓通用LLM「更懂數學」,例如GPT-4在數學任務上比之前的3.5版本表現更好,Google旗下的Minerva模型也專門針對數學問題進行調優。

學而思選擇了另一條少有人走的路,不基於現有LLM做微調和介面呼叫、不做通用LLM,而是自研基於專業領域的“數學大模型」MathGPT,致力於打造自主、穩定、永續、高品質的學習解決方案。

在大語言模型不斷進化的浪潮下,不同的技術路線選擇孰優孰劣,仍有待討論與驗證。

學而思自研獨立的MathGPT大模型是否成立,是否能夠超越通用模型在數學任務上的表現,是否更匹配不同人群的數學學習場景,這個問題還需要在創新實踐中尋找答案。

隨著整個產業的深化發展和越來越多人才參與這個領域,相信不久的將來就能看到更成熟的解決方案。

以上是學而思研發面向全球數學愛好者大模型MathGPT的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除