搜尋
首頁科技週邊人工智慧學而思研發面向全球數學愛好者大模型MathGPT

近日,在各家大廠打得如火如荼的「ChatGPT大戰」中,學而思也加入其中。

不過,學而思另闢蹊徑選擇的是自研數學大模型“MathGPT”,以數學領域的解題和講題演算法為核心,並且已經取得了階段性成果。

對此學而思表示,基於此自研大模型的產品級應用預計會在年內推出,將面向全球數學愛好者和科研機構。

作為公司的核心項目,學而思早在今年春節之前就啟動了相應的團隊建設、數據、算力準備和技術研發,並直接交由CTO田密負責。

此外,位於美國矽谷的團隊建設目前也已經啟動,計劃成立一支海外演算法和工程團隊,在全球招募優秀的人工智慧專家加入。

MathGPT與大語言模型(LLM)的差異

#今年三月,OpenAI正式發表大語言模型GPT-4。隨後,國內百度、阿里也推出了各自的大模型產品。

然而,通用語言模型更像一個「文科生」,在語言翻譯、摘要、理解和生成等任務上有出色表現,但在數學問題的解決、講解、問答與推薦方面則有明顯不足-

「解答數學問題常出錯,有些數學問題雖然能夠解決,但方法更偏成年人,無法針對適齡孩子的知識結構和認知層次做適配。」

對此,學而思AI團隊負責人表示,這種不足是由LLM模型的自身特徵決定的。 LLM大模型來自於海量語言文本的訓練,因此最擅長語言處理。

業界偏向基於LLM大模型做閱讀、寫作類別應用,但如果想要在數學能力上有突破,就需要研發新的大模型。

因此,學而思決心組建團隊專研MathGPT——數學領域大模型,用自己在數學和AI上的多年積累,面向全球範圍內的數學愛好者和科研機構,做好AI大模型時代的數學基礎工作。

學而思希望透過MathGPT來彌補和攻克大語言模型的三個問題:

第一,題目要解對,現在GPT結果常出現錯誤;

第二,解題步驟要穩定、清晰,現在GPT的解題步驟每次都不一樣,而且生成內容經常很冗餘;

第三,解題要講的有趣、個人化,現在GPT的解釋過於「學術」和機械,對孩子的學習經驗很不友善。

做MathGPT,學而思憑什麼

學而思作為獲國家科技部批准的「智慧教育國家新一代人工智慧開放創新平台」建設單位,也是教育界唯一一家人工智慧「國家隊」成員,在人工智慧領域有著多年的深入研究,早在2017年,學而思便成立了AI lab人工智慧實驗室。

據公開資訊顯示,基於智慧教育人工智慧開放創新平台助力,學而思AI lab獲得各類頂級學術會議比賽冠軍16項,亞軍6項;發表國際期刊和會議高層次學術論文31篇,包含光學字元辨識、圖像、自然語言處理、語音以及多模態等多領域的學術研究,在電腦視覺頂會以及自然語言頂會中均有多篇論文發表;申請專利220餘項,授權專利150餘項,軟體著作權60餘項。

學而思研發面向全球數學愛好者大模型MathGPT

學而思AI lab在各類頂尖學術會議中獲獎情況

「以數學起家」的學而思至今已有20年的數學教學經驗,累積了龐大的數學相關數據,這些數據是進行MathGPT訓練的必備物料。

另外,學而思的海外業務Think Academy在全球若干國家和地區深受數學愛好者喜歡,學而思的學生在每年的IMO和AMC等國際數學競賽中表現優異,每年都有多位學生在國際奧林匹克數學競賽中拿到金牌。

所以,學而思選擇在MathGPT方向發力也順理成章。

另據了解,學而思學習機近期將會上線一款「AI助理」,涵蓋作文助理、口語助理、閱讀助手、數學助理等相關功能,該AI產品將於5月11日開啟內測。

MathGPT的挑戰與技術難題

如何運用大語言模式服務各行各業是當下社會的焦點問題。

例如在教育領域,Duolingo、Quizlet、可汗學院等產品主要和OpenAI合作,在GPT大模型上做微調和介面調用,增強原有的產品體驗。

但也有一些領域如數學、醫學等,對AI的需求是準確、清晰、具備強大的邏輯推理能力,且容錯率低,通用LLM目前的表現表現還無法在上述領域取得突破,未來是否可能取得突破尚不清楚。

以數學領域為例,目前市場上有幾個主要流派。

例如Google收購的Photomath、微軟數學、Mathway、專注數學運算的WolframAlpha等產品,主要利用非LLM的傳統AI技術加上資料庫的方式解決數學問題。

走AGI路線的公司則嘗試讓通用LLM「更懂數學」,例如GPT-4在數學任務上比之前的3.5版本表現更好,Google旗下的Minerva模型也專門針對數學問題進行調優。

學而思選擇了另一條少有人走的路,不基於現有LLM做微調和介面呼叫、不做通用LLM,而是自研基於專業領域的“數學大模型」MathGPT,致力於打造自主、穩定、永續、高品質的學習解決方案。

在大語言模型不斷進化的浪潮下,不同的技術路線選擇孰優孰劣,仍有待討論與驗證。

學而思自研獨立的MathGPT大模型是否成立,是否能夠超越通用模型在數學任務上的表現,是否更匹配不同人群的數學學習場景,這個問題還需要在創新實踐中尋找答案。

隨著整個產業的深化發展和越來越多人才參與這個領域,相信不久的將來就能看到更成熟的解決方案。

以上是學而思研發面向全球數學愛好者大模型MathGPT的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
擁抱面部是否7B型號奧林匹克賽車擊敗克勞德3.7?擁抱面部是否7B型號奧林匹克賽車擊敗克勞德3.7?Apr 23, 2025 am 11:49 AM

擁抱Face的OlympicCoder-7B:強大的開源代碼推理模型 開發以代碼為中心的語言模型的競賽正在加劇,擁抱面孔與強大的競爭者一起參加了比賽:OlympicCoder-7B,一種產品

4個新的雙子座功能您可以錯過4個新的雙子座功能您可以錯過Apr 23, 2025 am 11:48 AM

你們當中有多少人希望AI可以做更多的事情,而不僅僅是回答問題?我知道我有,最近,我對它的變化感到驚訝。 AI聊天機器人不僅要聊天,還關心創建,研究

Camunda為經紀人AI編排編寫了新的分數Camunda為經紀人AI編排編寫了新的分數Apr 23, 2025 am 11:46 AM

隨著智能AI開始融入企業軟件平台和應用程序的各個層面(我們必須強調的是,既有強大的核心工具,也有一些不太可靠的模擬工具),我們需要一套新的基礎設施能力來管理這些智能體。 總部位於德國柏林的流程編排公司Camunda認為,它可以幫助智能AI發揮其應有的作用,並與新的數字工作場所中的準確業務目標和規則保持一致。該公司目前提供智能編排功能,旨在幫助組織建模、部署和管理AI智能體。 從實際的軟件工程角度來看,這意味著什麼? 確定性與非確定性流程的融合 該公司表示,關鍵在於允許用戶(通常是數據科學家、軟件

策劃的企業AI體驗是否有價值?策劃的企業AI體驗是否有價值?Apr 23, 2025 am 11:45 AM

參加Google Cloud Next '25,我渴望看到Google如何區分其AI產品。 有關代理空間(此處討論)和客戶體驗套件(此處討論)的最新公告很有希望,強調了商業價值

如何為抹布找到最佳的多語言嵌入模型?如何為抹布找到最佳的多語言嵌入模型?Apr 23, 2025 am 11:44 AM

為您的檢索增強發電(RAG)系統選擇最佳的多語言嵌入模型 在當今的相互聯繫的世界中,建立有效的多語言AI系統至關重要。 強大的多語言嵌入模型對於RE至關重要

麝香:奧斯汀的機器人需要每10,000英里進行干預麝香:奧斯汀的機器人需要每10,000英里進行干預Apr 23, 2025 am 11:42 AM

特斯拉的Austin Robotaxi發射:仔細觀察Musk的主張 埃隆·馬斯克(Elon Musk)最近宣布,特斯拉即將在德克薩斯州奧斯汀推出的Robotaxi發射,最初出於安全原因部署了一支小型10-20輛汽車,並有快速擴張的計劃。 h

AI震驚的樞軸:從工作工具到數字治療師和生活教練AI震驚的樞軸:從工作工具到數字治療師和生活教練Apr 23, 2025 am 11:41 AM

人工智能的應用方式可能出乎意料。最初,我們很多人可能認為它主要用於代勞創意和技術任務,例如編寫代碼和創作內容。 然而,哈佛商業評論最近報導的一項調查表明情況並非如此。大多數用戶尋求人工智能的並非是代勞工作,而是支持、組織,甚至是友誼! 報告稱,人工智能應用案例的首位是治療和陪伴。這表明其全天候可用性以及提供匿名、誠實建議和反饋的能力非常有價值。 另一方面,營銷任務(例如撰寫博客、創建社交媒體帖子或廣告文案)在流行用途列表中的排名要低得多。 這是為什麼呢?讓我們看看研究結果及其對我們人類如何繼續將

公司競爭AI代理的採用公司競爭AI代理的採用Apr 23, 2025 am 11:40 AM

AI代理商的興起正在改變業務格局。 與雲革命相比,預計AI代理的影響呈指數增長,有望徹底改變知識工作。 模擬人類決策的能力

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中