搜尋
首頁科技週邊人工智慧AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

Aug 07, 2023 pm 12:21 PM
ai大模型訊飛星火高考考場

AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

近日,2023年高考落下帷幕,「用AI寫高考作文」的話題也備受熱議。 2023年,受ChatGPT熱潮的影響,國內的AI大模型產品也如雨後春筍。例如,百度、阿里、360等網路巨頭企業均相繼推出文心一言、通義千問、360智腦等AI大模型產品。

同時,一些深耕教育AI賽道的玩家也不甘人後,借助AI大模型,將其原本的優勢得以釋放。作為智慧語音和人工智慧賽道的上市企業,科大訊飛推出的大模型產品訊飛星火,也在這波AI熱潮中備受關注。

那麼,與高考與教育賽道高度相關的訊飛星火,實際寫作水準與使用體驗如何?筆者對其進行了高考作文相關的系列提問。透過親測體驗,發現這確實是一款十分聰明的AI大模型產品。雖然也有一些美中不足的地方,但也可謂瑕不掩瑜。

瑕不掩瑜,真實等級或不敵優等生

#首先,筆者以全國甲卷為例,與科大訊飛星火認知大模型進行了對話。這卷作文題目是:人們因科技發展而得以更好地掌控時間,但也有人因此成了時間的僕人。這句話引發了你怎樣的聯想與思考?請寫一篇文章。

AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

筆者將該高考作文的要求,全文輸入訊飛星火。訊飛星火的「高考作文」如下:全文共855字,回答時間在30秒以內。

AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

圖源:訊飛星火認知大模型

透過輸出的內容可以看出,科大訊飛星火對於提問的語意理解基本上正確,行文的邏輯也十分順暢,例如,在如何正確的利用時間方面,訊飛星火採用了「因為... ....所以」等表達方式,可謂有理有據,同時行文的措辭表達也非常的口語化,並沒有多麼華麗的辭藻與晦澀難懂的句子。

不過,作為體現考生寫作程度最重要的考試,高考作文還會考查考生作文的立意新穎程度、文字功底等。而如果從這些角度去評價訊飛星火的“高考作文”,也不難看出其存在的明顯不足。

首先,在立意方面。訊飛星火用「時間」是把殺豬刀為題,雖然通俗易懂,但是未免過於普通,甚至讓人覺得有些敷衍套作的意味。

其次,文章中有多個論點,例如「時間很重要」、「我們應該學會利用時間」、「應該勞逸結合等」。只是,這些觀點的論據,都帶有一定的說教意味,既沒有引經據典,也沒有太多實例輔助讀者理解,因此論據也顯得不夠具體和有說服力、更缺少文采。

雖然文末舉了兩個例子,但是沒有插入到文章對應的觀點之中進行佐證,也顯得不夠完整。為了驗證訊飛星火的智慧性,筆者繼續對其進行提問,試圖讓其再寫一篇立意更新穎、更有深度的文章。全文如下,共827字,回答時間同樣在30秒以內。

AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

透過全文內容可以看出,這次的「高考作文」在內容方面,更接近筆者的需求。例如,行文中用到了莎士比亞、愛因斯坦、愛迪生、賈伯斯等名人名言。

只不過,除了前兩位名人關於時間的名言能夠對其觀點進行佐證外,文章中引用的愛迪生與賈伯斯的名言卻與觀點關係並不大,因此依然顯得說服力不足。由此可見,雖然訊飛星火理解了作文題目要求的語義,但是在引經據典的作文要求方面,還是有「套作」的嫌疑。

據筆者親測多款大模型產品,發現這類產品「套作」的現象十分普遍。因此有網友分析表示,或許AI大模型產品不理解「套作」的意思。依照一些網友的理解,套作指的是不能生搬硬套、套公式套模板。因此,也有網友評價訊飛星火自動生成的文章過於普通,更像是普通國中生的作文。

除此之外,筆者發現,大多數大模型產品的“高考作文”,體裁都是議論文。因此,也試著讓訊飛星火換一種體裁與風格,試試訊飛星火寫作更生活化的話題作文的程度。於是,又以2023年新課標I卷關於「故事」的話題作文,來測試訊飛星火。

AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

將作文題目全文輸入訊飛星火,輸出的文章字數是763字,文章的中心思想是:故事有力量,而好故事的意義與價值是多方面的。全文也非常有層次的進行了逐一論點的陳述、佐證。而佐證的內容,主要是引經據典,透過古代、近現代的文學作品進行舉例說明,從而得出結論。

AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

不過,全文體裁看起來,依然是一篇議論文。筆者認為,現代元素還是少了一些,依然具有強烈的說教味道。如果能結合好故事帶給身邊親友的改變來舉例說明,或許遠比只是提到那些文學作品,更有說服力。

體驗過關,但美中有不足

好在訊飛星火在功能體驗上,比市面其他大模型產品,更體貼入微。例如,除了查看歷史提問、新對話等,而且相關選單也放在了十分顯眼的位置,避免用戶無法快速找到歷史對話記錄,還可以一鍵選擇「重新回答」。

AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

於是,筆者試著換一種提問方式,並試著連續發問。不過親測發現,科大訊飛星火似乎不太支持連續發問。

對於筆者針對上一篇作文的疑問,訊飛星火也採用了「忽略」的處理方式。沒有正面回答筆者關於對上一篇「高考作文」不滿意的回答,而是直接重新寫了一篇文章。

值得驚喜的是,這次產出的「好故事」的作文,終於不再是議論文了。而是很俱生活化,列舉了許多實際生活案例的文章,因此讀起來也更像真實考生的創作。

AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

由此可見,AI大模型產品輸出的內容為何,關鍵還在於使用者如何提問。在訊飛星火能夠全面理解用戶提問的語意基礎上,只要提問的內容夠具體、要求合理,訊飛星火是能夠輸出用戶真正想要的內容的。

不過,美中不足的是,訊飛星火在理解用戶的提問意圖時,還是存在一些明顯的偏差。例如前文的多次測驗中,明確要求作文需要自擬題目,字數不少於800字。但訊飛星火實際輸出的作文,既沒有標題,字數有時也不及800字。透過親測對比其他大模型產品,這種問題也相對普遍。

由此也可以預見,未來大模型產品如何更精準的進行語意理解,將會是非常重要的競爭力之一。

人類未來需要什麼樣的AI大模型產品?

測完訊飛星火大模型產品的智慧程度、使用者體驗,我們不妨從使用者角度來看,人類到底需要什麼樣的大模型產品。首先,我們來看看訊飛星火是怎麼回答這個問題的,也非常有趣。

AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

透過訊飛星火的回答,不難看出,這些因素確實是用戶未來十分關注的最佳化方向。只是,在這些特質之前,如何建立機器人與人類之間的良好溝通,才是第一步。

這正如不同國家的人,使用不同的語言,如果沒有翻譯機,彼此又不懂他國語言,那麼就是雞同鴨講,自然得不到正確的反饋。因此筆者認為,所有的大模型產品,未來首要需要解決的,便是如何正確地理解人類的基礎語言,包括隨著時代變化而產生的新詞彙、網絡語言、口語、方言等。

難能可貴的是,科大訊飛一直深耕智慧語音和人工智慧賽道,其翻譯機產品在全球暢銷,便是其對不同語言轉換技術的有力印證。因此,對比之下,訊飛星火相比其他大模型,理論上具有更強的技術研發能力,能讓訊飛星火目前存在的一些瑕疵進行最佳化迭代。

而在各個網路科技大廠都紛紛推出大模型產品之時, 今年高考的“作文大賽”,既是一個練兵場,也是一塊試金石。在各大廠集體奔赴考場時,誰負誰勝已經不再重要,重要的是藉助這次契機,大廠的AI大模型存在什麼利弊,或許各大玩家心知肚明。

非常有趣的是,當筆者試圖提問訊飛科技,AI大模型產品哪家強之時,其回答非常的“圓滑”,也非常的低調,並沒有宣稱自己就是行業第一,甚至在回答內容裡,提到的都是別家的產品,都沒有提到「訊飛星火」。如果用調侃的語氣來看這樣的回答,科大訊飛這種「低調務實」的精神,還是值得肯定的。

AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

人類的進步,永遠都是思想的突破。人工智慧的應用,目前還只是萬裡長徵的第一步。雖然離人們想要的完美尚有距離,但一定會朝著人類想要達到的效果邁進。

結語

作為教育AI賽道的玩家之一,科大訊飛顯然是更懂教育、更懂學生的。因此,相較於一些大模型產品面向的產業大而全,訊飛星火在AI大模型集體寫作文這個熱門事件上,幾乎是獨一無二的存在,因此訊飛星火在受到更多關注的同時,也將背負著更多人的希望。

我們相信,在AI大模型的應用越來越成熟的同時,其逐漸向行業垂直,走向專業化、生態化也將成為必然,而科大訊飛不僅能將訊飛星火用在其學習機等AI硬體產品上,更將因為其開放性,而為教育產業添磚加瓦、增添色彩。

以上是AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:搜狐。如有侵權,請聯絡admin@php.cn刪除
外推指南外推指南Apr 15, 2025 am 11:38 AM

介紹 假設有一個農民每天在幾週內觀察農作物的進展。他研究了增長率,並開始思考他的植物在幾週內可以生長的高度。從Th

軟AI的興起及其對當今企業的意義軟AI的興起及其對當今企業的意義Apr 15, 2025 am 11:36 AM

軟AI(被定義為AI系統,旨在使用近似推理,模式識別和靈活的決策執行特定的狹窄任務 - 試圖通過擁抱歧義來模仿類似人類的思維。 但是這對業務意味著什麼

為AI前沿的不斷發展的安全框架為AI前沿的不斷發展的安全框架Apr 15, 2025 am 11:34 AM

答案很明確 - 只是雲計算需要向雲本地安全工具轉變,AI需要專門為AI獨特需求而設計的新型安全解決方案。 雲計算和安全課程的興起 在

生成AI的3種方法放大了企業家:當心平均值!生成AI的3種方法放大了企業家:當心平均值!Apr 15, 2025 am 11:33 AM

企業家,並使用AI和Generative AI來改善其業務。同時,重要的是要記住生成的AI,就像所有技術一樣,都是一個放大器 - 使得偉大和平庸,更糟。嚴格的2024研究O

Andrew Ng的新簡短課程Andrew Ng的新簡短課程Apr 15, 2025 am 11:32 AM

解鎖嵌入模型的力量:深入研究安德魯·NG的新課程 想像一個未來,機器可以完全準確地理解和回答您的問題。 這不是科幻小說;多虧了AI的進步,它已成為R

大語言模型(LLM)中的幻覺是不可避免的嗎?大語言模型(LLM)中的幻覺是不可避免的嗎?Apr 15, 2025 am 11:31 AM

大型語言模型(LLM)和不可避免的幻覺問題 您可能使用了諸如Chatgpt,Claude和Gemini之類的AI模型。 這些都是大型語言模型(LLM)的示例,在大規模文本數據集上訓練的功能強大的AI系統

60%的問題 -  AI搜索如何消耗您的流量60%的問題 - AI搜索如何消耗您的流量Apr 15, 2025 am 11:28 AM

最近的研究表明,根據行業和搜索類型,AI概述可能導致有機交通下降15-64%。這種根本性的變化導致營銷人員重新考慮其在數字可見性方面的整個策略。 新的

麻省理工學院媒體實驗室將人類蓬勃發展成為AI R&D的核心麻省理工學院媒體實驗室將人類蓬勃發展成為AI R&D的核心Apr 15, 2025 am 11:26 AM

埃隆大學(Elon University)想像的數字未來中心的最新報告對近300名全球技術專家進行了調查。由此產生的報告“ 2035年成為人類”,得出的結論是,大多數人擔心AI系統加深的採用

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
4 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
1 個月前By尊渡假赌尊渡假赌尊渡假赌

熱工具

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。