首頁 >科技週邊 >人工智慧 >AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

王林
王林轉載
2023-08-07 12:21:051400瀏覽

AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

近日,2023年高考落下帷幕,「用AI寫高考作文」的話題也備受熱議。 2023年,受ChatGPT熱潮的影響,國內的AI大模型產品也如雨後春筍。例如,百度、阿里、360等網路巨頭企業均相繼推出文心一言、通義千問、360智腦等AI大模型產品。

同時,一些深耕教育AI賽道的玩家也不甘人後,借助AI大模型,將其原本的優勢得以釋放。作為智慧語音和人工智慧賽道的上市企業,科大訊飛推出的大模型產品訊飛星火,也在這波AI熱潮中備受關注。

那麼,與高考與教育賽道高度相關的訊飛星火,實際寫作水準與使用體驗如何?筆者對其進行了高考作文相關的系列提問。透過親測體驗,發現這確實是一款十分聰明的AI大模型產品。雖然也有一些美中不足的地方,但也可謂瑕不掩瑜。

瑕不掩瑜,真實等級或不敵優等生

#首先,筆者以全國甲卷為例,與科大訊飛星火認知大模型進行了對話。這卷作文題目是:人們因科技發展而得以更好地掌控時間,但也有人因此成了時間的僕人。這句話引發了你怎樣的聯想與思考?請寫一篇文章。

AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

筆者將該高考作文的要求,全文輸入訊飛星火。訊飛星火的「高考作文」如下:全文共855字,回答時間在30秒以內。

AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

圖源:訊飛星火認知大模型

透過輸出的內容可以看出,科大訊飛星火對於提問的語意理解基本上正確,行文的邏輯也十分順暢,例如,在如何正確的利用時間方面,訊飛星火採用了「因為... ....所以」等表達方式,可謂有理有據,同時行文的措辭表達也非常的口語化,並沒有多麼華麗的辭藻與晦澀難懂的句子。

不過,作為體現考生寫作程度最重要的考試,高考作文還會考查考生作文的立意新穎程度、文字功底等。而如果從這些角度去評價訊飛星火的“高考作文”,也不難看出其存在的明顯不足。

首先,在立意方面。訊飛星火用「時間」是把殺豬刀為題,雖然通俗易懂,但是未免過於普通,甚至讓人覺得有些敷衍套作的意味。

其次,文章中有多個論點,例如「時間很重要」、「我們應該學會利用時間」、「應該勞逸結合等」。只是,這些觀點的論據,都帶有一定的說教意味,既沒有引經據典,也沒有太多實例輔助讀者理解,因此論據也顯得不夠具體和有說服力、更缺少文采。

雖然文末舉了兩個例子,但是沒有插入到文章對應的觀點之中進行佐證,也顯得不夠完整。為了驗證訊飛星火的智慧性,筆者繼續對其進行提問,試圖讓其再寫一篇立意更新穎、更有深度的文章。全文如下,共827字,回答時間同樣在30秒以內。

AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

透過全文內容可以看出,這次的「高考作文」在內容方面,更接近筆者的需求。例如,行文中用到了莎士比亞、愛因斯坦、愛迪生、賈伯斯等名人名言。

只不過,除了前兩位名人關於時間的名言能夠對其觀點進行佐證外,文章中引用的愛迪生與賈伯斯的名言卻與觀點關係並不大,因此依然顯得說服力不足。由此可見,雖然訊飛星火理解了作文題目要求的語義,但是在引經據典的作文要求方面,還是有「套作」的嫌疑。

據筆者親測多款大模型產品,發現這類產品「套作」的現象十分普遍。因此有網友分析表示,或許AI大模型產品不理解「套作」的意思。依照一些網友的理解,套作指的是不能生搬硬套、套公式套模板。因此,也有網友評價訊飛星火自動生成的文章過於普通,更像是普通國中生的作文。

除此之外,筆者發現,大多數大模型產品的“高考作文”,體裁都是議論文。因此,也試著讓訊飛星火換一種體裁與風格,試試訊飛星火寫作更生活化的話題作文的程度。於是,又以2023年新課標I卷關於「故事」的話題作文,來測試訊飛星火。

AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

將作文題目全文輸入訊飛星火,輸出的文章字數是763字,文章的中心思想是:故事有力量,而好故事的意義與價值是多方面的。全文也非常有層次的進行了逐一論點的陳述、佐證。而佐證的內容,主要是引經據典,透過古代、近現代的文學作品進行舉例說明,從而得出結論。

AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

不過,全文體裁看起來,依然是一篇議論文。筆者認為,現代元素還是少了一些,依然具有強烈的說教味道。如果能結合好故事帶給身邊親友的改變來舉例說明,或許遠比只是提到那些文學作品,更有說服力。

體驗過關,但美中有不足

好在訊飛星火在功能體驗上,比市面其他大模型產品,更體貼入微。例如,除了查看歷史提問、新對話等,而且相關選單也放在了十分顯眼的位置,避免用戶無法快速找到歷史對話記錄,還可以一鍵選擇「重新回答」。

AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

於是,筆者試著換一種提問方式,並試著連續發問。不過親測發現,科大訊飛星火似乎不太支持連續發問。

對於筆者針對上一篇作文的疑問,訊飛星火也採用了「忽略」的處理方式。沒有正面回答筆者關於對上一篇「高考作文」不滿意的回答,而是直接重新寫了一篇文章。

值得驚喜的是,這次產出的「好故事」的作文,終於不再是議論文了。而是很俱生活化,列舉了許多實際生活案例的文章,因此讀起來也更像真實考生的創作。

AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

由此可見,AI大模型產品輸出的內容為何,關鍵還在於使用者如何提問。在訊飛星火能夠全面理解用戶提問的語意基礎上,只要提問的內容夠具體、要求合理,訊飛星火是能夠輸出用戶真正想要的內容的。

不過,美中不足的是,訊飛星火在理解用戶的提問意圖時,還是存在一些明顯的偏差。例如前文的多次測驗中,明確要求作文需要自擬題目,字數不少於800字。但訊飛星火實際輸出的作文,既沒有標題,字數有時也不及800字。透過親測對比其他大模型產品,這種問題也相對普遍。

由此也可以預見,未來大模型產品如何更精準的進行語意理解,將會是非常重要的競爭力之一。

人類未來需要什麼樣的AI大模型產品?

測完訊飛星火大模型產品的智慧程度、使用者體驗,我們不妨從使用者角度來看,人類到底需要什麼樣的大模型產品。首先,我們來看看訊飛星火是怎麼回答這個問題的,也非常有趣。

AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

透過訊飛星火的回答,不難看出,這些因素確實是用戶未來十分關注的最佳化方向。只是,在這些特質之前,如何建立機器人與人類之間的良好溝通,才是第一步。

這正如不同國家的人,使用不同的語言,如果沒有翻譯機,彼此又不懂他國語言,那麼就是雞同鴨講,自然得不到正確的反饋。因此筆者認為,所有的大模型產品,未來首要需要解決的,便是如何正確地理解人類的基礎語言,包括隨著時代變化而產生的新詞彙、網絡語言、口語、方言等。

難能可貴的是,科大訊飛一直深耕智慧語音和人工智慧賽道,其翻譯機產品在全球暢銷,便是其對不同語言轉換技術的有力印證。因此,對比之下,訊飛星火相比其他大模型,理論上具有更強的技術研發能力,能讓訊飛星火目前存在的一些瑕疵進行最佳化迭代。

而在各個網路科技大廠都紛紛推出大模型產品之時, 今年高考的“作文大賽”,既是一個練兵場,也是一塊試金石。在各大廠集體奔赴考場時,誰負誰勝已經不再重要,重要的是藉助這次契機,大廠的AI大模型存在什麼利弊,或許各大玩家心知肚明。

非常有趣的是,當筆者試圖提問訊飛科技,AI大模型產品哪家強之時,其回答非常的“圓滑”,也非常的低調,並沒有宣稱自己就是行業第一,甚至在回答內容裡,提到的都是別家的產品,都沒有提到「訊飛星火」。如果用調侃的語氣來看這樣的回答,科大訊飛這種「低調務實」的精神,還是值得肯定的。

AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?

人類的進步,永遠都是思想的突破。人工智慧的應用,目前還只是萬裡長徵的第一步。雖然離人們想要的完美尚有距離,但一定會朝著人類想要達到的效果邁進。

結語

作為教育AI賽道的玩家之一,科大訊飛顯然是更懂教育、更懂學生的。因此,相較於一些大模型產品面向的產業大而全,訊飛星火在AI大模型集體寫作文這個熱門事件上,幾乎是獨一無二的存在,因此訊飛星火在受到更多關注的同時,也將背負著更多人的希望。

我們相信,在AI大模型的應用越來越成熟的同時,其逐漸向行業垂直,走向專業化、生態化也將成為必然,而科大訊飛不僅能將訊飛星火用在其學習機等AI硬體產品上,更將因為其開放性,而為教育產業添磚加瓦、增添色彩。

以上是AI大模型產品集體奔赴高考場,教育賽道的訊飛星火能贏嗎?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:sohu.com。如有侵權,請聯絡admin@php.cn刪除