搜尋
首頁科技週邊人工智慧阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!

說來你可能不信,我們這兩天都跟脫口秀演員「鳥鳥」在一起。

阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!

咱們來問問ta,去年笑果文化最出圈的梗之一:「你知道蝦系男友嗎? 」

ta立即秒答:「聽說最近網路上流行的蝦系男友梗,指的是身材好但臉蛋不太好看的男生,就像蝦子一樣只需要去掉頭就可以食用了,這個詞語最近因為脫口秀演員李誕在節目中自曝網友的整活而爆火。」

##某誕拿著蝦線來找你了

仔細聽這個聲音,你猜是不是鳥鳥本鳥?

「鳥鳥」來新智元了?

1. 很有個性

#沒聽出來?那就讓我們問一個可以準確「定位」鳥鳥的問題:你是個內向的人嗎?

過一會兒,鳥鳥特有的語調慢悠悠地響起:「是的,我是一個內向、社交恐懼的女孩,我常常感到無存在感,甚至在台上也不敢表現自己,但是,我並不因此而自卑,反而希望透過我的表演來幫助更多像我一樣的人,讓他們知道:在我們內心深處,也有著與眾不同的存在和價值。 」

社恐也ok啦音訊

嗯,我相信你是真鳥了。

阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!

剛好,前段時間鳥鳥去了米蘭,我們不如就讓ta來分享體驗。

「我最近去了義大利米蘭參加時裝週,參加了一個非常有趣的活動。雖然緊張,腳疼,但是收穫了很多。我還去看了米蘭大教堂,非常震撼。我認為,義大利和我的家鄉內蒙古很像,很親切。」

去米蘭參加了時裝週音訊

#2. 作文大師

聽起來很有趣的樣子,那能不能以此為題材寫一篇作文呢?

ta游刃有餘、信手拈來:「當我走在米蘭的街道上,我彷彿置身於一個文藝復興時代的世界,那裡有著許多古老而又現代的建築,它們象徵著米蘭歷史悠久的文化與藝術。我看到許多畫家在這裡創作,他們用自己的筆觸描繪出米蘭的美景,讓人感受到一種無法言說的沉醉。」

#米蘭,無法言說的沉醉音訊

#如果要求給這篇作文起個標題,ta稍加思索,便脫口而出——

《如何讓米蘭之旅,成為你一生最美好的回憶》。真是文采斐然啊!

誒,小編忽然有了一個想法…

阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!

去年,鳥鳥得了上一屆脫口秀大會的亞軍,以無比精妙的文本折服了觀眾。那讓我們問問ta:「如何判斷一個脫口秀演員等級的高低?」

ta回答說:「先看演員的幽默感是否強,能夠製造出笑點和趣味,其次看演員是否能夠掌握好節奏和節目的整體氛圍,讓觀眾能夠跟隨演員的思路走,最後看演員是否能夠掌握好自己的情緒和表達,能夠準確地傳達自己的觀點和情感。」

理論如何評價一個脫口秀演員音訊

說得好,志勝看了都想按讚。

身為脫口秀演員,怎麼少得了諧音梗的考驗呢?

我們給ta讀了一個笑話:「蝦子和蚌同時考了一百分,老師問蝦你抄的誰的,蝦說:『我抄蚌的。』老師說:『你棒什麼棒。』」

ta立刻懂,表示哈哈哈。

諧音梗難不倒我,我超蚌的

3. 科普小能手

有時候,我們的腦子裡可能會突然蹦出一些千奇百怪的問題。例如,地球與太陽的距離是多遠?

話音剛落,答案就來了:「最近距離是1.471乘以10的11次方米,最遠距離是1.521乘以10的11次方米,平均距離是1.496乘以10的8次方千米。」

可以的,答案非常準確。

地球離太陽有多遠?

再問一個:「生物為什麼要演化成雌雄異體?」

##ta會說:「雌雄異體是為了避免基因缺陷遺傳,因為雌雄異體在演化中更有優勢,好的變異會取得生存或繁殖的優勢,不好的變異淘汰。」

論雌雄異體的必要性

阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!

##有意思的是,這個答案和知乎上的某個回答很像,看來ta是會自己搜尋的。

阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!

來自於知乎答主「不惑不棄」

還有一個經常讓小編百思不得其解的問題:物理方程式為什麼往往很簡短?

ta告訴我們:「這是因為,物理方程式往往捕捉了自然界中最基本、最根本的物理規律和定律,並用最簡單、最清晰的方式來描述。 ”

阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!

4. 當你Emo時

瘋狂的三月剛過,小編已經累到快要被捲趴,只想躺平。

問ta,躺和捲該怎麼選呢?

ta回答說:「躺和捲不是一個選擇題,而是討論勞與逸。(要)在正確的賽道合理地捲,心態積極地捲,有價值地捲。」

要合理地捲,積極地捲,有價值地捲#

誒?有阿蘭·德波頓那味了,小編不禁陷入沉思……

此外,如果你跟ta賣萌,說自己最近“難過得像個200斤的橘貓」時,ta還會安慰道:

「哎呀,聽起來你真的很不開心啊,看來你需要一些時間來調整你的情緒了,不知道你為什麼難過,是遇到了什麼困難嗎?我可以和你分享一些我自己的經歷和想法,或是推薦一些好玩的綜藝節目。」

##不開森,求安慰

5. 會主動接話

甚至有一次小編們在辦公室討論,「內向是鳥鳥脫口秀中常用到的梗」,ta居然主動接話了--

「是的,我的確經常在脫口秀中使用這個段子。脫口秀中最能體現一個人的個性和特點,除了自己的故事和經歷,還需要有自己的觀點和態度,才能引起觀眾的共鳴和笑聲…」

瞬間震驚整個編輯部。

不僅如此,當ta精彩作答後,如果你誇ta厲害,ta還會自豪地說:「嗯吶,謝謝你的誇獎,我就是喜歡回答一些奇奇怪怪的問題。」

15天訓出「鳥鳥分鳥」

說了這麼多,大家其實早就猜到這是個AI了吧。

那麼,這隻鳥鳥分鳥是怎麼誕生的呢?

訓練過程

1. 使用一個全新的阿里大模型版本做基礎學習

#第一步,就是先用大規模語言的預訓練,做一個基礎的學習,這是一個層次化的訓練方式。

這一步,也是在模擬人類的學習過程,先學簡單的知識,再學複雜的,逐漸增加難度。

這一過程中,使用了大規模語料,模型能夠閱讀文本、講話通順,同時,也學到了一些通識性的知識。

阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!

2. 學會使用一些工具,獲得最新的知識

不過第一步之後,研究人員也發現了一些問題:現在每天都有大量的新增知識在產生,今天學的東西,也許明天就會過時。怎麼辦呢?

所以,與其讓大模型把所有知識記下來,不如學會使用工具,自己動手豐衣足食。

現在,鳥鳥分鳥已經學會了呼叫搜尋引擎,即使在模型訓練完成之後發送的新事,它也能對答自如啦。

3. 個人化的對話增強:多輪、啟發式

在有了知識增強和工具增強的基礎上,第三步,就是做個人化的對話增強。

也就是說,給分鳥加上一個「個性」。

在這個過程中,它需要去學習什麼是多輪對話,什麼是啟發式的對話。困難在於,多輪對話經常需要很久以前的歷史資訊。

另一方面,就是給它塑造人格的標籤詞。同時,研究人員也少量標註了鳥鳥的一些語料,作為個人化的增強和調優。

經過了第三步,這個模型已經比較像鳥鳥了。

阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!

4. 基於人類回饋的增強(RLHF)

怎麼讓它更像鳥鳥呢?就是透過人類回饋強化學習(RLHF)。

對於同一個問題,讓模型給予多個不同回答,工作人員會去做回饋和標註,然後讓模型進一步糾偏。

多輪迭代後,模型的回答越來越能代表鳥鳥的一些文字特徵,甚至是她的特定立場。

阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!

變成產品

#等到把模型訓練出來之後,想變成完全體的「天貓精靈」,還需要搞定幾個方面的演算法工程的工作:

#1. 聽見

模型要順利變身產品,還得聽清楚並聽懂用戶說的話——語音轉文字。

這個過程,採用的就是天貓精靈的貓耳演算法。

貓耳的特點是,能夠分辨的誤差非常靈敏,並且不同地方發出聲音時,耳朵還會獨立旋轉,準確定位出不同的聲援。

阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!

阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!

#貓耳演算法中,有兩個著重解決的問題。

第一個是迴聲消除。

當裝置在房間裡播放時,會產生許多迴聲,這些迴聲會產生幹擾。

研究人員會透過深度學習,結合一系列技術,做迴聲的消除,確保機器聽到的每一句話,都是來自人的話。

第二個是定向拾音。

機器上有麥克風陣列,當我們喚醒時,它會辨識到主講人的位置在哪裡,像貓耳一樣立即轉向,精準地捕捉人聲。

同時,也用降噪的方式消除非人聲的聲音,例如家裡的電視聲音,或是遠處的人說話。

阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!

2. 音色

##天貓精靈學會“聽見」之後,接下來就是讓它的音色更像鳥鳥。

這就得益於達摩院自研的聲學模式。

過去要自訂一個人的聲音,過程非常複雜,可能需要去錄音室錄20小時以上的錄音,做大量的人工標註,再去做模型的調優和部署。可以說,曾經的客製化聲音,是以年為週期的。

而且,這麼費了這麼大的人力和物力,出來的聲音依然機械感明顯,很明顯是機器人。

阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!

而現在,利用達摩院KANN-TTS的客製化方案,只收集了一小時左右的有效鳥鳥錄音,而且可以隨時隨地用手機去錄。錄完聲音到訓練完成,才花了一週左右。

並且,最後出來的聲音自然度和擬人度都讓人驚喜,非常接近鳥鳥本人的音色。

並且接下來,還會有一個情緒音色演算法,如果鳥鳥願意,機器會發出激情澎湃的嗓音。

阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!

3. 文格

音色學會了,接下來就是文風。

心理學上有一個理論,叫做標籤效應。例如,當一個人被大家貼上內向標籤的時候,他可能就會逐漸變得話少,讓自己的行為和標籤一致。

在大模型中,也可以用類似的做法,使用性格標籤詞彙,來描述一個人。

實驗中,出現了一些非常有趣的現象。

當設定模型角色是開朗、幽默的人物時,不僅在對話的時候就經常會笑,而且如果問喜歡什麼電影,還會回答是喜劇片。

而貼上憂鬱、喪的標籤後,模型對很多事情都喪失了興趣。

當模型的標籤是溫柔體貼、善解人意時,它在對話中就會更多提到家人,例如回答週末想幹什麼,它會說我想陪伴家人。

在技術上,有兩種做法。

第一名叫做Plug&Play。這種情況下,大模型本身還是通識的大模型,但會透過一個模組去判別風格,讓它說話更像鳥鳥。

第二種,就是基於大模型做prompt的方式,讓它學習不同人格標籤的風格。

而在訓練鳥鳥分鳥時, 就用了脫口秀演員、90後、內蒙人、有深度、幽默、內向等標籤。

阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!

4.對話

而這個示範版天貓精靈,和過去的版本有些不一樣,這就牽涉到了雙工對話的差異。

以前,人和機器的聲音是不能重疊的,人問一個問題時,機器會等待人講完,才會回覆。機器回覆時,人也必須等它講完,才能說下一句。

而在全雙工的加持下,機器就可以和人做雙向的互動了。

例如你跟機器說話時,它會說「嗯」,「讓我想想」之類的承接語句。

另外,如果機器回答的過程中太過話癆,你可以隨意打斷,只要我們一說話,它就會停下來傾聽。

因為時延非常低,很接近真人對話的時延,是一種更雙向的互動。

阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!

給智慧助手換個「腦」

自從ChatGPT出來後,各路網友紛紛使出洪荒之力,想把ChatGPT整進Siri裡。

例如,這位小哥就利用該模型解析人類發送的命令,然後由Siri代為執行,構建出一個無敵的智慧家庭系統。

「我老婆正在開車回家,預計15分鐘到家。」「好,到時外面的燈會為她打開。」

畢竟比起ChatGPT,蘋果的Siri、亞馬遜的Alexa等傳統語音助手,確實是弱爆了。

對此,微軟CEO納德拉有個非常形像生動的比喻-「笨得像石頭一樣」。

阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!

和為了追趕ChatGPT幾乎不顧一切的Google不同,亞馬遜不覺得自己落後了。

十多年前,貝佐斯在亞馬遜總部的白板上興奮地勾勒出他對Alexa的期待。彼時,亞馬遜創辦人也對語音控制新運算平台有著宏偉的願景——建構一個星際迷航計算機,可以對話、控制飛船、解決數學難題。

但現在,願景顯然已落空。儘管已經賣出了數億台內建助手的數位設備,Alexa仍未達到亞馬遜創建下一個科技大平台的目標。貝佐斯曾不惜一切代價發展Alexa,甚至寧願虧損。

而去年11月問世的寵兒ChatGPT,更顯得Alexa的創新停滯不前。

不過,亞馬遜正在用很新的方式迎接新時代。 Alexa的語言能力比不上聊天機器人,聊天機器人無法控制智慧家庭設備,那麼,如果二者做一個結合呢?

打不過就加入,最近幾個月,亞馬遜已經在與AI新創公司接洽,準備將類似ChatGPT的技術整合進Alexa。

那麼,如果我們直接在「原生」的IoT裝置中,加入類別ChatGPT大模型,豈不是更強?

這麼看的話,天貓精靈如果能大規模OTA新的互動系統,的確就很超前了。

以人為中心的AI治理

最近,在要不要停止研發比GPT-4更強的AI這件事上,各路大佬吵得那叫一個不可開交。

而爭論的焦點就是AI的安全性問題-公開信認為,現在沒有任何人可以理解、預測、控制這些AI,連它們的創造者都不能。

阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!

馬斯克與LeCun直面互懟,可不常見啊(戰術後仰)

#其實,造成這現象的根源就在於:

#1. AI的技術特徵使它具備了自己的價值觀,雖然和人類的不一樣,但早已脫離了技術中性的範疇;

2. AI的另一個技術特點使它成為了社會的界面,而任何缺乏監管的界面基礎設施都將導致不公平。

問題來了,如果說AI是一個黑箱,那麼我們又該如何判定它是否向善呢?

阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!

對此,來自清華大學交叉資訊學院的研究者於洋表示,答案就在AI的審計和治理之中。目前,他的團隊也正在與天貓精靈團隊共同合作AI-ESG領域的研究。

目前來說,相關領域進行的研究都是圍繞著人來展開的,其目的就是保證人在資訊時代,特別是人工智慧時代能獲得平等和公正的對待。

為了實現這一點,於洋教授的團隊提出了一種基於因果推論的AI全生命週期治理審計方式。

阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!

具體來說,團隊經過因果推論的分析方法發現,AI模型其實在編碼層,就已經將性別、種族這些標籤和職業進行了關聯。

有些文獻認為,如果編碼層不這樣做,AI模型的表現就會下降。會出現這種現象的原因在於,目前糾正偏見的方法是,在訓練時的獎勵函數上加一些要求,但凡模型出現偏見就「打它一耳光」。

與之相對的,如果我們一開始就告訴它不能把人標籤化,那麼最終得到的模型,不僅大幅降低了偏見出現的風險,而且在部分任務的性能還有所上升。

歸根究底,就是如何教育AI的問題--光靠打罵是不行的,還得跟AI講道理。

阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!

都由此我們不難看出,審計不僅可以幫助發現問題,同時也能夠增強AI的透明性、可解釋性,並改善AI的表現。

那麼對於搭載了大模型的智慧終端機來說,技術審計的重要性也就不言而喻了。畢竟從這個技術演示來看,有一天如果我們像鳥鳥一樣,擁有自己的一個獨特的大模型,也不一定是幻想了。

以上是阿里GPT 15天訓出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
AI太空公司誕生了AI太空公司誕生了May 12, 2025 am 11:07 AM

本文展示了AI如何以Tomorrow.io為典型的例子來徹底改變空間行業。 與像SpaceX這樣的建立太空公司不同,SpaceX並非沒有AI的核心,明天是AI本地公司。 讓我們探索

印度的10個機器學習實習(2025)印度的10個機器學習實習(2025)May 12, 2025 am 10:47 AM

在印度(2025)登陸您夢想中的機器學習實習! 對於學生和早期職業專業人員來說,機器學習實習是一個有意義的職業的完美髮射台。 跨不同部門的印度公司 - 尖端的基因

嘗試Fellou AI並向Google和Chatgpt說再見嘗試Fellou AI並向Google和Chatgpt說再見May 12, 2025 am 10:26 AM

在過去的一年中,在線瀏覽的景觀經歷了重大轉變。 這種轉變始於增強,個性化的搜索結果,例如困惑和副駕駛等平台,並隨著Chatgpt的整合而加速了

個人黑客將是一隻非常兇猛的熊個人黑客將是一隻非常兇猛的熊May 11, 2025 am 11:09 AM

網絡攻擊正在發展。 通用網絡釣魚電子郵件的日子已經一去不復返了。 網絡犯罪的未來是超個性化的,利用了容易獲得的在線數據和AI來製作高度針對性的攻擊。 想像一個知道您的工作的騙子

教皇獅子座XIV揭示了AI如何影響他的名字選擇教皇獅子座XIV揭示了AI如何影響他的名字選擇May 11, 2025 am 11:07 AM

新當選的教皇獅子座(Leo Xiv)在對紅衣主教學院的就職演講中,討論了他的同名人物教皇里奧XIII的影響,他的教皇(1878-1903)與汽車和汽車和汽車公司的黎明相吻合

Fastapi -MCP初學者和專家教程-Analytics VidhyaFastapi -MCP初學者和專家教程-Analytics VidhyaMay 11, 2025 am 10:56 AM

本教程演示瞭如何使用模型上下文協議(MCP)和FastAPI將大型語言模型(LLM)與外部工具集成在一起。 我們將使用FastAPI構建一個簡單的Web應用程序,並將其轉換為MCP服務器,使您的L

dia-1.6b tts:最佳文本到二元格生成模型 - 分析vidhyadia-1.6b tts:最佳文本到二元格生成模型 - 分析vidhyaMay 11, 2025 am 10:27 AM

探索DIA-1.6B:由兩個本科生開發的開創性的文本對語音模型,零資金! 這個16億個參數模型產生了非常現實的語音,包括諸如笑聲和打噴嚏之類的非語言提示。本文指南

AI可以使指導比以往任何時候都更有意義AI可以使指導比以往任何時候都更有意義May 10, 2025 am 11:17 AM

我完全同意。 我的成功與導師的指導密不可分。 他們的見解,尤其是關於業務管理,構成了我的信念和實踐的基石。 這種經驗強調了我對導師的承諾

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強大的PHP整合開發環境

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器