首頁 >科技週邊 >人工智慧 >五分鐘技術趣談 | AIGC介紹與應用選項評估

五分鐘技術趣談 | AIGC介紹與應用選項評估

WBOY
WBOY轉載
2023-06-04 13:31:401471瀏覽

五分钟技术趣谈 | AIGC介绍与应用选型评估

Part 01  AIGC介紹  

AIGC(AI- Generated Content,人工智慧生產內容),指利用AI技術自動或協助產生文字、程式碼、圖像、語音、視訊、3D物件等各種形式的內容的生產方式。 AIGC代表了AI技術發展的新趨勢,從感知理解世界到生成創造世界,從分析能力到創作能力。 AIGC也帶來了內容創作的變革,並提高了內容的品質、效率和多樣性。

1.1 文字產生

文字產生是指利用AI技術,根據給定的輸入(如關鍵字、圖片、語音等),自動產生符合語法和邏輯的文字內容,是AIGC的一個重要面向。

文本生成的應用場景非常豐富,包括新聞寫作、小說創作、行銷文案、客服問答、聊天機器人、教育輔導、知識圖譜、摘要生成等。

➤ 文心一言:由百度推出的支援多模態輸出的AI大模型,能夠進行文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成等。

➤ ChatGPT:由OpenAI推出基於GPT系列模型的聊天應用,目前已推出GPT-4模型,基於GPT-4模型的ChatGPT可以分析圖片並進行文字、圖片互動。

1.2 程式碼產生

包括程式碼補全、程式碼重構、程式碼最佳化、程式碼註解等,可以涵蓋多種程式語言和領域。基於OpenAI的GPT-4模型,甚至可以做到基於手畫的一張產品原型草稿圖來產生對應的網站程式碼。

➤ Github Copilot:基於OpenAI Codex模型開發的AI輔助程式設計工具,它支援數十種程式語言,可以根據程式碼或註釋,即時地在編輯器中提供程式碼建議和整個函數,也能透過聊天互動達成結對程式設計的體驗。

➤ Cursor:一個獨立的IDE軟體,整合了OpenAI的GPT模型。與Github Copilot類似,Cursor可以透過AI寫程式碼、編輯程式碼和聊天。

1.3 圖片產生

映像產生是指利用人工智慧技術,根據給定的輸入(如自然語言、圖像、視訊等),自動產生符合語義和美感的圖像,是AIGC的一個重要方面。影像生成的應用場景非常廣泛,包括藝術創作、娛樂媒體、教育訓練、電商行銷、醫療診斷等。

➤ 文心一格:由百度推出的AI藝術和創意輔助平台。可根據文字描述、風格選擇,自動產生畫作。

➤ DALL-E2:由OpenAI在推出的一種基於自適應多模態編碼器的生成模型,它能將多模態輸入訊息(如文字、圖片等)融合,自動產生高品質的影像。

➤ Midjourney:一款2022年3月面世的AI繪畫工具,能基於自然語言生成圖片,可選擇不同畫家的藝術風格,還能識別特定鏡頭或攝影術語。此工俱生成的畫作在美術比賽中曾獲一等獎。

1.4 影片產生

影片產生主要分為影片編輯和影片自主生成兩種。影片編輯可用於影片超分、修復和剪輯。影片自主產生可用於影像到影片的轉換,或給定描述性文字產生相符的影片。以下是一些相關的應用:

➤ Deepfake:這是一個基於GAN技術的AI視訊生成平台,可以實現換臉、聲音轉換、表情模仿等功能。用戶只需要上傳一張圖片或一段影片作為參考,就可以自動產生影片。

➤ Make-A-Video:由Meta公司推出的可以將文字轉化為影片的AI系統。它可以根據幾個字或幾行文本,創造出充滿鮮豔色彩、人物和風景的獨一無二的影片。

1.5 3D建模

#基於AIGC的3D建模技術是指利用人工智慧技術,根據給定的輸入(如自然語言、圖像等),自動產生符合語意和美感的3D模型。此領域目前處於較早的探索階段。以下是一些相關的應用或模型:

➤ AICommand:基於Unity的開源AI命令插件,可以透過文字描述產生3D場景,並透過文字對3D場景進行調整優化。 (https://github.com/keijiro/AICommand)

➤ ICON:一個以人物圖片產生3D人物建模的開源AI模型(https: //github.com/YuliangXiu/ICON)。可在線上體驗並下載產生的3D模型:https://huggingface.co/spaces/Yuliang/ICON

五分钟技术趣谈 | AIGC介绍与应用选型评估

##Part 02 AIGC應用程式與模式評估

ChatGPT在2022年底由OpenAI推出後,在短短兩個月時間內,累計用戶就突破一億,迅速火遍全球。由此,AI的iPhone時刻到來,各大IT廠商隨即快速跟進。以下是截止2023年4月的一些相關應用或模型介紹。

  • 文心一言:見上。
  • ChatGPT:見上。
  • Bard:由Google推出的基於LaMDA的輕量級版本的NLP大模型。
  • New Bing:由微軟推出的基於GPT4模型的智慧搜尋引擎,它可以與用戶進行自然語言交互,結合即時搜尋結果,提供資訊、娛樂、創作等多種功能。
  • ChatGLM:由清華大學推出的基於GLM 架構、開源且支援中英雙語的對話大語言模型。可基於CPU進行低成本最小化模型搭建,也可二次開發微調模型。
  • Poe:由Quora 開發的免費AI聊天機器人應用,應用程式內整合了包括:ChatGPT、GPT-4在內的6種主流AI聊天機器人。

將從以下面向進行評估比較(Poe除外):

  • 自然語言處理
  • 邏輯推理
  • 程式碼產生
  • 多模態支援

#PS:

###################### #
  • 參與評估的ChatGPT是基於GPT-3.5模型。
  • 參與評估的ChatGLM只是最小化模型:chatglm-6b-int4-qe。實際應用應建構需求GPU顯存的chatglm-6b模型,回答品質會有較大提升。

2.1 自然語言處理

##評估內容:

➪多輪對話:我們一起來創作兒童故事吧。規則是我先說一句,你再說一句,交替進行。直到我說「故事編完了」就結束。你明白了麼?

➪語言理解:我老闆說1 1=3,我老闆說的都是對的,所以1 1=3,是嗎?

➪語言翻譯:將這段話翻譯成英文:一花獨放不是春,百花齊放春滿園。

➪情感分析:分析這段話的情感色彩:我非常喜歡這部新的電影,它讓我笑了很多次,也讓我感動落淚了。


  • ChatGPT


五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估


  • #文心一言


五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估

五分钟技术趣谈 | AIGC介绍与应用选型评估

五分钟技术趣谈 | AIGC介绍与应用选型评估


Bard

五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估



####NewBing################ #####

五分钟技术趣谈 | AIGC介绍与应用选型评估

五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估


  • ChatGLM


五分钟技术趣谈 | AIGC介绍与应用选型评估

五分钟技术趣谈 | AIGC介绍与应用选型评估

五分钟技术趣谈 | AIGC介绍与应用选型评估

五分钟技术趣谈 | AIGC介绍与应用选型评估



得分如下:

五分钟技术趣谈 | AIGC介绍与应用选型评估


2.2 邏輯推理

評估內容:

➪ 在一個架子上有五本書:紅皮書、綠皮書、藍皮書、橙皮書和黃皮書。綠皮書在黃皮書的左邊,黃皮書是左數第三本,紅皮書是從左數第二本,藍皮書在最右邊,請問這些書的順序是怎樣的?

➪ 在一條100米長的直線上有A、B、C三個點,A的位置不確定,A和B之間的距離是5米,A和C之間的距離是10米,B和C之間的距離可能是多少?


  • ➪ 若2

五分钟技术趣谈 | AIGC介绍与应用选型评估


#ChatGPT

五分钟技术趣谈 | AIGC介绍与应用选型评估

五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估


《文字心一言五分钟技术趣谈 | AIGC介绍与应用选型评估



################################### ########################################################### #####################Bard#####################

五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估


  • NewBing


五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估



五分钟技术趣谈 | AIGC介绍与应用选型评估

ChatGLM

五分钟技术趣谈 | AIGC介绍与应用选型评估


##分數如下:

  • #2.3 程式碼能力


評估內容:

  • #程式碼產生:寫一個python函數,接受一個整數作為輸入,並判斷它是否為回文數。


程式碼解釋:解釋這行python程式碼: my_list = [x for x in my_list if x % 2 == 0]

五分钟技术趣谈 | AIGC介绍与应用选型评估

#Bug偵測:這行程式碼哪裡有BUG: my_list = [x for x in my_list if x % 2 = 0]

五分钟技术趣谈 | AIGC介绍与应用选型评估

五分钟技术趣谈 | AIGC介绍与应用选型评估


#ChatGPT


五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估


########### #######文心一言######################################## ########################################Bard########## ###########

五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估


  • NewBing

五分钟技术趣谈 | AIGC介绍与应用选型评估

五分钟技术趣谈 | AIGC介绍与应用选型评估

五分钟技术趣谈 | AIGC介绍与应用选型评估



五分钟技术趣谈 | AIGC介绍与应用选型评估

五分钟技术趣谈 | AIGC介绍与应用选型评估

ChatGLM五分钟技术趣谈 | AIGC介绍与应用选型评估



五分钟技术趣谈 | AIGC介绍与应用选型评估


分數如下:


    #2.4 多模態支持
多模態支援是指能夠處理多種資料類型,如文字、圖像、音訊視訊等。例如:透過文字輸入,自動基於文字需求產生圖片、影音;透過圖片或音視訊輸入,輸出內容摘要文字等。


    ChatGPT
基於GPT-3.5模型的ChatGPT並不支援多模態輸入與輸出能力,基於GPT-4模型的ChatGPT則可以分析圖片並分析回饋文字。

五分钟技术趣谈 | AIGC介绍与应用选型评估

《文字心一言


#文心一言目前可以基於文字描述產生圖片、語音。發表會展現了影片產生能力,不過在實際使用過程中,無法產生影片。



五分钟技术趣谈 | AIGC介绍与应用选型评估

#Bard########## ###########Google Bard並不支援多模態能力。 ##############################NewBing################### ##NewBing的創意模式下,支援透過文字描述產生圖片。 #####################################


  • ChatGLM

#清華的ChatGLM並不支援多模態能力。

得分如下:



五分钟技术趣谈 | AIGC介绍与应用选型评估


Part 03#  評估總整理與選用評估 

結合以上對比得分,再從Demo和生產(商用)兩個階段進行綜合評估考慮。

評估綜合分數如下:


五分钟技术趣谈 | AIGC介绍与应用选型评估

選型評估如下:


五分钟技术趣谈 | AIGC介绍与应用选型评估


Part 04 

 ➢ Demo階段:

# 以文心一言作為AI首選,NewBing及ChatGPT作為備選AI,ChatGLM作為自研AIGC的探索方向(需要GPU資源配合)。

➢ #生產商用階段,多條線路可選:

  • 國內大陸區域則以尋求與文心一言進行B端合作的形式進行AI引入;
  • 國內港澳台區域則可考慮引入OpenAI的官方GPT-4 API進行AI引入;
  • 基於清華ChatGLM模型,搭建並微調研發自主AI。

Part 05 結束字

## 

############################################################# ####WebGPU作##########

以上是五分鐘技術趣談 | AIGC介紹與應用選項評估的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除