搜尋
首頁科技週邊人工智慧讓機器擬人化,從'人工智障”到'人工智慧”

讓機器擬人化,從'人工智障”到'人工智慧”

Jun 03, 2023 am 11:34 AM
人工智慧人工智障機器擬人化

5月27日,創業黑馬在北京舉辦 「2023躍遷•黑馬AIGC高峰會」。此次大會的主題為「預見新世界,建構新格局」。有「AI專家」之稱的卡內基美隆大學計算機學院前副院長、達沃斯世界經濟論壇(WEF)計算機全球未來理事會前主席賈斯汀•卡塞爾,以及360集團、智源研究院、崑崙萬維、雲知聲、藍色遊標、萬興科技、知道創宇等眾多行業內企業高層到場,與上千位與會者進行了深入交流。

在高峰會現場,雲知聲創辦人、CEO 黃偉分享了 《通往智享未來之路》主題。

以下為分享內容整理:

開始我們希望按照專家的方式去做,希望交給機器一些方法論,十年前,機器開始從錯誤回饋學習。這都是在過去人工智慧技術裡的大概階段和路徑。

今天OpenAI推出了ChatGPT和預訓練模型,整個智能變得更加擬人化,首先我們用非常強大的算力閱讀了全世界已知的所有文本,訓練形成了大模型。它特別像嬰兒大腦,可能有幾百億、上千億的參數,和人腦不同的是,嬰兒最多只是遺傳了父母的外表和性格等,但大模型的大腦遺傳了知識,這只是初始狀態,接下來會透過微調等各種方式,像小孩在成長過程中會有各種教育,整個大模型的演進更加擬人化。

這是整個人工智慧的變化。

今天的AGI和之前有什麼本質變化? 2022年12月份之前,整個人工智慧還是一種鑑別式人工智慧,做判斷題、專用系統和智慧模組,做一些特定任務。一方面人工智慧的表現並不是那麼智能,常被別人詬病“你們提供的是人工智障”,以至於過去人工智慧的能力天花板較低。

第二,在很多場景裡,客戶的需求是千差萬別的,但人工智慧的能力沒那麼強,很多公司和團隊用各種客製化去滿足。人工智慧企業不像高科技公司,在過去十年裡,只能做鑑別式AI是手工作坊的時代。但現在有了大模型,有更強大的通用能力,人工智慧開始進入工業化時代。

有了新的生成能力、湧現能力,用一個模型就能解決許多場景下的不同問題。今天這個時代,人工智慧大模型就是發電機,在引擎還沒發明之前,中東國家並沒有那麼富裕,石油的價值沒那麼大。就像今天可以把數據變成燃料和能力,用這個能力賦能千行百業。

雲知聲為什麼能夠在短時間推出自研大模型?

2016年看到AlphaGo,我們把醫療產品在醫院裡落地,幫助北京協和醫院的醫生,大大提高工作效率。在醫院這個場景裡,只是效率工具是不夠的,人工智慧真正的智能是認知智能,Transformer是2017年提出來的,認知智能的背後需要比較強大的算力。

有了這些鋪墊,無論從學術或工程化方面,累積了許多經驗。這個經驗對於個人來講是你謀生的能力,但對公司來說是在市場上勝出的核心競爭力。把ChatGPT框架看了之後,發現沒有一項是新的,都是一些已有的工程化組合,我們很快就把這種能力結合,投入大模型研發。

讓機器擬人化,從人工智障”到人工智慧”

我們在三天前,發布了商業大模型,名字叫山海。把預訓練、指令微調、基於人類回饋的增強學習全部跑通,看到了期待已久的湧現能力。那時候團隊就在想是不是要給它取個名字,那段時間我在頻繁出差,覺得名字還挺好的。海是波瀾壯闊,有容乃大,體現出大模型的無限生成能力,山是高山仰止,我們知道什麼能說、什麼不能說,這恰恰是既要強調大模型的生成能力,又要強調大模型的安全合規問題。

有一個很有趣的現象,大家都在談大模型,國內對大模型的關注是在春節後,但大家都不談這個事,心裡都沒底。到今天為止,有一種觀點這件事情只有技術還不能做,哪怕人都到位了,但訓練成本很大,是極其燒錢的。大模型不是科學革命、不是發明了新的演算法,是把已有的演算法組合在一起做大,大都是有代價的,當然還有很多工程在裡面。觀點是對的。

反过来讲,如果认为未来10-20年大模型是很大的机会,BAT投不进去了,就放弃了,我认为还是有机会的。

云知声在过去的几年里,并不需要特别牛的科学家,我甚至认为这个事就不是科学家干的事情,科学家没有玩过那么多算力,也不知道场景在哪里,所以结果一定是不好的。有场景的厂商反而是最有可能成功的。

起山海这个名字,还有一个意思,所爱隔山海,山海皆可平。

山海之力是十项全能。生成能力是非常主观的,真正在场景落地的时候,语言理解能力很重要,为什么以前觉得是人工智障,因为缺乏理解和代码能力。代码能力的提升能够有助提升大模型的推理能力,输出结果一定要符合国内的法律法规甚至道德价值观等。我们还采用GPT-4 插件的架构,帮助企业和客户,从数据的优选、模型训练、模型部署等一条龙服务。

为什么大模型具备复杂的逻辑推理能力?我们今天做到了,但不知道为什么,到底是500亿参数还是1000亿参数更好,却不好说,可能1000亿参数里面神经元还没有被激活。

另外还有医疗,一开始我们在做大模型,很多人以为云知声做的是垂直行业模型,并不是,我们是做行业应用。挑战了一个最严肃的场景——医疗,通过预训练阶段,收集了很多医学的文献、专著、书籍,病案,积累了几千万真实标注的数据,这些数据可以转化成我们的微调数据。

另外在2019年还获得了北京市科技进步一等奖,获奖项目就是大规模知识图谱构建关键技术及应用,我们有国内最大规模之一的医疗知识图谱,我们把知识图谱分解成知识插件嵌入到大语言模型中,使得大模型变成医疗领域的专家。

MedQA是一个非常权威的医疗知识问答测试集,包括谷歌的Med-PaLM,ChatGPT和GPT-4都在这个测试集上公布了它们的评测结果,山海前不久的评测中做到了81分,大大超过了GPT-4的71分。通过领域增强以后,能够把大模型变成某个领域的专家。还有一个数字可以做横向对比,医学院毕业生要通过临床执业医师考试目前已知的AI最高分数是456分,山海大概考了511分,这就是大模型通过领域增强以后获得的超强能力。

想做大模型还是挺难的,门槛非常高,除了需要很多钱之外、优秀的算法工程师和算法之外,还需要很多能力,我们把它总结为山海之功。直观来讲,大模型本身就是大数据集,大模型是工程师的活儿,云知声为什么能够用几个月的时间就能做出一个非常权威的客观的评测数据,我们内部去评,不只在医疗,在通用领域方面,云知声都是最好之一。

算力平台不是买多少卡来插就行了,云知声差不多有200P算力,利用集群的效率达到业内最顶尖的水平,可以用相对比较少的卡,很快速地训练出我们的模型。

我们目前GPU集群的利用率能做到50%,大模型需要多卡,目前业内的水平大概是42%。大模型还要做到3D混合并行训练。什么是3D?就是模型的并行化、数据的并行化、流水线的并行化,要把任务分离到很多不同机器的不同卡里分别计算,最后能快速得到响应的结果。另外在模型推理里得到了很多优化,推理的速度提高了5倍,怎么样把训练卡和推理卡分开,训练卡是A800,推理卡是在一张单卡A6000上就可以实现快速推理。

另外数据很重要,数据规模、数据多样性、数据高质量,我们现在能做到支持10T级别的快速去重,ChatGPT的训练数去是45T,但是优选之后用了几百G的数据来训练。

有了这些能力之后,就能够基于Atlas和UniDataOps的能力,可以把山海的能力和行业客户更好地提供服务。

智慧物联也是公司的一块重要业务,我们有很多落地,过去用的效果确实不太好,希望有了山海之后,用大模型把已有的物联网的产品全部做一遍。

醫療是我們看好的方向。 以前的醫療方向,產品主要有兩個方面,一是不用手敲鍵盤,直接拿麥克風說話,極大提升了醫生的工作效率,把病歷輸入時間從3個小時縮短到了1個小時;二是有了病歷之後,還有一套系統,透過AI大腦審核病歷,審核病歷有沒有錯誤,現在有了AI大模型能力之後能夠做什麼呢?

山海的願景是透過人工智慧打造互聯、直覺的世界,而以前對人工智慧的定義是讓機器服從人,今天希望機器更擬人。人和物的溝通交流會變的更直觀,新的能力會帶來新的產品、新的商業模式,非常願意和在座各位共同迎接大模型的新時代。

掃碼加入黑馬創業者交流群組

#↓↓↓

#掃描下方二維碼

#加入黑馬AIGC產業營

讀懂AIGC底層邏輯,一步連結產業未來

#↓↓↓

#分享、讚和在看,完成三連擊,把好的內容傳遞給更多需要的人。

更多精彩內容,盡在i黑馬影片號碼

#↓↓↓

#關注黑馬傳播矩陣,get更多精彩內容

↓↓ ↓

#

以上是讓機器擬人化,從'人工智障”到'人工智慧”的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:搜狐。如有侵權,請聯絡admin@php.cn刪除
讓我們跳舞:結構化運動以微調我們的人類神經網讓我們跳舞:結構化運動以微調我們的人類神經網Apr 27, 2025 am 11:09 AM

科學家已經廣泛研究了人類和更簡單的神經網絡(如秀麗隱桿線蟲中的神經網絡),以了解其功能。 但是,出現了一個關鍵問題:我們如何使自己的神經網絡與新穎的AI一起有效地工作

新的Google洩漏揭示了雙子AI的訂閱更改新的Google洩漏揭示了雙子AI的訂閱更改Apr 27, 2025 am 11:08 AM

Google的雙子座高級:新的訂閱層即將到來 目前,訪問Gemini Advanced需要$ 19.99/月Google One AI高級計劃。 但是,Android Authority報告暗示了即將發生的變化。 最新的Google P中的代碼

數據分析加速度如何求解AI的隱藏瓶頸數據分析加速度如何求解AI的隱藏瓶頸Apr 27, 2025 am 11:07 AM

儘管圍繞高級AI功能炒作,但企業AI部署中潛伏的巨大挑戰:數據處理瓶頸。首席執行官慶祝AI的進步時,工程師努力應對緩慢的查詢時間,管道超載,一個

Markitdown MCP可以將任何文檔轉換為Markdowns!Markitdown MCP可以將任何文檔轉換為Markdowns!Apr 27, 2025 am 09:47 AM

處理文檔不再只是在您的AI項目中打開文件,而是將混亂變成清晰度。諸如PDF,PowerPoints和Word之類的文檔以各種形狀和大小淹沒了我們的工作流程。檢索結構化

如何使用Google ADK進行建築代理? - 分析Vidhya如何使用Google ADK進行建築代理? - 分析VidhyaApr 27, 2025 am 09:42 AM

利用Google的代理開發套件(ADK)的力量創建具有現實世界功能的智能代理!該教程通過使用ADK來構建對話代理,並支持Gemini和GPT等各種語言模型。 w

在LLM上使用SLM進行有效解決問題-Analytics Vidhya在LLM上使用SLM進行有效解決問題-Analytics VidhyaApr 27, 2025 am 09:27 AM

摘要: 小型語言模型 (SLM) 專為效率而設計。在資源匱乏、實時性和隱私敏感的環境中,它們比大型語言模型 (LLM) 更勝一籌。 最適合專注型任務,尤其是在領域特異性、控制性和可解釋性比通用知識或創造力更重要的情況下。 SLM 並非 LLMs 的替代品,但在精度、速度和成本效益至關重要時,它們是理想之選。 技術幫助我們用更少的資源取得更多成就。它一直是推動者,而非驅動者。從蒸汽機時代到互聯網泡沫時期,技術的威力在於它幫助我們解決問題的程度。人工智能 (AI) 以及最近的生成式 AI 也不例

如何將Google Gemini模型用於計算機視覺任務? - 分析Vidhya如何將Google Gemini模型用於計算機視覺任務? - 分析VidhyaApr 27, 2025 am 09:26 AM

利用Google雙子座的力量用於計算機視覺:綜合指南 領先的AI聊天機器人Google Gemini擴展了其功能,超越了對話,以涵蓋強大的計算機視覺功能。 本指南詳細說明瞭如何利用

Gemini 2.0 Flash vs O4-Mini:Google可以比OpenAI更好嗎?Gemini 2.0 Flash vs O4-Mini:Google可以比OpenAI更好嗎?Apr 27, 2025 am 09:20 AM

2025年的AI景觀正在充滿活力,而Google的Gemini 2.0 Flash和Openai的O4-Mini的到來。 這些尖端的車型分開了幾週,具有可比的高級功能和令人印象深刻的基準分數。這個深入的比較

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境