5月27日,創業黑馬在北京舉辦 「2023躍遷•黑馬AIGC高峰會」。此次大會的主題為「預見新世界,建構新格局」。有「AI專家」之稱的卡內基美隆大學計算機學院前副院長、達沃斯世界經濟論壇(WEF)計算機全球未來理事會前主席賈斯汀•卡塞爾,以及360集團、智源研究院、崑崙萬維、雲知聲、藍色遊標、萬興科技、知道創宇等眾多行業內企業高層到場,與上千位與會者進行了深入交流。
在高峰會現場,雲知聲創辦人、CEO 黃偉分享了 《通往智享未來之路》主題。
以下為分享內容整理:
開始我們希望按照專家的方式去做,希望交給機器一些方法論,十年前,機器開始從錯誤回饋學習。這都是在過去人工智慧技術裡的大概階段和路徑。
今天OpenAI推出了ChatGPT和預訓練模型,整個智能變得更加擬人化,首先我們用非常強大的算力閱讀了全世界已知的所有文本,訓練形成了大模型。它特別像嬰兒大腦,可能有幾百億、上千億的參數,和人腦不同的是,嬰兒最多只是遺傳了父母的外表和性格等,但大模型的大腦遺傳了知識,這只是初始狀態,接下來會透過微調等各種方式,像小孩在成長過程中會有各種教育,整個大模型的演進更加擬人化。
這是整個人工智慧的變化。
今天的AGI和之前有什麼本質變化? 2022年12月份之前,整個人工智慧還是一種鑑別式人工智慧,做判斷題、專用系統和智慧模組,做一些特定任務。一方面人工智慧的表現並不是那麼智能,常被別人詬病“你們提供的是人工智障”,以至於過去人工智慧的能力天花板較低。
第二,在很多場景裡,客戶的需求是千差萬別的,但人工智慧的能力沒那麼強,很多公司和團隊用各種客製化去滿足。人工智慧企業不像高科技公司,在過去十年裡,只能做鑑別式AI是手工作坊的時代。但現在有了大模型,有更強大的通用能力,人工智慧開始進入工業化時代。
有了新的生成能力、湧現能力,用一個模型就能解決許多場景下的不同問題。今天這個時代,人工智慧大模型就是發電機,在引擎還沒發明之前,中東國家並沒有那麼富裕,石油的價值沒那麼大。就像今天可以把數據變成燃料和能力,用這個能力賦能千行百業。
雲知聲為什麼能夠在短時間推出自研大模型?
2016年看到AlphaGo,我們把醫療產品在醫院裡落地,幫助北京協和醫院的醫生,大大提高工作效率。在醫院這個場景裡,只是效率工具是不夠的,人工智慧真正的智能是認知智能,Transformer是2017年提出來的,認知智能的背後需要比較強大的算力。
有了這些鋪墊,無論從學術或工程化方面,累積了許多經驗。這個經驗對於個人來講是你謀生的能力,但對公司來說是在市場上勝出的核心競爭力。把ChatGPT框架看了之後,發現沒有一項是新的,都是一些已有的工程化組合,我們很快就把這種能力結合,投入大模型研發。
我們在三天前,發布了商業大模型,名字叫山海。把預訓練、指令微調、基於人類回饋的增強學習全部跑通,看到了期待已久的湧現能力。那時候團隊就在想是不是要給它取個名字,那段時間我在頻繁出差,覺得名字還挺好的。海是波瀾壯闊,有容乃大,體現出大模型的無限生成能力,山是高山仰止,我們知道什麼能說、什麼不能說,這恰恰是既要強調大模型的生成能力,又要強調大模型的安全合規問題。
有一個很有趣的現象,大家都在談大模型,國內對大模型的關注是在春節後,但大家都不談這個事,心裡都沒底。到今天為止,有一種觀點這件事情只有技術還不能做,哪怕人都到位了,但訓練成本很大,是極其燒錢的。大模型不是科學革命、不是發明了新的演算法,是把已有的演算法組合在一起做大,大都是有代價的,當然還有很多工程在裡面。觀點是對的。
反过来讲,如果认为未来10-20年大模型是很大的机会,BAT投不进去了,就放弃了,我认为还是有机会的。
云知声在过去的几年里,并不需要特别牛的科学家,我甚至认为这个事就不是科学家干的事情,科学家没有玩过那么多算力,也不知道场景在哪里,所以结果一定是不好的。有场景的厂商反而是最有可能成功的。
起山海这个名字,还有一个意思,所爱隔山海,山海皆可平。
山海之力是十项全能。生成能力是非常主观的,真正在场景落地的时候,语言理解能力很重要,为什么以前觉得是人工智障,因为缺乏理解和代码能力。代码能力的提升能够有助提升大模型的推理能力,输出结果一定要符合国内的法律法规甚至道德价值观等。我们还采用GPT-4 插件的架构,帮助企业和客户,从数据的优选、模型训练、模型部署等一条龙服务。
为什么大模型具备复杂的逻辑推理能力?我们今天做到了,但不知道为什么,到底是500亿参数还是1000亿参数更好,却不好说,可能1000亿参数里面神经元还没有被激活。
另外还有医疗,一开始我们在做大模型,很多人以为云知声做的是垂直行业模型,并不是,我们是做行业应用。挑战了一个最严肃的场景——医疗,通过预训练阶段,收集了很多医学的文献、专著、书籍,病案,积累了几千万真实标注的数据,这些数据可以转化成我们的微调数据。
另外在2019年还获得了北京市科技进步一等奖,获奖项目就是大规模知识图谱构建关键技术及应用,我们有国内最大规模之一的医疗知识图谱,我们把知识图谱分解成知识插件嵌入到大语言模型中,使得大模型变成医疗领域的专家。
MedQA是一个非常权威的医疗知识问答测试集,包括谷歌的Med-PaLM,ChatGPT和GPT-4都在这个测试集上公布了它们的评测结果,山海前不久的评测中做到了81分,大大超过了GPT-4的71分。通过领域增强以后,能够把大模型变成某个领域的专家。还有一个数字可以做横向对比,医学院毕业生要通过临床执业医师考试目前已知的AI最高分数是456分,山海大概考了511分,这就是大模型通过领域增强以后获得的超强能力。
想做大模型还是挺难的,门槛非常高,除了需要很多钱之外、优秀的算法工程师和算法之外,还需要很多能力,我们把它总结为山海之功。直观来讲,大模型本身就是大数据集,大模型是工程师的活儿,云知声为什么能够用几个月的时间就能做出一个非常权威的客观的评测数据,我们内部去评,不只在医疗,在通用领域方面,云知声都是最好之一。
算力平台不是买多少卡来插就行了,云知声差不多有200P算力,利用集群的效率达到业内最顶尖的水平,可以用相对比较少的卡,很快速地训练出我们的模型。
我们目前GPU集群的利用率能做到50%,大模型需要多卡,目前业内的水平大概是42%。大模型还要做到3D混合并行训练。什么是3D?就是模型的并行化、数据的并行化、流水线的并行化,要把任务分离到很多不同机器的不同卡里分别计算,最后能快速得到响应的结果。另外在模型推理里得到了很多优化,推理的速度提高了5倍,怎么样把训练卡和推理卡分开,训练卡是A800,推理卡是在一张单卡A6000上就可以实现快速推理。
另外数据很重要,数据规模、数据多样性、数据高质量,我们现在能做到支持10T级别的快速去重,ChatGPT的训练数去是45T,但是优选之后用了几百G的数据来训练。
有了这些能力之后,就能够基于Atlas和UniDataOps的能力,可以把山海的能力和行业客户更好地提供服务。
智慧物联也是公司的一块重要业务,我们有很多落地,过去用的效果确实不太好,希望有了山海之后,用大模型把已有的物联网的产品全部做一遍。
醫療是我們看好的方向。 以前的醫療方向,產品主要有兩個方面,一是不用手敲鍵盤,直接拿麥克風說話,極大提升了醫生的工作效率,把病歷輸入時間從3個小時縮短到了1個小時;二是有了病歷之後,還有一套系統,透過AI大腦審核病歷,審核病歷有沒有錯誤,現在有了AI大模型能力之後能夠做什麼呢?
山海的願景是透過人工智慧打造互聯、直覺的世界,而以前對人工智慧的定義是讓機器服從人,今天希望機器更擬人。人和物的溝通交流會變的更直觀,新的能力會帶來新的產品、新的商業模式,非常願意和在座各位共同迎接大模型的新時代。
掃碼加入黑馬創業者交流群組
#↓↓↓
#掃描下方二維碼
#加入黑馬AIGC產業營
讀懂AIGC底層邏輯,一步連結產業未來
#↓↓↓
#分享、讚和在看,完成三連擊,把好的內容傳遞給更多需要的人。
更多精彩內容,盡在i黑馬影片號碼
#↓↓↓
#關注黑馬傳播矩陣,get更多精彩內容
↓↓ ↓
#以上是讓機器擬人化,從“人工智障”到“人工智慧”的詳細內容。更多資訊請關注PHP中文網其他相關文章!