最近,AI 領域都在思考一件事:多模態大模型落地產業,好的打法應該是什麼? 通用人工智慧時代正在到來,AI 大模型技術已成為數位經濟下基礎設施建設的重要支撐,也成為產業智慧轉型的核心「引擎」, AI 大模型產業應用迎來了前所未有的發展機會。 在10 月28 日舉辦的CNCC 2023「超智融合AI 大模型應用落地發展論壇」上,智子引擎發布了「元乘象Chatimg3.0」 ,展示了多模態通用生成模型「元乘象Chatimg3.0」的最新進展與落地探索。 元乘象Chatimg3.0是一個超精細辨識、少幻的多模態大模型,同時支援多圖理解、物體定位、OCR 等功能。 Chatimg3.0 為硬體設備裝上了大腦,可實現更自然更流暢的人機交流,為 AI 多模態大模型賦能產業應用打下了堅實的基礎。 與Chatimg2.0 相比,Chatimg3.0 主要進行了兩方面的升級,包括第一階段的預訓練(描述、偵測、OCR 等多工訓練)以及第二階段的指令微調(高品質的人工精篩指令集)。 為更好的評估多模態大模型的能力,智子引擎建構了一個全新的多模態對話測試集,從描述、推理、檢測、問答、業務五個面向對模型能力進行評測,而且在問答和業務兩方面的能力上赶超GPT-4V,展現了國產大模型優秀的發展潛力。
以下是Chatimg3.0 比較GPT-4V 在測驗中的具體表現:##說明:
之後時使用:Chatimg3.0,右:為 GPT-4V。 右:GPT-4V。
檢測:
## ,右:GPT-4V。
與左
##目前,智子引擎已經將「元乘象Chatimg3.0」應用於全局防控和無人機巡檢等領域,透過與無人機、電子探頭等前端感知設備的融合,升級傳統巡檢和安防,實現了AI 缺陷識別、異常檢測、行為分析、重點監控、自主巡查、風險預測等功能,推動了AI 工程化革新進程。
###############
作為國內首個多模態大模型研發團隊,智子引擎不僅在人才和技術上擁有先天的優勢,多個知名投資機構和 IT 行業龍頭的天使投資,也讓這家公司「如虎添翼」。 在軟通動力、華軟科技等知名企業的協同輔助下,融合「元乘象Chatimg3.0」研發的「智子・天穹」與「智子・天巡」系統一經過面世便得到了業界的關注,產品被快速應用於城市治理、智慧電力、管道巡檢、園區管理、農業、金融等多行業應用場景,並逐步開始試點部署。
未來,為了加速大模型產業應用落地,促進數位經濟永續發展,智子引擎將繼續加強模型訓練和能力升級,匯聚產業頂尖人才和優勢資源,為大模型輔助產業升級不遺餘力。核心模型 「元乘象 Chatimg」未來也會在 AI agents、具身智慧等方向持續發力,並將收穫更多產業關注。 以上是元乘象Chatimg3.0:超越GPT-4V的產業升級新策略的詳細內容。更多資訊請關注PHP中文網其他相關文章!