4月6日訊息,微軟已將OpenAI的GPT-4整合到Microsoft 365生產力應用套件中,這是一項非常艱鉅的任務,但公司一直希望能夠盡快完成。因此,微軟動員了數百名員工,讓他們長時間加班工作,一起腦力激盪產品方案,基於一個統一的設計框架,開發出三種人工智慧助理的工作模式。
過去幾個月裡,這是在微軟的會議室和走廊裡被無數次提及的一個詞。它指的是3月16日,當天微軟宣布將與OpenAI共同開發的生成式AI模型引入Microsoft 365生產力應用套件中。透過整合GPT-4,包括Outlook、Word和Teams在內的每個生產力應用程式都將擁有基於生成式人工智慧的Copilot(智慧副駕駛)。目前,20多個微軟客戶正在對這項技術進行測試。
將人工智慧助理整合到如此多的應用程式中是一項艱鉅的任務,但微軟希望盡快完成。去年11月,OpenAI發布的ChatGPT引發了全球轟動,掀起了一場人工智慧競賽,各家企業都在爭分奪秒地推出新的人工智慧產品和功能,以搶佔市場先機。即使是已經與OpenAI合作和投資過的微軟也不例外
微軟設計總監喬恩·弗里德曼(Jon Friedman)負責Microsoft 365中的Copilot產品設計。他表示這個專案需要數百名微軟員工的長時間工作,包括設計師、工程師、產品經理、行銷人員、資料科學家以及道德倫理團隊等等,整個專案要持續幾個月時間,甚至需要在周末加班。弗里德曼說,這個計畫還需要人們克制自我,共同努力,才能在如此短的時間內建成如此大的項目,讓大家都感到他們必須放下自我,團結一致。
弗里德曼說:「我們可以一起做一些真正大膽而重大的事情,這讓人很興奮。雖然我們在人工智慧方面擁有很多經驗,但這種特殊的生成式人工智慧更強大,所以我認為每個人都在抱著學習的心態工作。”
弗里德曼認為,Copilot是一種“對話式用戶體驗”的新形式,它可以調用更多豐富的資源。他表示,Copilot是一款辦公室助手,代表了「使用者介面設計的新前沿,就像第一代觸控螢幕裝置一樣改變既定模式」。據悉,Copilot是基於GPT-4大型語言模型開發,預先訓練了大量網路內容,並可存取微軟Graph中的業務數據,從而自動產生電子郵件和會議要點等內容。
設計Copilot這種使用者介面的挑戰在於,當人們通常使用Word和Powerpoint等應用程式進行工作時,如何以及何時展示這個全新的人工智慧助理。
弗里德曼表示,最初設計這種可以透過各種生產力應用程式呼叫的人工智慧助理只是「一個模糊的想法」。但隨著設計團隊對人工智慧助理在實際業務中的應用有更深入的了解,這種想法開始逐漸明確。首先,設計團隊需要發現人工智慧在實際應用中可以明顯節省使用者時間或以某種方式激發創造力等具體用例,這是使用者體驗設計過程的第一步。
最了解相關用例的人包括每個生產力應用程式的工程師、產品經理、設計師和電腦科學家。弗里德曼的設計團隊與他們通力合作。在Copilot計畫啟動時,他要求所有產品團隊共同腦力激盪,探討如何利用生成式人工智慧來提升生產力應用程式的功能。接著,弗里德曼成立了一個特殊的橫向設計團隊,與所有應用程式團隊合作,以在每個應用程式中展示Copilot的效果。
弗里德曼表示,隨著各個應用程式團隊開始製定用例,橫向設計團隊開始注意到這些用例之間的共通性,即與多個應用程式相關的人工智慧用例。
弗里德曼回憶起當時的腦力激盪過程時說:「我們的討論非常有價值…我們討論的是Copilot具體的功能需求,例如新的生成式語言模型如何幫助我們更好地完成寫郵件摘要的任務?」
隨著跨應用用例變得越來越清晰,橫向設計團隊開始認為,每個應用程式的人工智慧助理功能並不需要各自不同。
弗里德曼表示:「因為你有很多人…試著觀察各個場景,能夠大致做出這種判斷,比如說『啊,也有這個東西出現了』。」
因此,他們開始構思一個設計框架,讓一個通用助理以幾種不同的可預見方式在各個應用程式中工作。
弗里德曼領導的設計團隊創建了一個深度文檔庫,旨在幫助整個專案的設計師在給定的應用程式中為人工智慧建立切入點。他們指導設計師根據使用者可能參與的不同任務來決定如何呼叫Copilot。弗里德曼說:「有這樣一個觀念,Copilot應該在正確的層次出現,完成正確的工作。」
設計框架規定,Copilot在應用程式使用者介面中可以有三種展示方式。
第一種是身臨其境的用戶體驗,讓人工智慧助理專注於具體業務項目,而不是某個特定的應用程序,這實際上可以從多個應用程式中提取數據或要點,服務於手頭上的工作。例如,Copilot可能會從團隊會議、投影片或電子郵件內容中收集專案里程碑或風險點,然後在專案計畫文件中進行總結和歸納。
「沉浸式」體驗模式是Copilot在生產力應用套件中最強大的功能,也可能是最有影響力的。市場顧問公司恩德勒集團(Enderle Group)首席分析師鮑伯‧恩德勒(Rob Enderle)認為,這也可能有助於解決Microsoft生產力套件長期以來存在的問題——各個應用程式之間的整合不夠緊密。恩德勒說,原因可能是最初微軟是從其他公司相繼收購這些應用程序,彼此之間並沒有共用程式碼庫。但Copilot可以涵蓋所有應用程序,至少能讓使用者感覺到這些應用程式能在某些任務中協同工作。
弗里德曼說,第二種展示方式是“輔助”,這意味著Copilot就像挎鬥三輪摩托車的“邊鬥”,在特定的應用程式中幫助用戶最大限度地呼叫應用程式功能。例如,在PowerPoint中,Copilot可以向使用者展示應用程式的深層圖形功能如何用於描述複雜資料集;在Outlook中,Copilot可以幫助使用者理解電子郵件中最重要的內容;在Word中,Copilot可以提供有關如何更好撰寫文件、貼合特定寫作風格的回饋意見。
此外,在Copilot的「嵌入式」展示方式中,人工智慧可以在應用程式中發揮生成式和創造性能力。例如,Copilot可能會出現在Word文件的彈跳窗中。 「這就像是一種隨機體驗。」弗里德曼說,「當你全心投入工作時,Copilot可以幫助你解決寫作瓶頸,或自動用文字內容幫助你開始做幻燈片。」
弗里德曼表示,Copilot的橫向設計團隊開始採用「三個層次」的概念來描述這項工作,各個應用程式團隊的成員也逐漸接受了這個框架。
他說,「我們已經與執行長納德拉和公司高階主管團隊的其他成員分享了這個框架,基本上得到了所有人的認可。這種想法可以適用於三個不同的工作層次。」
Copilot這個名字不是專門為Microsoft 365而設立的。微軟旗下的GitHub在2021年曾使用這個名字來稱呼程式設計助手,其中部分功能也採用了OpenAI的大型語言模型。而微軟正在創建一個具有一致性的Copilot助手,能夠在不同的生產力應用套件中執行某些標準化功能。對於長期使用生產力應用程式的用戶,這項新工作很可能會減少他們在新版Microsoft 365正式推出時所遇到的生疏感。透過使用統一的助手,使用者可以更方便地使用不同的應用程序,從而提高工作效率。
隨著生成式人工智慧進一步融入微軟的消費級和企業級產品,Copilot品牌和概念可能會擴展到Windows作業系統甚至LinkedIn等微軟其他產品。
「納德拉非常喜歡這個名字,因為它恰如其分地描述了人工智慧助理的工作,」弗里德曼說。 「它的存在是為了幫助你,在許多任務中指引你的方向…」
以上是微軟這麼快就整合了GPT-4,如何做到的?專案組甚至週末加班了的詳細內容。更多資訊請關注PHP中文網其他相關文章!