搜尋
首頁科技週邊人工智慧AI大比拼:GPT4和ChatGPT能否幫助我們創造更好的中文網站?

作者 | 雲昭

一開始據說是本週四發布,結果en~~週三凌晨就發布了,果真,OpenAI向來喜歡提前給人們製造驚喜!

AI大比拼:GPT4和ChatGPT能否幫助我們創造更好的中文網站?


#1、GPT4、ChatGPT大比拼

#廢話不多說,先上GPT4的硬技能。

首先,是長文本處理的能力,OpenAI官網上是這麼描述的:「GPT4 能夠處理超過25,000個單字的文本,允許使用長格式內容創建、擴展對話以及文件搜尋分析等用例。」

OpenAI怕大家不能很形象的理解,乾脆用一篇維基百科的長文舉了個例子,這個文本有多長呢?小編實際點開了連結(見下圖),比目前ChatGPT(GPT3.5)能處理的文字長出一倍。不信的朋友可以去這個連結:https://en.wikipedia.org/wiki/Rihanna看一看實際長度。

AI大比拼:GPT4和ChatGPT能否幫助我們創造更好的中文網站?

對於文字對話任務,兩者表現幾何? OpenAI官方是這樣說的。

在隨意的交談中,GPT3.5和GPT4之間的差異可能很細微。當任務的複雜性達到足夠的閾值時,差異就會顯現出來。 GPT4比GPT3.5更可靠、更有創造力,並且能夠處理更細微的指令。

GPT4的上下文長度為8192個令牌。 OpenAI還提供了對32768上下文(約50頁文本)版本gpt-4-32k的有限訪問,該版本也將隨著時間的推移自動更新(當前版本gpt-4-22k-0314,也支援到6月14日)。定價為每1K提示令牌0.06美元,每1K完成令牌0.12美元。

OpenAI仍在改進長期環境下的模型質量,並希望得到有關它在的用例中表現如何的反饋。 OpenAI根據容量以不同的速率處理8K和32K引擎的請求,因此可以在不同的時間存取它們。

第二個,對影像的辨識能力:接受影像作為輸入。

GPT4可以接受文字和圖像的提示,這與純文字設定並行,允許使用者指定任何視覺或語言任務。具體來說,它會產生文字輸出(自然語言、程式碼等),給定由穿插的文字和圖像組成的輸入。在一系列領域,包括帶有文字和照片的文檔、圖表或螢幕截圖,GPT4表現出與純文字輸入類似的功能。此外,它還可以透過為純文字語言模型開發的測試時間技術來增強,包括少量鏡頭和思維鏈提示。遺憾的是,影像輸入仍只是研究預覽階段,暫時沒有公開。

AI大比拼:GPT4和ChatGPT能否幫助我們創造更好的中文網站?

(問題和答案都是英文:為了方便理解,已翻譯為中文)

#圖片上給了一些食材,問GPT4可以依照圖片上的食材做哪些美食。可以看出GPT4正式跨界了!

第三個,更可靠的推理能力。

GPT4較之前的模型,更具創造性和協作性。它不僅能夠完成許多創意和基礎寫作,還能創作歌曲、劇本,重要的是還能學習使用者的寫作風格。

關於推理能力這塊,OpenAI也給了一個讓GPT4預定會議室的例子:

AI大比拼:GPT4和ChatGPT能否幫助我們創造更好的中文網站?

問題大致上是這樣的:三個人在每一天的空閒時間不一樣,讓GPT找出一個30分鐘會議的合適時間。

可以看出ChatGPT的邏輯想法和文字分析的都沒毛病,但給的答案全錯。而GPT4則給了正確的答案。

GPT4還有一個更強的BUFF,讓它參加考試,會碾壓不少學霸!而ChatGPT則是弱爆了!

AI大比拼:GPT4和ChatGPT能否幫助我們創造更好的中文網站?

在統一律師考試中取得了前10%的成績,而ChatGPT則獲得了倒數10%。

除此之外,OpenAI也給出了SAT等其他考試的排名,都比ChatGPT能扛能打!

AI大比拼:GPT4和ChatGPT能否幫助我們創造更好的中文網站?

與ChatGPT比起來,還有哪些硬貨?

GPT4的可操作性更加灵活。使用过ChatGPT的朋友都知道,如果用API提交请求的话,一般有两个消息:系统消息(规定的AI风格和角色)和用户消息(具体提出的问题)。之前的ChatGPT对于系统消息不太看重,风格、语调比较固定。

而GPT4则不然,开发人员(以及很快的ChatGPT用户)现在可以通过在“系统”消息中描述这些方向来规定他们的AI风格和任务,系统消息允许API用户在一定范围内显著自定义用户体验。OpenAI将继续在这里进行改进(尤其要知道,系统消息是“越狱”当前模型的最简单方法,即,对边界的遵守不再那么死板),OpenAI也非常鼓励让他们知道用户想要尝试这些ideas。

还有对多语种的支持能力也更强。测试的26种语言当中,有24种要比GPT3.5和其他的语言模型的精确度都要强。

AI大比拼:GPT4和ChatGPT能否幫助我們創造更好的中文網站?

小编瞪大眼睛瞅来瞅去,也没有看见中文。果断就去找了相关中文测试的效果究竟如何,结果呵呵了。不仅速度慢,一样也是给出了错误的答案!

AI大比拼:GPT4和ChatGPT能否幫助我們創造更好的中文網站?

ChatGPT有没有比GPT4领先的地方?

有!那就是生成文本的速度,GPT4生成答案的速度明显慢于ChatGPT。看来能力越强,回答问题就会越慎重!

2、实际测评

第一个例子是:餐巾纸上的草图都能让GPT4魔法一样生成个网页图!

AI大比拼:GPT4和ChatGPT能否幫助我們創造更好的中文網站?

图源:推特

真实例子,推特上一位用户将一张餐巾纸上的草纸图拍完照后,交给GPT4,结果真的变成一张功能齐全的html/css/JavaScript网站。

网友惊呼:这模型竟然能够阅读和解释餐巾纸上写的任何内容!

还有位网友脑洞大开:那是不是基于GPT4的应用程序,将我的书面处方变成药剂师可以实际阅读的东西,就可以成为下一个美国生物技术亿万富翁。

第二个例子:用GPT4重建游戏。

一位叫Pietro的用户在60s内重建了Pong游戏,而且分数还不错。

AI大比拼:GPT4和ChatGPT能否幫助我們創造更好的中文網站?

图源:推特

AI大比拼:GPT4和ChatGPT能否幫助我們創造更好的中文網站?

图源:推特

GPT4由于其广泛的通用知识和解决问题的能力,可以更准确地解决难题。GPT4的创造性恐怖如斯。

3、GPT4的局限性

GPT4虽然能力比ChatGPT更强,但局限性依旧与早期GPT模型相似。最重要的是,它仍然不完全可靠(它依旧会编造事实,并会犯推理错误)。在使用语言模型输出时,尤其是在高风险上下文中,应非常小心,使用与特定用例需求匹配的精确协议(如人工审查、附加上下文基础或完全避免高风险使用)。

在OpenAI的内部对抗性真实性评估中,GPT4的得分比我们最新的GPT3.5高40%。也就是说,即便GPT4生成的答案更准确,但也只是比GPT4更加可信了40%而已!

4、访问权限

ChatGPT Plus用户可以从chat.openai.com上获得GPT4访问权限。同时,OpenAI将根据实际需求和系统性能调整确切的使用上限,但OpenAI预计会产生严重的容量限制(尽管OpenAI将在未来几个月内进行扩展和优化)。

根据OpenAI看到的流量模式,OpenAI可能会为更高容量的GPT4使用量引入新的订阅级别;OpenAI还希望在某个时候提供一些免费的GPT4查询,这样那些没有订阅的用户也可以尝试。

要访问GPT-4 API(它使用与GPT-3.5-turbo相同的ChatCompletions API),还需要注册OpenAI的等待名单。

OpenAI從今天開始,將邀請一些開發商,並逐步擴大規模,以平衡容量和需求。如果是有社會影響的研究人員,也可以透過OpenAI的研究人員准入計畫申請使用。

5、應用生態已有探索

OpenAI在內部使用GPT4,對支援、銷售、內容管理和程式設計等功能產生了巨大影響。 OpenAI也使用它來幫助人類評估人工智慧輸出,開始OpenAI對齊策略的第二階段。

OpenAI期待GPT4透過為許多應用程式提供動力,成為改善人們生活的寶貴工具。還有很多工作要做,OpenAI期待著透過社區建設的集體努力來改進這個模式,探索並為這個模式做出貢獻。小編注意到OpenAI已經和一家虛擬志工工具的公司達成合作。

AI大比拼:GPT4和ChatGPT能否幫助我們創造更好的中文網站?

Be My Eyes的合作夥伴。透過世界各地的事實影片將需要視力支持的人與志工和住院者和公司聯繫起來。

簡化低視力人群的任務

AI大比拼:GPT4和ChatGPT能否幫助我們創造更好的中文網站?

#借助Be My Eyes應用程序,可以支援視障人群並幫助他們實現獨立。盲人或低視力使用者可能需要的支援包括:檢查有效期限、區分顏色、閱讀說明或在新環境中導航。

6、寫在最後

OpenAI稱GPT4是努力擴展深度學習的最新里程碑。 GPT4作為一個大型多模態模型(接受圖像和文字輸入,發出文字輸出),在各種專業和學術基準上表現出人類水準的表現。

雖然跟我們先前所做的多模態能力預測(文字、圖像、音訊、視訊等輸入)有較大的差距,但可以看出GPT模型的演進在紮實推進,尤其是通用知識的理解能力和更難問題的處理上,著實驚艷到了!

#

以上是AI大比拼:GPT4和ChatGPT能否幫助我們創造更好的中文網站?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
人工智能治療師在這裡:您需要了解的14個開創性的心理健康工具人工智能治療師在這裡:您需要了解的14個開創性的心理健康工具Apr 30, 2025 am 11:17 AM

儘管它無法提供訓練有素的治療師的人類聯繫和直覺,但研究表明,許多人很樂意與相對無面和匿名的AI機器人分享他們的擔憂和擔憂。 這是否總是好我

叫AI到雜貨店過道叫AI到雜貨店過道Apr 30, 2025 am 11:16 AM

人工智能(AI)是一種技術數十年的技術,正在徹底改變食品零售業。 從大規模的效率提高和成本降低到精簡的各種業務功能的流程,AI的影響是Undeniabl

從生成的AI中進行佩普談話來提升您的精神從生成的AI中進行佩普談話來提升您的精神Apr 30, 2025 am 11:15 AM

讓我們來談談。 對創新的AI突破的分析是我正在進行的AI中正在進行的《福布斯》列覆蓋範圍的一部分,包括識別和解釋各種有影響力的AI複雜性(請參閱此處的鏈接)。此外,對於我的comp

為什麼AI驅動的超個性化是所有企業必須的為什麼AI驅動的超個性化是所有企業必須的Apr 30, 2025 am 11:14 AM

保持專業形象需要偶爾的衣櫃更新。 在線購物方便時,它缺乏面對面嘗試的確定性。 我的解決方案? AI驅動的個性化。 我設想AI助手策劃服裝Selecti

忘記Duolingo:Google Translate的新AI功能教授語言忘記Duolingo:Google Translate的新AI功能教授語言Apr 30, 2025 am 11:13 AM

谷歌翻譯新增語言學習功能 據Android Authority報導,應用專家AssembleDebug發現,最新版本的谷歌翻譯應用包含一個新的“練習”模式的測試代碼,旨在幫助用戶通過個性化活動來提高他們的語言技能。此功能目前對用戶不可見,但AssembleDebug能夠部分激活它並查看其一些新的用戶界面元素。 激活後,該功能會在屏幕底部添加一個新的“畢業帽”圖標,標有“Beta”徽章,表明“練習”功能最初將以實驗形式發布。 相關的彈出提示顯示“練習為你量身定制的活動!”,這意味著谷歌將生成定制的

他們正在為AI製作TCP/IP,這就是Nanda他們正在為AI製作TCP/IP,這就是NandaApr 30, 2025 am 11:12 AM

麻省理工學院的研究人員正在開發Nanda,這是為AI代理設計的開創性的Web協議。 Nanda的縮寫是網絡代理和分散的AI,通過添加Internet功能,使AI Agen能夠構建人類的模型上下文協議(MCP)。

提示:DeepFake檢測是一項蓬勃發展的業務提示:DeepFake檢測是一項蓬勃發展的業務Apr 30, 2025 am 11:11 AM

Meta的最新冒險:與Chatgpt競爭的AI應用程序 Facebook,Instagram,WhatsApp和Threads的母公司Meta正在啟動新的AI功能應用程序。 這個獨立的應用程序Meta AI旨在直接與Openai的Chatgpt競爭。 槓桿

接下來的兩年在AI網絡安全方面為業務領導者接下來的兩年在AI網絡安全方面為業務領導者Apr 30, 2025 am 11:10 AM

導航AI網絡攻擊的上升潮流 最近,CISO的傑森·克林頓(Jason Clinton)擬人化,強調了與非人類身份相關的新興風險 - 作為機器對機器的通信增殖,維護這些“身份”

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具