首頁 >科技週邊 >人工智慧 >這家中國科技巨頭剛剛推出了AI聊天機器人,而且比DeepSeek更好

這家中國科技巨頭剛剛推出了AI聊天機器人,而且比DeepSeek更好

Susan Sarandon
Susan Sarandon原創
2025-02-07 06:01:12347瀏覽

在DeepSeek淡入標題之前,另一個中國人工智能模型已成為上座。中國電子商務巨頭阿里巴巴宣布了其QWEN AI模型系列的新版本,並且有很多喜歡的東西 - 比DeepSeek和某些關鍵領域的Chandgpt更好。

> Qwen Max是什麼?

Qwen Max是阿里巴巴Qwen AI家族中最新,最強大的AI模型。當前,可用以下QWEN AI模型:

    Qwen2.5-plus
  • qwen2.5-max
  • qwen2. 5-vl-72b-72b-instruct
  • qwen2.5-14b-instruct-1m
  • > qvq-72b-preview
  • qwq-32b-preview
  • -Instruct
  • qwen2.5-turbo
  • > qwen2.5-72b-instruct
>

>

>這家中國科技巨頭剛剛推出了AI聊天機器人,而且比DeepSeek更好通過電子郵件,Google或Github進行帳戶。 Qwen的AI型號也是開源的,這意味著您可以在Github或HuggingFace上找到它們。您也可以在設備上本地安裝它們(取決於規格),使您可以離線運行AI。 Moe)型號,支持29種語言,並接受了20萬億代幣的培訓。它也可以在一次對話中處理多達128,000個令牌,這意味著通過AI運行冗長的文檔不是問題。如果您正在使用數據,則QWEN可以處理結構化格式(例如表,CSV和JSON文件)。

顧名思義,某些QWEN模型在特定任務上更好。例如,QWEN2.5-編碼-32b-Instruct在編碼任務方面表現出色,而QWQ-32B-Preview能夠思考和推理。並非所有模型都可以做所有事情,但是大多數模型都可以處理文本提示以及圖像和視頻生成。

>另一個相當獨特的功能是將兩個模型組合在一起的能力。根據我的經驗,將兩個版本組合為更強的配對時,您可以獲得更好的結果。例如,將QWEN2.5-MAX與QWEN2.5-CODER-32B-INSCRUCT配對,幫助我生成代碼,並在輸出中使用較少的提示和問題。

> 這家中國科技巨頭剛剛推出了AI聊天機器人,而且比DeepSeek更好

Qwen的網站是唯一正式訪問的地方。 AI模型。您可以輸入提示並使用文本,但是也有圖像和視頻生成功能以及多種縱橫比。有一個尚未啟動的Web搜索功能。

的一面是,有時,Qwen需要一段時間來處理您的提示。如此之多,以至於一開始,我認為該網站運行不正常。我發現,您發送對話的第一個提示可能需要大約30秒鐘才能產生響應,此後響應加快了。

>

圖像和視頻的生成比我預期的要快。在質量或現實主義方面,它們不是頂級的,但是如果您需要在緊急情況下生成快速圖像,他們會做的。您也可以期望在大多數生成的媒體中也有相當數量的隨機工件。

這家中國科技巨頭剛剛推出了AI聊天機器人,而且比DeepSeek更好

>增加的響應時間可能只是因為服務器負載,就像啟動時幾乎每個AI Chatbot一樣,包括DeepSeek和Chatgpt。我確實收到了連接到QWEN的錯誤,因為隊列中有太多請求。 從技術上講,

Qwen勝過整個DeepSeek。阿里巴巴的模型更自然地與互動和運行速度如此之快。但是,如果您忽略了基準結果,那麼很難找到兩者之間的差異。

> QWEN比DeepSeek的主要優勢是它與人類偏好更好的一致性,從而更容易鍵入更複雜的提示並獲得準確的響應而不會進行微調。即使是簡單的單線也可以通過大量信息產生詳細的響應。 DeepSeek雖然是一個了不起的AI模型,但可以嘗試一些嘗試和一些及時的工程,然後才能獲得所需的結果。

這家中國科技巨頭剛剛推出了AI聊天機器人,而且比DeepSeek更好

在涉及一般知識和事實準確性時,這兩個模型都相似,但是qwen在事實一致性方面,確實具有略有優勢。

deepSeek是明顯的贏家的一個領域是使用成本。 DeepSeek的價格為每百萬個代幣0.25美元,而Qwen的價格為0.38美元。也就是說,它仍然比GPT-4O和Claude 3.5分別低於5美元和3美元的價格。當涉及基準時。

競技場 🎜>

qwen 2.5 max

deepSeek v3 r1

Benchmark

Qwen 2.5 Max

DeepSeek V3 R1

Arena-Hard

89.4

85.5

MMLU-Pro

76.1

75.9

GPQA-Diamond

60.1

59.1

LiveCodeBench

38.7

37.6

LiveBench

62.2

60.5

89.4 85.5
mmlu-pro 76.1 75.9
gpqa-gpqa--鑽石 60.1 59.1
livecodebench 38.7 37.6
livebench 🎜> 62.2 60.5

>基準顯然表明了Qwen與人類價值觀的更好理解和一致性。除此之外,就知識和推理,一般知識,編碼和整體能力而言,它僅比DeepSeek略好。但是,存在安全性和隱私問題,尤其是考慮到DeepSeek已經遭受了第一個數據洩露。儘管如此,就性能而言,Qwen和DeepSeek的AI模型顯然比西方的模型要好,並且確實使AI世界處於邊緣狀態。

以上是這家中國科技巨頭剛剛推出了AI聊天機器人,而且比DeepSeek更好的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn