語言模型是一種人工智慧技術,可以根據給定的文字生成自然語言。 OpenAI 的 GPT 系列語言模型是目前最先進的代表之
一,但IT之家注意到它們也有一個問題:它們的行為很難理解和預測。為了讓語言模型更透明和可信,OpenAI 正在開發一種新工具,可以自動識別語言模型中哪些部分對其行為負責,並用自然語言進行解釋。
這個工具的原理是利用另一個語言模型(也就是OpenAI 最新的GPT-4)來分析其他語言模型(例如OpenAI 自己的GPT-2)的內部結構。語言模型由許多「神經元」組成,每個神經元都可以觀察文本中的某種特定模式,並影響模型下一步的輸出。例如,給定一個關於超級英雄的問題(例如「哪些超級英雄有最有用的超能力?」),一個「漫威超級英雄神經元」可能會提高模型提到漫威電影中特定超級英雄的機率。
OpenAI 的工具就是利用這個機制來分解模型的各個部分。首先,它會將文字序列輸入到被評估的模型中,並等待某個神經元頻繁地「活化」。然後,它會將這些高度活躍的神經元「展示」給 GPT-4,並讓 GPT-4 產生一個解釋。為了確定解釋的準確性,它會提供給 GPT-4 一些文字序列,並讓它預測或模擬神經元的行為。然後它會將模擬的神經元的行為與實際神經元的行為進行比較。
「透過這種方法,我們基本上可以為每個神經元產生一些初步的自然語言解釋,並且還有一個分數來衡量這些解釋與實際行為的匹配程度。」 OpenAI 可擴展對齊團隊負責人Jeff Wu 說,「我們使用GPT-4 作為過程的一部分,來產生對神經元在尋找什麼的解釋,並評估這些解釋與它實際做什麼的匹配程度。」
研究人員能夠為GPT-2 中所有307,200 個神經元產生解釋,並將它們編譯成一個資料集,與工具程式碼一起在GitHub 上以開源形式發布。像這樣的工具有朝一日可能被用來改善語言模型的效能,例如減少偏見或有害言論。但他們也承認,在真正有用之前,還有很長的路要走。該工具對大約 1000 個神經元的解釋很有信心,這只是總數的一小部分。
有人可能會認為,這個工具實際上是 GPT-4 的廣告,因為它需要 GPT-4 才能運作。但 Wu 說,這並不是這個工具的目的,它使用 GPT-4 只是「偶然」的,而且,相反地它顯示了 GPT-4 在這方面的弱點。他還說,它並不是為了商業應用而創建的,並且理論上可以適應除了 GPT-4 之外的其他語言模型。
「大多數解釋的分數都很低,或沒有解釋太多實際神經元的行為。」Wu 說,「很多神經元的活動方式很難說清楚— 例如它們在五、六種不同的東西上激活,但沒有明顯的模式。有時候有明顯的模式,但GPT-4 卻無法找到。」
更不用說更複雜、更新、更大的模型,或者可以瀏覽網頁獲取資訊的模型了。但對於後者,Wu 認為,瀏覽網頁不會太改變工具的基本機制。他說,它只需要稍微調整一下,就可以弄清楚神經元為什麼決定進行某些搜尋引擎查詢或造訪特定網站。
「我們希望這將開闢一個有前途的途徑,來以一種自動化的方式解決可解釋性問題,讓其他人可以建立在上面並做出貢獻。」Wu 說,「我們希望我們真的能夠對這些模型的行為有好的解釋。」
以上是OpenAI開發新工具,試圖解釋語言模型的行為的詳細內容。更多資訊請關注PHP中文網其他相關文章!

机器学习是一个不断发展的学科,一直在创造新的想法和技术。本文罗列了2023年机器学习的十大概念和技术。 本文罗列了2023年机器学习的十大概念和技术。2023年机器学习的十大概念和技术是一个教计算机从数据中学习的过程,无需明确的编程。机器学习是一个不断发展的学科,一直在创造新的想法和技术。为了保持领先,数据科学家应该关注其中一些网站,以跟上最新的发展。这将有助于了解机器学习中的技术如何在实践中使用,并为自己的业务或工作领域中的可能应用提供想法。2023年机器学习的十大概念和技术:1. 深度神经网

实现自我完善的过程是“机器学习”。机器学习是人工智能核心,是使计算机具有智能的根本途径;它使计算机能模拟人的学习行为,自动地通过学习来获取知识和技能,不断改善性能,实现自我完善。机器学习主要研究三方面问题:1、学习机理,人类获取知识、技能和抽象概念的天赋能力;2、学习方法,对生物学习机理进行简化的基础上,用计算的方法进行再现;3、学习系统,能够在一定程度上实现机器学习的系统。

本文将详细介绍用来提高机器学习效果的最常见的超参数优化方法。 译者 | 朱先忠审校 | 孙淑娟简介通常,在尝试改进机器学习模型时,人们首先想到的解决方案是添加更多的训练数据。额外的数据通常是有帮助(在某些情况下除外)的,但生成高质量的数据可能非常昂贵。通过使用现有数据获得最佳模型性能,超参数优化可以节省我们的时间和资源。顾名思义,超参数优化是为机器学习模型确定最佳超参数组合以满足优化函数(即,给定研究中的数据集,最大化模型的性能)的过程。换句话说,每个模型都会提供多个有关选项的调整“按钮

截至3月20日的数据显示,自微软2月7日推出其人工智能版本以来,必应搜索引擎的页面访问量增加了15.8%,而Alphabet旗下的谷歌搜索引擎则下降了近1%。 3月23日消息,外媒报道称,分析公司Similarweb的数据显示,在整合了OpenAI的技术后,微软旗下的必应在页面访问量方面实现了更多的增长。截至3月20日的数据显示,自微软2月7日推出其人工智能版本以来,必应搜索引擎的页面访问量增加了15.8%,而Alphabet旗下的谷歌搜索引擎则下降了近1%。这些数据是微软在与谷歌争夺生

荣耀的人工智能助手叫“YOYO”,也即悠悠;YOYO除了能够实现语音操控等基本功能之外,还拥有智慧视觉、智慧识屏、情景智能、智慧搜索等功能,可以在系统设置页面中的智慧助手里进行相关的设置。

人工智能在教育领域的应用主要有个性化学习、虚拟导师、教育机器人和场景式教育。人工智能在教育领域的应用目前还处于早期探索阶段,但是潜力却是巨大的。

阅读论文可以说是我们的日常工作之一,论文的数量太多,我们如何快速阅读归纳呢?自从ChatGPT出现以后,有很多阅读论文的服务可以使用。其实使用ChatGPT API非常简单,我们只用30行python代码就可以在本地搭建一个自己的应用。 阅读论文可以说是我们的日常工作之一,论文的数量太多,我们如何快速阅读归纳呢?自从ChatGPT出现以后,有很多阅读论文的服务可以使用。其实使用ChatGPT API非常简单,我们只用30行python代码就可以在本地搭建一个自己的应用。使用 Python 和 C

人工智能在生活中的应用有:1、虚拟个人助理,使用者可通过声控、文字输入的方式,来完成一些日常生活的小事;2、语音评测,利用云计算技术,将自动口语评测服务放在云端,并开放API接口供客户远程使用;3、无人汽车,主要依靠车内的以计算机系统为主的智能驾驶仪来实现无人驾驶的目标;4、天气预测,通过手机GPRS系统,定位到用户所处的位置,在利用算法,对覆盖全国的雷达图进行数据分析并预测。


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

Dreamweaver CS6
視覺化網頁開發工具

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

Safe Exam Browser
Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

EditPlus 中文破解版
體積小,語法高亮,不支援程式碼提示功能

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),