澳大利亞技術專家傑里米·霍華德(Jeremy Howard)提出了一個新的標準llms.txt
,旨在改善大型語言模型(LLMS)訪問和索引網站內容。該標準類似於robots.txt
和XML站點地圖,旨在簡化LLMS的過程,減少其資源的壓力,同時為網站所有者提供更多控制權。一個關鍵功能是“完整內容變平”,為品牌和內容創建者提供了好處。
儘管該提案引起了極大的興趣,但它也面臨批評。但是,鑑於AI生成的含量的快速發展, llms.txt
值得仔細考慮。
AI網站內容可訪問性的新標準
關於內容創建者權利和數據控制的討論,尤其是關於LLM培訓數據的討論,在SXSW Interactive 2024中獲得了動力。儘管存在其他建議,但llms.txt
(前面介紹)為增加內容控制提供了更簡單的解決方案。這些建議不是互斥的,但是llms.txt
在其發展中似乎更為先進。
霍華德的提案利用簡單的標記來創建網站爬網和索引標準。隨著LLM的消費和生成大量的Web內容,網站所有者越來越多地尋求更好地控制其數據的使用方式。 llms.txt
的目的是通過允許LLMS減少爬網和更多地關注其核心“智能”功能來解決這一問題。
本文探討了:
-
llms.txt
是什麼及其功能。 - 它在實踐中的工作方式。
- 關於其價值的不同觀點。
- LLM和網站所有者的當前採用率。
- 為什麼它值得關注。
了解llms.txt
及其功能
霍華德的提議指出:“大型語言模型越來越依賴網站信息,但是面對關鍵的限制:上下文窗口太小,無法完整地處理大多數網站。將復雜的HTML頁面與導航,ADS和JavaScript轉換為LLM友好型純文本,既困難又不精確...我們建議添加A /llms.txt
Markdey Firce to a /llm offiry wird offry wird offry offry offry友好llmmmieldlmmm firm llmmmield offrmm fird llmm firce''''''''''''''''''''''''''''
llms.txt
允許網站所有者指定AI模型如何訪問和使用其內容。與robots.txt
不同,它不會阻止訪問,而是指導內容如何顯示給AI平台。這可能涉及根據網站結構組織的一個或多個文件中的一個或多個文件中的特定部分,摘要或完整的網站文本。
一個示例顯示了一個超過100,000個單詞的llms.txt
文件,其中包含整個網站扁平的文本。但是,根據網站內容,文件大小可能會大不相同。也可以創建單個頁面的降價(.md)版本。
生成llms.txt
或llms-full.txt
文件
該過程的簡單性值得注意。它將網站減少到其核心文本本質,簡化各種應用程序的解析,包括內容開發,網站分析和實體研究。標準化方法允許網站所有者控制LLM的使用方式。
該協議正在吸引科技領導者和SEO專業人員之間。它增強相關性的潛力有益於LLM,網站所有者和尋求更準確信息的用戶。 llms.txt
在網站的根目錄中使用簡單的文本文件時的功能類似於robots.txt
,但要理解robots.txt
指令不包含在llms.txt
中。
llms.txt
實施的示例:
幾個著名的組織已經採用或正在探索llms.txt
,包括擬人,擁抱的臉,困惑和Zapier。 llms.txt
HUB是使用此標準識別AI開發人員的資源。
生成llms.txt
文件的工具:
幾種工具有助於生成llms.txt
文件,從較小網站的免費選項到較大較大的網站的自定義解決方案。網站所有者還可以開發自己的工具。但是,在部署之前,對任何外部工具的徹底安全審查至關重要。示例包括Markdowner,Aptify,網站LLM(WordPress插件)和FireCrawl。
SEO和GEO的意義
控制AI模型與網站內容交互的方式至關重要。扁平的網站版本簡化了AI提取,培訓和分析。好處包括:
- 保護專有內容:(適用於合規性LLM)
- 品牌聲譽管理:理論上提供了對AI生成的響應中信息如何出現的控制。
- 增強的語言和內容分析:促進了各種分析,例如關鍵字頻率和實體分析。
- 改進的AI相互作用:使LLM能夠檢索準確且相關的信息。
- 提高內容可見性:有可能提高AI驅動搜索結果的可見性。
- 更好的AI性能:確保LLMS訪問有價值的內容,從而獲得更準確的響應。
- 競爭優勢:將網站定位為更高的AI-Ready。
挑戰和局限性
儘管有潛力,但llms.txt
仍面臨挑戰:
- AI公司的收養:並非所有的AI公司都可以遵守。
- 網站採用:網站所有者的廣泛採用對於成功至關重要。
-
與其他協議重疊:潛在的與
robots.txt
和XML站點地圖的衝突。 - 濫用的潛力:關鍵字填充或其他操縱技術的可能性。
- 接觸競爭者:促進更容易的競爭分析。
一些SEO/GEO專業人員表示保留,認為LLMS和搜索引擎之間的區別是模糊的,使llms.txt
相關性較小。其他人則認為現有協議(例如robots.txt
和XML站點地圖)就足夠了。
llms.txt
和AI內容治理的未來
llms.txt
代表了平衡AI創新與內容所有權的早期嘗試。它的廣泛採用取決於行業支持,網站所有者的參與,監管發展和AI公司合規性。保持知情和調整內容策略對於網站所有者至關重要。
llms.txt
有助於更透明和受控的AI內容生態系統。主動實施保障數字資產並改善了LLM與網站的交互。 AI相互作用的定義策略對於在線搜索和內容分佈的不斷發展的景觀至關重要。
llms.txt
可能會引入一定程度的科學嚴謹性,目前缺乏既定的標準和實踐。它在一個越來越依賴LLM的世界中提供了潛在的優勢來檢索信息。儘管廣泛採用仍然不確定,但潛在的收益足以保證考慮和實施。
以上是認識LLMS.TXT,這是AI網站內容爬網的擬議標準的詳細內容。更多資訊請關注PHP中文網其他相關文章!

最近的一項腐爛調查表明,大多數營銷領導者正在根據不斷發展的搜索景觀來調整其策略。 人工智能搜索,搜索碎片和潛在的Google反托拉斯動作的興起正在推動此SH

製作2025年的引人注目的標題:在人群中脫穎而出 在2025年,有效的SEO不僅需要關鍵字。 為了提高點擊率並保持搜索排名,您的標題標籤需要簡潔,迷人和精確的refl

希望您的內容被AI搜索引擎和代理商發現和使用嗎? 傳統的SEO策略不足; AI系統處理信息的方式不同。本指南概述了保持內容可見性和排名的重要優化

SEO指導:一種強大的,經常被忽視的資產 在不斷發展的SEO景觀中,指導為經驗豐富的專業人員和新移民提供了重要的優勢。 這種強大的工具可以加速增長,磨練技能並增強利潤

ChatGPT搜索引流效果显著,尤其利好教育、科技和软件开发类网站。Semrush基于2024年下半年8000万条全球点击流数据分析显示,截至11月,ChatGPT已为超过3万个独立域名带来更多流量。 搜索行为变化: ChatGPT约54%的查询未开启搜索功能,其余46%使用了搜索。 平均ChatGPT提示词长度为23个单词,最长达2712个单词。 平均ChatGPT搜索词长度则短得多,仅为4.2个单词,最长为301个单词。 搜索意图转变: 传统搜索关键词具有明确的意图(导航、信息、商业

Google Business Profiles現在集成了Google Product Studio,這是一種生成的AI工具,可讓您通過AI驅動的背景場景更改增強產品圖像。 此功能,已經在Google Merchant Center和Google廣告中提供了

Openai的Chatgpt搜索:現在沒有帳戶並準備成長 OpenAI已將其ChatGpt搜索隨時提供給所有人,從而消除了對登錄或帳戶創建的需求。 X(以前為Twitter)上宣布的重大更新允許

創建者管理平台Grin的一項新調查表明,Z Gen Gens Oventer偏愛Instagram和Tiktok而不是Google進行產品發現。 主要發現:在18至27歲的孩子中,產品發現習慣表現出對社交M的強烈偏愛


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

Safe Exam Browser
Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

禪工作室 13.0.1
強大的PHP整合開發環境

SublimeText3 Linux新版
SublimeText3 Linux最新版