>  기사  >  기술 주변기기  >  알고리즘 문서 2,500페이지 유출! 검색역사상 가장 강력한 블랙박스가 노출됐다. 구글은 또 뒤집히고 업그레이드될 것인가?

알고리즘 문서 2,500페이지 유출! 검색역사상 가장 강력한 블랙박스가 노출됐다. 구글은 또 뒤집히고 업그레이드될 것인가?

WBOY
WBOY원래의
2024-06-02 12:21:35755검색
Written by Noah

Produced | 51CTO Technology Stack(WeChat ID: blog51cto)

Google의 올해는 좋지 않은 한 해를 보내고 있습니다.

지난 이틀 동안 검색 엔진의 'AI 개요' 기능은 심각하게 부정확한 검색 결과 정보를 자주 제공했습니다. 예를 들어 사용자가 피자에서 치즈가 미끄러지는 것을 방지하기 위해 접착제를 사용하라고 제안하는 등의 터무니없는 내용을 제공했습니다. 이에 대해 피차이 CEO 역시 이것이 대형 언어 모델의 착각에 의한 것이라는 점을 인정해야 했으며, 현재로서는 해결책이 없다.

최근 Google 검색 엔진 내부 문서가 유출되어 Google 검색 엔진의 작동 메커니즘이 처음으로 대중에게 공개될 수도 있습니다. 이 기사는 여기에서 처음 게시되었습니다. Google은 아직 유출에 대한 공식적인 답변을 발표하지 않았으며 문서의 진위 여부에 대해 이의를 제기하지 않았습니다.

현재 인터넷에서 가장 유명한 검색 엔진인 Google이 웹사이트 순위를 매기는 방법에 대한 자세한 내용은 오랫동안 미스터리였습니다. 이러한 노출은 Google의 극비 검색 알고리즘 시스템과 그 운영 메커니즘이 Google의 이전 공개 성명을 어떻게 보완하는지를 엿볼 수 있는 새로운 관점을 제공합니다.

1.2500페이지의 유출된 문서

Google의 검색 알고리즘은 아마도 인터넷에서 가장 영향력 있는 시스템일 것입니다. 이는 웹사이트의 생존과 온라인 콘텐츠의 제공을 결정합니다. 그러나 Google이 웹 사이트 순위를 매기는 방법에 대한 구체적인 세부 사항은 항상 "블랙 박스"였습니다. 언론, 연구자, 검색 엔진 최적화에 종사하는 사람들의 다양한 추측이 있었지만 이들은 단지 코끼리를 알아내려는 시각 장애인에 불과합니다. . 우리는 완전한 퍼즐을 결코 볼 수 없습니다.

외신 The Verge에 따르면, 이번 폭발적인 유출로 인해 검색 기능 뒤에 숨은 미스터리가 처음으로 밝혀진 것으로 보이며, 이는 Google이 수년 동안 검색 기능의 작동 방식에 대해 완전히 솔직하지 않았음을 암시합니다. Google은 지금까지 문서의 진위 여부에 대한 여러 의견 요청에 응답하지 않았습니다.

SEO 분야에서 10년 넘게 일해 온 랜드 피쉬킨이 이번 사건의 주인공이다. 그는 검색 알고리즘 작동 방식에 대한 Google의 외부 '거짓말'을 폭로하기 위해 한 소식통이 2,500페이지의 문서를 그와 공유했다고 밝혔습니다.

Fishkin에 따르면 이 문서는 Google의 검색 API를 간략하게 설명하고 직원에게 제공되는 정보의 내용을 분류합니다. Fishkin이 공유하는 세부 정보는 복잡하고 기술적이며 개발자와 SEO 전문가가 일반 사람보다 이해하기 더 쉬울 수 있습니다.

유출 자체가 Google이 검색 순위를 위해 특정 데이터와 신호를 사용한다는 것을 반드시 증명하는 것은 아닙니다. 대신 유출된 문서는 Google이 웹 페이지, 사이트 및 검색자로부터 수집하는 데이터가 무엇인지 설명하고 SEO 전문가에게 Google의 초점에 대한 단서를 간접적으로 제공합니다.

2. Google의 공개 성명과 모순됨

SEO 전문가 Mike King이 문서 개요에 쓴 것처럼, 유출된 문서는 Google이 수집하고 사용하는 데이터 유형, Google이 다음과 같은 민감한 문제를 타겟팅하는 등 다양한 주제를 다루고 있습니다. 선거 주제에는 특정 웹사이트의 권한을 높이는 방법, Google이 소규모 웹사이트를 처리하는 방법 등이 포함됩니다.

더욱 우려되는 점은 Fishkin과 Mike King에 따르면 문서의 일부 정보가 Google의 공개 성명과 모순되는 것으로 보입니다.

"'거짓말'이라고 하기에는 너무 심각한 것일 수도 있지만, 이 경우에는 가장 적절한 단어입니다."라고 Mike King은 이렇게 표현했습니다. "나는 회사 비밀을 보호하려는 Google 홍보 담당자들의 노력을 이해합니다. 그러나 내가 받아들일 수 없는 것은 그들이 질문을 찾고 제기하는 마케팅, 기술 및 저널리즘 분야의 사람들을 폄하한다는 것입니다.” Google은 문서에 대한 직접적인 반박 요청을 포함하여 The Verge의 요청에 아직 응답하지 않았습니다. 문서의 진위. Fishkin은 The Verge에 보낸 이메일에서 Google이 유출의 진위 여부에 대해 이의를 제기하지 않았지만 직원이 사건에 대한 게시물의 일부 문구를 변경해달라고 요청했다고 말했습니다.

Google의 비밀 검색 알고리즘은 Google의 공개 지침을 따르고 전 세계 수백만 기업을 대상으로 SEO 전략을 실천하는 마케팅 담당자 업계를 탄생시켰습니다. 그러나 이러한 널리 사용되는 방법으로 인해 사람들은 점차 Google의 검색 결과가 악화되고 스팸 정보로 가득 차 있다는 느낌을 갖게 되었습니다.

웹사이트 운영자는 자신의 사이트가 공개되도록 하기 위해 이러한 유형의 콘텐츠를 제작해야 한다는 강박감을 느낍니다. 그러나 그러한 의심에 직면하여 Google의 외부 대변인은 항상 다음과 같은 친숙한 수사를 내놓을 것입니다. Google의 지침은 이를 명시하지 않습니다.

그러나 유출된 문서의 일부 세부 사항은 검색 기능 작동 방식에 대한 Google의 공개 진술의 정확성에 의문을 제기합니다.

Fishkin과 Mike King이 인용한 한 가지 예는 Google이 순위에 Chrome 데이터를 사용하는지 여부입니다. Google 담당자는 Chrome 데이터가 페이지 순위를 매기는 데 사용되지 않는다고 반복해서 밝혔지만 Chrome은 사이트가 검색에 표시되는 방식에 대한 섹션에 구체적으로 언급되어 있습니다.

사진

알고리즘 문서 2,500페이지 유출! 검색역사상 가장 강력한 블랙박스가 노출됐다. 구글은 또 뒤집히고 업그레이드될 것인가?위 스크린샷에서 문서에 따르면 메인 vogue.com URL 아래에 나타나는 링크는 Chrome 데이터를 사용하여 생성되었을 수 있습니다.

또 다른 우려 사항은 순위에서 E-A-T(Expertise, Authority, Trustworthiness)가 하는 역할입니다. 우리 모두 알고 있듯이 E-A-T는 수년 동안 Google 검색 품질 평가 지침의 초석이었습니다.

Google 담당자는 이전에 E-A-T가 순위 요소가 아니라고 밝혔습니다. Fishkin은 문서에서 E-A-T에 대한 직접적인 언급을 많이 찾지 못했다고 지적했습니다.

또한 Google 담당자는 이전에 어트리뷰션은 순위에 영향을 미치지 않기 때문에 어트리뷰션은 Google이 아니라 웹사이트 소유자가 독자를 위해 해야 할 일이라고 주장한 바 있습니다. 그러나 그것은 사실이 아닌 것 같습니다.

Mike King은 Google이 페이지에 대한 작성자 데이터를 수집하는 방법을 자세히 설명하고 파일에 엔터티가 작성자인지 여부를 식별하는 데 사용되는 필드가 있음을 지적했습니다. 이 필드는 주로 뉴스 기사용으로 설계되었지만 다른 항목도 다룹니다. 과학 기사 등. 이는 속성이 명시적인 순위 요소임을 확인하지는 않지만 Google이 최소한 이 속성을 면밀히 추적하고 있음을 시사합니다.

3. 검색 알고리즘 혁신, 그 이후로 인터넷 생태계는 '변화'했습니다.

이 문서는 결정적인 증거는 아니지만 심층적이고 필터링되지 않은 관점을 제공하여 이 극비 블랙박스 시스템을 엿볼 수 있습니다. .

사실 지난 2년 동안 Google 검색은 일련의 주요 업데이트를 경험했으며 그중 일부는 전례 없는 파괴적인 업데이트이기도 합니다. 예를 들어, 이 글의 시작 부분에서 언급했듯이 많은 비판을 받았던 “AI 개요” 기능은 가장 대표적인 혁신 중 하나입니다.

변화 초기에 구글의 리더인 피차이는 앞으로 구글 검색이 여러분의 많은 질문에 대해 자체 생성된 AI 답변을 제공할 것이라고 말하며 이 제품 기능에 대한 강한 자신감을 표명했습니다.

Google 대변인은 BBC에 변경 사항이 사용자에게 도움이 될지 확인하기 위해 엄격한 테스트를 거친 후에만 검색 변경 사항을 출시할 것이며 웹사이트 소유자에게 검색 순위 기회에 대한 도움말, 리소스 및 피드백을 제공한다고 말했습니다.

하지만 현실은 늘 이상과 어긋나죠.

AI 개요 기능에 대한 '치명적인 환각'인지, 유출 의심 문서에 담긴 '일관되지 않은' 정보인지, 구글 검색에 대한 사람들의 의심과 경계심을 불러일으키고 있다.

인터넷 발전의 전체 역사를 되돌아보면, Google과 같은 회사는 이 푸른 별에 있는 대부분의 사람들이 정보를 얻는 방식을 바꾸었을 뿐만 아니라 콘텐츠 생성 및 배포 패턴도 바꾸었습니다.

생성 AI 기반 검색을 예로 들면 Google은 이러한 기술 혁신을 사용하여 사용자와 정보를 보다 효율적으로 연결하고 검색 경험의 전반적인 품질을 향상시키는 것을 목표로 하는 것 같습니다.

그러나 실제로 비평가들이 말했듯이 이러한 변화는 정보의 동질성을 악화시키고 사용자가 웹 탐색의 깊이와 폭을 줄일 수 있습니다. 사용자가 직접 대면보다는 Google에서 직접 제공하는 짧은 답변에 점점 더 의존하게 되기 때문입니다. 웹사이트. 이는 독립적인 웹사이트와 블로그의 가시성과 수익 모델을 약화시킬 뿐만 아니라 온라인 생태계의 건전성과 다양성에 영향을 미쳐 사용자가 다양한 관점과 심층 분석에 노출될 기회를 제한할 수 있습니다.

Google만큼 강력한 검색 플레이어의 경우 검색 알고리즘 최적화가 대중에게 서비스를 제공할 뿐만 아니라 인터넷에 고품질 콘텐츠를 제공하는 생태학적 초석을 파괴하지 않도록 하는 방법이 장기적인 개발의 열쇠가 될 수 있습니다.

참조 링크:

https://www.theverge.com/2024/5/28/24166177/google-search-ranking-algorithm-leak-documents-link-seo

https://www .php.cn/link/c30ca4400db3c72274c8ad819f688c21

AIGC에 대해 자세히 알아보려면 다음을 방문하세요.

51CTO AI.x Community

https://www.51cto.com/aigc/

위 내용은 알고리즘 문서 2,500페이지 유출! 검색역사상 가장 강력한 블랙박스가 노출됐다. 구글은 또 뒤집히고 업그레이드될 것인가?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.