찾다
백엔드 개발파이썬 튜토리얼모든 웹사이트를 사용할 수 있는 AI 에이전트를 구축하는 방법

AI 에이전트를 웹에 연결: 개발자의 여정과 컴퓨터 사용의 증가

지난 2년 동안 AI 에이전트 개발의 주요 장애물 중 하나는 안정적인 웹 액세스 권한 부여였습니다. 이메일을 보내도록 설계된 AI 에이전트를 생각해 보세요. 이를 Gmail이나 Outlook에 어떻게 연결합니까? API, 웹사이트, 자율 웹 에이전트? 이 기사에서는 다양한 방법을 살펴봅니다.

API 및 SDK: 제한된 접근 방식

많은 개발자가 API와 SDK를 활용합니다. 이는 짧은 대기 시간과 강력한 인증을 제공하지만 제한 사항이 있습니다.

  • API 사용 불가능: 모든 웹 서비스가 API를 제공하는 것은 아닙니다.
  • 문서화 문제: 오래되었거나 잘못 작성된 문서가 일반적입니다.
  • 기능 격차: API에는 해당 웹사이트의 전체 기능이 부족하여 특정 작업을 방해하는 경우가 많습니다.

다행히도 여러 서비스에서 API 호출 라이브러리를 제공합니다.

  • Composio: 강력한 인증을 갖춘 AI 에이전트를 위한 도구를 제공합니다.
  • Langchain 도구: Langchain/그래프 에이전트를 위한 리소스
  • Apify: 방대한 커뮤니티 기반 API 라이브러리

그러나 보편적인 웹 서비스 접근을 위해서는 API를 넘어서야 합니다.

웹사이트 상호작용: 인간적 접근 방식

신뢰할 수 있는 AI 에이전트 웹사이트 상호작용을 통해 모든 웹 기반 인간 작업을 자동화할 수 있습니다. 그런데 어떻게요?

많은 개발자가 처음에는 Selenium이나 Playwright와 같은 브라우저 테스트 프레임워크를 사용합니다. 그러나 이 접근 방식은 다음과 같은 과제에 직면해 있습니다.

  • 취약성: 웹사이트 변경(예: A/B 테스트)으로 인해 스크립트가 쉽게 중단됩니다.
  • 탐지 가능성: 테스트 브라우저는 쉽게 식별되고 차단됩니다.
  • 프로덕션 배포: 브라우저 호스팅, 인증 관리, 프록시 순환은 프로덕션에서 복잡합니다.

이러한 문제를 해결하기 위해 우리는 다음과 같은 브라우저 SDK를 실험했습니다.

  1. 깨지기 쉬운 CSS 선택기 대신 자연어 선택기(예: get_element("find the login button"))를 사용합니다.
  2. 내장 인증을 통합합니다.
  3. 차단을 방지하기 위해 회전 프록시가 내장되어 사전 구성된 원격 호스팅을 제공합니다.

현재 오픈 소스(Dendrite SDK)인 이 작업은 더 이상 적극적으로 개발되지 않지만 연구 및 적용이 가능합니다. 유사한 대안은 다음과 같습니다.

  • AgentQL: Python 라이브러리
  • 스테이지핸드: JavaScript/TypeScript 라이브러리

컴퓨터 사용: 웹 AI 에이전트의 미래는?

Rich Sutton의 'Bitter Lesson'은 향상된 컴퓨팅으로 확장 가능한 일반화 가능한 AI 솔루션의 우위를 강조합니다. Anthropic의 Computer Use는 이 원칙을 구현하여 LLM이 마우스 및 키보드 입력을 사용하여 컴퓨터/브라우저를 직접 제어할 수 있도록 하여 스크립트 및 API 호출이 필요하지 않도록 합니다. 그들의 접근 방식은 작업별 도구보다 일반적인 컴퓨터 기술을 강조합니다. 이는 가장 다재다능한 AI 에이전트가 인간처럼 웹과 직접 상호 작용할 것임을 시사하는 Bitter Lesson과 완벽하게 일치합니다. 초기 결과는 잘 만들어진 프롬프트를 사용하여 복잡한 작업에서 높은 신뢰성을 보여주며 종종 Anthropic의 프롬프트 개선 기능을 통해 향상됩니다.

결론: 미래를 품다

API는 여전히 가치가 있지만 미래에는 대부분의 AI 에이전트에 대해 컴퓨터 사용과 유사한 접근 방식이 선호될 가능성이 높습니다. 상담원이 로그인하여 웹사이트의 검색 기능을 사용하여 상위 결과에서 결론을 추출할 수 있다면 왜 API를 통해 전체 데이터베이스에 의존합니까? AI 개발자의 질문은 이러한 일반화 가능한 접근 방식을 수용할지, 아니면 보다 전문적인 방법의 한계에 직면할지 여부입니다.

참고: 이것은 내 첫 번째 개발자 게시물입니다. 향후 게시물 개선에 대한 피드백을 환영합니다. AI 에이전트나 AI 기반 작업 자동화에 대한 질문도 권장됩니다. How to Build AI Agents that can Use any Website How to Build AI Agents that can Use any Website How to Build AI Agents that can Use any Website How to Build AI Agents that can Use any Website

위 내용은 모든 웹사이트를 사용할 수 있는 AI 에이전트를 구축하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
Python의 병합 목록 : 올바른 메소드 선택Python의 병합 목록 : 올바른 메소드 선택May 14, 2025 am 12:11 AM

Tomergelistsinpython, youcanusethe operator, extendmethod, listcomprehension, oritertools.chain, 각각은 각각의 지위를 불러 일으킨다

Python 3에서 두 목록을 연결하는 방법은 무엇입니까?Python 3에서 두 목록을 연결하는 방법은 무엇입니까?May 14, 2025 am 12:09 AM

Python 3에서는 다양한 방법을 통해 두 개의 목록을 연결할 수 있습니다. 1) 작은 목록에 적합하지만 큰 목록에는 비효율적입니다. 2) 메모리 효율이 높지만 원래 목록을 수정하는 큰 목록에 적합한 확장 방법을 사용합니다. 3) 원래 목록을 수정하지 않고 여러 목록을 병합하는 데 적합한 * 운영자 사용; 4) 메모리 효율이 높은 대형 데이터 세트에 적합한 itertools.chain을 사용하십시오.

Python은 문자열을 연결합니다Python은 문자열을 연결합니다May 14, 2025 am 12:08 AM

join () 메소드를 사용하는 것은 Python의 목록에서 문자열을 연결하는 가장 효율적인 방법입니다. 1) join () 메소드를 사용하여 효율적이고 읽기 쉽습니다. 2)주기는 큰 목록에 비효율적으로 운영자를 사용합니다. 3) List Comprehension과 Join ()의 조합은 변환이 필요한 시나리오에 적합합니다. 4) READE () 방법은 다른 유형의 감소에 적합하지만 문자열 연결에 비효율적입니다. 완전한 문장은 끝납니다.

파이썬 실행, 그게 뭐야?파이썬 실행, 그게 뭐야?May 14, 2025 am 12:06 AM

pythonexecutionissprocessoftransformingpythoncodeintoExecutableInstructions.1) the -interreadsTheCode, ConvertingItintoByTecode, thethepythonVirtualMachine (pvm)을 실행합니다

파이썬 : 주요 기능은 무엇입니까?파이썬 : 주요 기능은 무엇입니까?May 14, 2025 am 12:02 AM

Python의 주요 특징은 다음과 같습니다. 1. 구문은 간결하고 이해하기 쉽고 초보자에게 적합합니다. 2. 개발 속도 향상, 동적 유형 시스템; 3. 여러 작업을 지원하는 풍부한 표준 라이브러리; 4. 광범위한 지원을 제공하는 강력한 지역 사회와 생태계; 5. 스크립팅 및 빠른 프로토 타이핑에 적합한 해석; 6. 다양한 프로그래밍 스타일에 적합한 다중-파라 디그 지원.

파이썬 : 컴파일러 또는 통역사?파이썬 : 컴파일러 또는 통역사?May 13, 2025 am 12:10 AM

Python은 해석 된 언어이지만 편집 프로세스도 포함됩니다. 1) 파이썬 코드는 먼저 바이트 코드로 컴파일됩니다. 2) 바이트 코드는 Python Virtual Machine에 의해 해석되고 실행됩니다. 3)이 하이브리드 메커니즘은 파이썬이 유연하고 효율적이지만 완전히 편집 된 언어만큼 빠르지는 않습니다.

루프 대 루프를위한 파이썬 : 루프시기는 언제 사용해야합니까?루프 대 루프를위한 파이썬 : 루프시기는 언제 사용해야합니까?May 13, 2025 am 12:07 AM

USEAFORLOOPHENTERATINGOVERASERASERASPECIFICNUMBEROFTIMES; USEAWHILLOOPWHENTINUTIMONDITINISMET.FORLOOPSAREIDEALFORKNOWNSEDINGENCENCENS, WHILEWHILELOOPSSUITSITUATIONS WITHERMINGEDERITERATIONS.

파이썬 루프 : 가장 일반적인 오류파이썬 루프 : 가장 일반적인 오류May 13, 2025 am 12:07 AM

Pythonloopscanleadtoerrors likeinfiniteloops, modifyinglistsdizeration, off-by-by-byerrors, zero-indexingissues, andnestedloopineficiencies.toavoidthese : 1) aing'i

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

SublimeText3 Linux 새 버전

SublimeText3 Linux 새 버전

SublimeText3 Linux 최신 버전

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.

MinGW - Windows용 미니멀리스트 GNU

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.

DVWA

DVWA

DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는