>기술 주변기기 >일체 포함 >인위적인 컴퓨터 사용 : AI 조수 컴퓨터를 인수합니다

인위적인 컴퓨터 사용 : AI 조수 컴퓨터를 인수합니다

Jennifer Aniston
Jennifer Aniston원래의
2025-03-15 09:31:08840검색

Anthropic의 Claude AI는 컴퓨터를 제어 할 수있는 기능을 얻습니다. 혁신적인 업데이트를 통해 Claude는 화면을 "보고"하여 데스크탑, 클릭, 유형 및 스크롤을 탐색 할 수 있습니다. 이 베타 기능은 AI와 소프트웨어의 상호 작용을 변화시켜 생산성을 높이고 있습니다. 의인성 이이 기술의 잠재력을 탐구함에 따라 안전은 여전히 ​​가장 중요합니다.

인위적인 컴퓨터 사용 : AI 조수 컴퓨터를 인수합니다

목차

  • 컴퓨터 사용에 중점을 두는 이유는 무엇입니까?
  • AI 스크린 상호 작용 교육
  • 혁신과 안전 균형
  • Anthropic의 컴퓨터 사용이 어떻게 작동하는지
  • Anthropic의 컴퓨터 사용 능력
  • 한계와 도전
  • Claude와의 컴퓨터 사용 탐색 : 방법 및 예제
  • 메시지 API 사용
  • 참조 구현 : Docker Container
  • Docker와의 컴퓨터 사용 설정
  • 컴퓨터 사용 테스트
  • 의인성 QuickStarts 앱
  • 빠른 배포를 위해 회신하십시오
  • 사용 사례
  • 결론
  • 자주 묻는 질문

컴퓨터 사용에 중점을 두는 이유는 무엇입니까?

대부분의 일상 작업은 컴퓨터에서 발생합니다. AI가 인간처럼 소프트웨어를 사용하도록하면 엄청난 가능성이 있습니다. 이를 통해 사용자 정의 도구가 필요하지 않아 모든 프로그램을 원활하게 탐색 할 수 있습니다. 논리 및 이미지 인식의 AI 발전을 바탕으로 이전에 불가능한 위업에 대한 문을 여는 것입니다.

AI 스크린 상호 작용 교육

Claude의 컴퓨터 사용 기술은 혁신과 기술 전문 지식의 조화로 인한 것입니다. 멀티 모달 기능을 활용하여 연구원들은 Claude에게 컴퓨터 화면을 해석하여 시각적 데이터를 동작으로 변환했습니다. 주요 과제는 커서 제어를위한 정확한 픽셀 측정이었습니다. 간단한 소프트웨어부터 Claude는 이러한 기술을 일반화하여 놀라운 문제 해결 능력과 자기 교정을 보여줍니다. 훈련은 복잡했지만 결과는 인상적이며 Osworld와 같은 벤치 마크에서 최첨단 성과를 달성하지만 여전히 인간의 정확성과는 거리가 멀다.

인위적인 컴퓨터 사용 : AI 조수 컴퓨터를 인수합니다

혁신과 안전 균형

모든 AI 발전은 안전 문제를 제시합니다. 이 기능은 본질적으로 인지력을 증가시키지 않지만 실제 응용 분야의 장벽을 낮 춥니 다. 안전 평가는 AI 안전 수준 2에 Claude를 배치하여 추가 보호 장치가 즉각적으로 필요하지 않음을 나타냅니다. 그러나 미래의 발전은 위험을 증폭시켜 "프롬프트 주입"공격을 해결하는 것과 같은 사전 예방 적 취약성 완화가 필요할 수 있습니다. Anthropic의 Trust & Safety 팀은 잠재적 오용을 적극적으로 모니터링하여 남용 탐지 및 작업 지침을 구현합니다. 개발자는 모범 사례를 준수하도록 권장되며 데이터 개인 정보가 우선 순위가 지정됩니다. Claude는 기본적으로 사용자 데이터 또는 스크린 샷에 대한 교육을받지 않습니다.

Anthropic의 컴퓨터 사용 : 작동 방식

1. 도구 및 프롬프트 : API 요청에 의인성 정의 도구를 포함시키고 명확한 프롬프트를 제공합니다 (예 : "고양이 사진을 내 데스크탑에 저장").

2. 도구 선택 : Claude는 프롬프트를 평가하고 적절한 도구를 선택하여 공구 사용 요청 (형식 API 호출)을 만듭니다. stop_reason 필드는 도구 사용을 나타냅니다.

3. 도구 실행 및 결과 : 도구는 컨테이너 또는 VM에서 실행되어 tool_result 블록을 통해 결과를 Claude로 반환합니다.

4. 반복적 인 문제 해결 : Claude는 결과를 반복적으로 분석하고, 추가 도구 요구를 결정하며, 작업이 완료 될 때까지 GPT의 추론과 유사하게 반복합니다.

인위적인 컴퓨터 사용 : AI 조수 컴퓨터를 인수합니다

기능

Claude는 다음을 처리 할 수 ​​있습니다.

  1. 파일 조작 : Excel 파일에 액세스 및 편집, 스크린 샷 저장.
  2. 양식 자동화 : 양식 작성, 데이터 입력 자동화.
  3. 웹 스크래핑 : 자연어를 사용하여 웹 사이트 정보 추출.

한계와 도전

  • 의도하지 않은 작업 : Claude는 관련이없는 작업을 수행하여 지연을 일으킬 수 있습니다.
  • 무한 루프 : 해상도없이 반복적 인 동작, 자원 소비.
  • 위험 시나리오 : 민감한 작업 중 오류는 심각한 결과를 초래할 수 있습니다.

Claude와의 컴퓨터 사용 탐색

문서화는 메시지 API를 통해 컴퓨터 사용을 가능하게합니다.

메시지 API 사용

메시지 API는 프로그래밍 방식의 명령을 전송하여 Claude가 계산 리소스를 안전하게 활용할 수있게합니다. 권한, 입력 및 환경을 지정합니다.

코드 예제 (그림) :

 인물 수입

# ... (API 키 설정) ...

응답 = client.beta.messages.create (
    Model = "Claude-3-5-Sonnet-20241022",
    # ... (도구 정의 및 메시지) ...
))

인쇄 (응답)

도커 컨테이너 구현

Docker 컨테이너는 설정을 단순화하여 일관된 환경을 제공합니다. 이것은 Anthropic의 권장 접근법입니다.

Docker와의 컴퓨터 사용 설정

  1. Docker 설치 : Docker의 설치 안내서를 따르십시오. 가상화 지원이 활성화되어 있는지 확인하십시오.
  2. API 키를 얻으십시오 : 인류 콘솔에서 API 키를 얻으십시오.
  3. Docker 컨테이너 설정 : 제공된 Docker 명령을 사용하여 자리 표시자를 API 키로 교체하고 필요에 따라 경로를 조정하십시오.
  4. 응용 프로그램 액세스 : 브라우저의 매핑 된 포트를 통해 응용 프로그램에 액세스하십시오.
  5. 사용 모니터링 : API 신용 소비를 추적합니다.

인위적인 컴퓨터 사용 : AI 조수 컴퓨터를 인수합니다

컴퓨터 사용 테스트 (예제 및 비디오 임베딩은 여기로 이동)

인위적인 컴퓨터 사용 : AI 조수 컴퓨터를 인수합니다

인위적인 컴퓨터 사용 : AI 조수 컴퓨터를 인수합니다

(비디오 임베드는 여기로 갈 것입니다)

Anthropic QuickStarts 앱 및 Replit

대체 방법으로는 Anthropic QuickStarts 앱 (Lightweight, Extensible) 또는 Replit (클라우드 기반, 인스턴트 설정) 사용이 포함됩니다.

사용 사례 (비디오 임베드는 여기에 갈 것입니다)

결론

Anthropic의 컴퓨터 사용은 AI 자동화에서 중요한 도약을 나타냅니다. 도전은 여전히 ​​남아 있지만, 일상적인 컴퓨팅을 변화시킬 수있는 잠재력은 부인할 수 없습니다.

자주 묻는 질문 (여기에 포함될 것입니다)

위 내용은 인위적인 컴퓨터 사용 : AI 조수 컴퓨터를 인수합니다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.