많은 기대를 모았던 구글의 반격이 다가오고 있습니다.
이제 구글 검색에 드디어 AI 대화 기능이 추가되어 대기열 채널이 오픈되었습니다.
물론 이것은 단지 첫 번째 단계일 뿐입니다.
큰 것은 아직 오지 않았습니다:
새로운 대형 언어 모델 PaLM 2가 공식적으로 공개되었으며 Google은 일부 작업에서 GPT-4를 능가한다고 주장합니다.
Bard의 기능이 크게 업데이트되어 더 이상 줄을 설 필요가 없으며 새로운 언어도 지원됩니다.
Google 버전의 AI 사무 보조원도 출시되어 Gmail에 처음으로 표시될 예정입니다.
Google Cloud는 업계에 추가적인 생성 AI 서비스를 제공하기 위해 여러 가지 기본 대규모 모델도 출시했습니다...
최근 I/O 개발자 컨퍼런스에서 Google의 큰 발표는 정말 충격적이었습니다.
일부 네티즌들은 직접 이렇게 말했다.
AI 전쟁이 본격화됐다.
어떤 사람들은 이렇게 말했습니다.
이제 ChatGPT 비용을 지불한 것을 후회합니다.
기자회견 후 구글의 주가는 4% 이상 상승했습니다.
PaLM 2가 올해 I/O 컨퍼런스의 최우선 과제임에는 의심의 여지가 없으며 Pichai가 직접 소개했습니다.
현재 Bard와 25개 이상의 Google AI 제품 및 기능이 이제 PaLM 2에서 기본 기술로 지원됩니다.
현재 Google의 가장 발전된 대형 모델인 PaLM 2는 Pathways 아키텍처를 기반으로 하며 JAX를 통해 TPU v4를 기반으로 구축된 PaLM의 업그레이드 버전입니다.
보고서에 따르면 PaLM 2는 100개 이상의 언어로 교육을 받았으며, 이를 통해 언어 이해, 생성 및 번역 능력이 향상되고 상식 추론 및 수학적 논리 분석에 더 능숙해질 것입니다.
PaLM 2의 데이터 세트에는 많은 수학적 표현을 다루는 수많은 논문과 웹 페이지가 포함되어 있다고 Google은 말했습니다. PaLM 2는 이 데이터에 대한 교육을 받은 후 쉽게 수학적 문제를 해결하고 그래프를 만들 수도 있습니다.
프로그래밍 측면에서 PaLM 2는 이제 Python, JavaScript 및 기타 일반 언어는 물론 Prolog, Fortran 및 Verilog와 같은 20개의 프로그래밍 언어를 지원합니다.
이번에 Google은 PaLM 2를 네 가지 크기로 출시했습니다.
그들은 규모를 표현하기 위해 다양한 동물을 사용합니다. 가장 작은 것은 "도마뱀붙이"이고 가장 큰 것은 "유니콘"입니다.
"Gecko" 버전은 매우 가볍고 오프라인을 포함하여 모바일 장치에서 빠르게 실행할 수 있으며 초당 20개의 토큰을 처리할 수 있습니다.
DeepMind 부사장은 I/O 컨퍼런스 전 기자회견에서 다음과 같이 말했습니다.
우리는 더 큰 모델이 항상 더 좋은 것은 아니라는 사실을 발견했으며, 이것이 우리가 다양한 크기의 다양한 모델을 제공하기로 결정한 이유입니다.
이는 PaLM 2를 미세 조정하기가 더 쉬워져 더 많은 제품과 애플리케이션을 지원할 수 있다는 의미입니다.
I/O 컨퍼런스에서 Google은 현재 25개 이상의 제품과 애플리케이션이 PaLM 2의 기능을 사용하고 있다고 발표했습니다.
구체적인 표현 형태는 Duet AI입니다.
다양한 사무용 소프트웨어에 내장될 수 있는 AI 비서인 마이크로소프트 365 코파일럿(Microsoft 365 Copilot)의 벤치마크 제품으로 이해하면 된다.
Google은 기자회견에서 Gmail, Google Docs, Google Sheets에서 Duet AI의 기능을 시연했습니다.
프롬프트에 따른 이메일 콘텐츠 보완, PPT 생성, 프롬프트에 따른 그림 자료 생성, 원클릭 양식 생성 등을 포함합니다.
마찬가지로 이 AI 도우미는 프로그래밍 지원도 제공할 수 있습니다. Google Cloud를 기반으로 실시간으로 코드 블록을 추천 및 수정하고 프로그래밍 질문에 대화식으로 답변할 수 있습니다. 현재 Go, JavaScript, Python 및 SQL을 지원합니다.
또한 Google은 PaLM 2를 기반으로 전문 분야의 대형 모델도 출시했습니다.
Google 의료팀은 Med-PaLM 2를 구축했습니다. 미국 의료 면허 시험에서 전문가 수준에 도달한 최초의 대규모 언어 모델이라고 하며, 다양한 의학 관련 질문에 답할 수 있습니다.
Google은 현재 자율적으로 엑스레이를 검사하고 진단하는 등 다중 모드 기능을 향상시키기 위해 노력하고 있습니다. 이 모델은 올 여름 후반에 소규모 Google Cloud 사용자 그룹에게 제공될 예정입니다.
또 다른 전문 대형 모델은 Sec-PaLM 2입니다.
잠재적인 악성 스크립트를 분석 및 해석하고 스크립트의 위험성을 감지할 수 있는 네트워크 보안 유지 관리를 위한 대규모 모델입니다.
이제 PaLM 2의 뛰어난 성능을 시연한 후, 이제 열어서 사용하는 방법에 대해 이야기해보겠습니다.
Google은 이제 PaLM API 인터페이스, Firebase 및 Colab을 통해 PaLM 2를 사용할 수 있다고 밝혔습니다.
ChatGPT에 대해 벤치마킹된 Bard가 마침내 평가판 대기열을 취소하고 전 세계 180개 이상의 국가 및 지역에서 완전히 오픈되었습니다.
프로그래머들의 극찬을 받은 새로운 다크 모드: (수동 개머리)
바드는 영어 이상으로 접근 범위를 확장한 것 외에도 일본어와 한국어로 직접 대화하는 기능을 추가했습니다. 구글은 곧 중국어를 포함해 40개 언어 버전을 추가할 것이라고 밝혔다.
Bard는 오늘부터 PaLM 2에 완전히 연결될 예정이므로 프로그래밍 및 추론 능력도 크게 향상되었으며 코드 생성, 디버깅 및 해석이 더욱 전문적(프로그래머가 인정하는) 수준입니다.
다른 코드를 참조하는 체스에서 "학자의 친구" 동작을 작성하기 위해 Python을 사용하도록 요청하면 사용자의 편의를 위해 관련 링크를 제공합니다.
코드에서 이해하지 못하는 기능에 대해 추가 질문을 하거나, 개선할 수 있는지 물어보거나, 모든 것을 하나의 코드 블록으로 병합하도록 요청할 수 있습니다.
그러나 가장 놀라운 점은 개발자의 요청에 따라 원클릭 가져오기 기능이 추가되었다는 점입니다.
이제 Bard에서 생성한 코드를 Colab으로 직접 내보낼 수 있습니다.
코드 외에도 이메일 초안, 양식 등 Bard로 생성한 모든 콘텐츠를 Gmail, Docs, Sheets로 직접 드래그할 수도 있습니다.
그런데 이제 Bard는 답변에 그림도 지원합니다. 여행 가이드에 대해 물어볼 때 가장 편리한 점:
사진으로 답변하는 것 외에도 강아지 두 마리의 사진을 업로드하는 등 직접 사진을 던질 수도 있고 재미있는 이야기를 만드는 데 도움이 될 수도 있습니다.
이 기능은 Google Lens(기계가 "사진을 보고 말하는" 방법을 학습할 수 있는 AI 애플리케이션)에 의해 구동됩니다.
Google Lens 외에도 Docs, Drive, Gmail, Maps 등 다양한 Google 자체 애플리케이션 기능도 Bard에 통합되어 있습니다.
예를 들어 Bard의 답변에서는 Google 지도를 직접 사용하여 여러 대학의 지리적 위치를 확인할 수 있습니다.
이제는 다양한 Google 제품을 사용해야 하는 것처럼 느껴지지만 Bard만 사용하면 충분합니다.
Bard는 자체 애플리케이션 외에도 이번에 Adobe Firefly를 옮겼으며 저작권이 있는 다양한 크리에이티브 이미지를 대화를 통해 "손끝에서" 사용할 수 있습니다.
수천 건의 통화, Google 검색 기능 마침내 AI 대화가 활성화되었습니다.
“3세 미만 아이와 강아지가 있는 가족이라면 브라이스 캐니언이나 아치스 국립공원 중 어느 곳을 가는 것이 좋을까요?”
이 질문은 따로 남겨두셔야 할 수도 있습니다 다양하게 나누어 보세요 작은 질문을 던지고 검색 엔진을 사용하여 많은 양의 정보를 정리하여 마침내 답을 찾습니다.
이제 Google에서는 한 단계로 이를 수행할 수 있습니다.
사진에서 볼 수 있듯이 Google 검색은 단순히 찾은 답변을 이동한 것이 아니라 어린이와 개라는 두 가지 요소를 고려하여 정리된 답변을 제공했습니다. 예를 들어
브라이스 캐니언이 두 개 있습니다. -친화적인 루프는 또한 매우 유모차 친화적입니다. 아치스 국립공원(Arches National Park)에서는 트레일의 대부분 구간에 애완동물이 허용되지 않습니다. 두 곳 모두 애완동물을 목줄에 묶어야 합니다.
각 문장에는 볼 수 있는 특정 기반 링크가 있습니다:
또한 여러 웹사이트에서 네티즌이 게시한 전략 링크도 표시됩니다.
가장 중요한 점은 "후속 요청" 버튼을 클릭하여 답변에 대한 추가 대화형 질문을 할 수 있다는 것입니다.
새로운 Google 검색을 활용한 쇼핑은 합리적인 구매 결정을 신속하게 내리는 데 도움이 되기 때문에 매우 재미있습니다.
예를 들어, "5마일 산악 출퇴근용 자전거"를 원할 경우 다음과 같이 선택하기 전에 고려해야 할 중요한 요소를 먼저 알려줍니다.
디자인 살펴보기: 전기 자전거, 로드바이크, 하이브리드 자전거 등 출퇴근에 적합합니다.
둘째, 모터와 배터리를 살펴보고, 셋째, 충격 흡수를 위한 서스펜션을 살펴보세요.
그러면 고객님에게 적합한 차량을 추천해드리며, 추천 시 구체적인 제품 설명, 최신 리뷰, 가격, 사진 등 종합적인 정보도 제공해드립니다.
빨간색 전기자전거 등 추가 질문도 할 수 있으며 답변이 더욱 최적화됩니다.
이 기능은 전 세계의 상품 목록을 수집하고 지속적으로 업데이트하는 Google의 쇼핑 비교 상품인 쇼핑 그래프를 기반으로 합니다.
Google은 업데이트된 AI 검색 인터페이스에 여전히 광고가 포함될 것이라고 솔직하게 언급했지만 걱정하지 마세요. 전용 광고 슬롯에만 표시되며 검색 결과에는 혼합되지 않습니다.
마지막으로 이 새로운 기능은 현재 Google Search Labs에서만 시험판으로 적용할 수 있으며 미국 사용자에게만 제한됩니다.
올해 I/O 컨퍼런스에서도 Google Cloud의 콘텐츠가 눈길을 끕니다.
대량의 AI 기능을 업데이트한 후 Google은 클라우드 머신 러닝 플랫폼 Vertex AI를 위한 세 가지 새로운 대형 모델을 출시했습니다.
Codey: 프로그래머의 코드 작성을 돕는 텍스트-코드
Imagen: 텍스트-이미지 , 고품질 이미지 생성
Chirp: 음성을 텍스트로 변환, 의사소통 촉진
코드 생성, Google Photo Intelligence Editor 등 이 세 모델의 기능은 오늘 기자회견에서 실제로 시연되었습니다.
Vertex AI에서는 현재 임베디드 텍스트 및 이미지 API도 사용할 수 있습니다. 이 도구를 사용하면 텍스트와 이미지 데이터를 다차원 수치 벡터로 변환하고 의미론적 관계를 매핑함으로써 개발자가 더욱 흥미로운 응용 프로그램을 만들 수 있습니다.
Google은 RLHF 기능을 관리형 서비스의 엔드투엔드 기계 학습 플랫폼에 통합한 최초의 기업이라고 주장합니다. 장점은 기업이 RLHF를 사용하여 보상 모델을 신속하게 훈련하여 기본 모델을 미세 조정할 수 있다는 것입니다. 이는 산업 응용 분야에서 대규모 모델의 정확성을 향상시키는 데 중요합니다.
Google Cloud는 모델 외에도 교육용 차세대 A3 GPU 슈퍼컴퓨터도 출시했습니다. A3 가상 머신을 Nvidia H100과 결합함으로써 Google Cloud는 더 큰 컴퓨팅 처리량과 대역폭을 제공할 수 있으므로 기업은 머신러닝 모델을 더 빠르게 개발할 수 있습니다.
이 외에도 Google은 US$1,799(약 RMB 12,000)의 최초 폴더블 스크린 휴대폰과 AI 기능(예: 메시지 답장 제안 제공)이 포함된 Android 14 시스템과 같은 새로운 하드웨어 제품도 출시했습니다. ), 여기서는 하나씩 표시하지 않겠습니다.
제15회 I/O 컨퍼런스답게 이번에 구글은 정말 유용한 정보를 많이 가져왔습니다.
이번 무대에 소개된 초청 연사는 더 이상 제프 딘이 아니라는 점을 언급할 가치가 있습니다. 그는 며칠 전에 순위를 바꿨을 뿐입니다.
과거 구글 AI를 거론했던 가장 대표적인 경영자로서 그는 AI 2.0 물결 속에서 어디에 위치하게 될까?
대형모델과 AI 검색 분야에서 구글이 여전히 따라잡을 수 있을지도 기대해볼 만하다.
이번 구글의 반격에 만족하시나요?
위 내용은 구글, 본격적인 반격 개시! AI가 검색을 재구성하고 새로운 모델이 GPT-4와 비슷하며 Microsoft가 ChatGPT를 목표로 한다고 공식 발표했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!