핫 생성 AI가 스마트 스피커에 생명을 불어넣을 수 있을까요?-일체 포함-php.cn

집

기술 주변기기

일체 포함

핫 생성 AI가 스마트 스피커에 생명을 불어넣을 수 있을까요?

王林

Jun 06, 2023 am 08:05 AM

생성 AI스마트 스피커폭발.

오늘날 많은 소비자들에게 거의 잊혀진 스마트 스피커와 같은 제품은 2017년과 2018년의 '광란'을 경험한 이후 더 이상 대부분의 소비자의 관심을 끌지 못했습니다. 모두가 스마트 스피커가 순식간에 사라질 것이라고 생각했을 때, ChatGPT의 등장은 스마트 스피커에게 두 번째 기회를 주는 동시에 쇠퇴하는 산업에 새로운 기회를 주는 것처럼 보였습니다. 그렇다면 스마트 스피커와 현재 인기 있는 생성 AI가 불꽃을 일으킬 수 있을까요?

핫 생성 AI가 스마트 스피커에 생명을 불어넣을 수 있을까요?

스마트 스피커 업계에서 생성 AI는 오랜 가뭄 끝에 내리는 비와 같을 수 있습니다. 관련 시장 조사 자료에 따르면, 2023년 1분기 심각한 제품 동질성, 소비자 수요 감소 등의 복합적인 영향으로 국내 스마트 스피커의 온라인 모니터링 소매 판매는 157만대로 40.6% 또 감소했다. 2022년 전체 스마트스피커 국내 옴니채널 판매량은 2,631만대로 전년 동기 대비 28% 감소했다.

한 때 거대 대기업들의 큰 기대를 걸고 스마트 홈의 진입 가능성으로까지 여겨졌던 스마트 스피커가 최근 몇 년간 나락으로 빠져든 이유는 무엇일까? 실제로 이유는 단 하나인데, 그것은 스마트 스피커가 실제로 충분히 똑똑하지 않기 때문입니다.

스마트 스피커 개념이 큰 인기를 끌던 2017년, 업계에서는 스마트 스피커의 초점을 '지능'에 맞춰야 할지, '음질'에 맞춰야 할지에 대한 논의가 있었습니다. 결국 Tencent Listening, Apple HomePod 등 음질에 초점을 맞춘 일련의 제품은 비극적인 실패를 활용하여 스마트 스피커의 셀링 포인트는 지능뿐일 수 있음을 입증했습니다.

핫 생성 AI가 스마트 스피커에 생명을 불어넣을 수 있을까요?

그러나 안타깝게도 대부분의 스마트 스피커의 지능 수준은 "확장"되었다고밖에 설명할 수 없는 반면, 주요 제조업체에서는 ASR(음성 인식), NLP 자연 의미 처리, 원거리장 등 인공 지능 및 음향 기술에 관심을 제한했습니다. 사운드 픽업 진행 상황이 너무 낙관적입니다. 실제로 스마트 스피커는 기술적인 관점에서 볼 때 매우 간단합니다. 작동 모드는 사용자의 음성을 수집한 다음 오디오를 서버로 보낸 다음 결과를 계산 및 생성하고 마지막으로 결과를 스마트 스피커로 전송하여 전환하는 것입니다. 예를 들어 애플리케이션을 열거나 사용자의 질문에 답할 수 있습니다.

네, 스마트 스피커 자체는 인공지능과 아무런 관련이 없습니다. Xiaoai, Xiaodu, Tmall Genie의 실제 신원은 해당 서버에 숨겨져 있습니다. 이 모든 것은 스마트 스피커의 경험을 결정하는 핵심이 복잡한 음향 환경에서 사용자의 음성 명령을 정확하게 포착하는 능력인 원거리 사운드 픽업 기술이라는 사실로 이어집니다. 농담”이라고 말하면 스마트 스피커는 이를 “노래 재생”이라고 부르겠습니다.

핫 생성 AI가 스마트 스피커에 생명을 불어넣을 수 있을까요?

스마트 스피커의 솔루션은 대규모 마이크 어레이를 사용해 소리를 수집하는 것이지만, 해결되지 않은 문제점이 하나 있는데 바로 음성 깨우기(키워드 스포팅)입니다. 스마트 스피커를 사용할 때 "Hi, Siri", "Xiao Ai Classmate", "Xiaodu Xiaodu"와 같은 깨우기 단어를 사용하여 스마트 스피커에 대화 중임을 알려야 합니다. 화자 화자는 적극적으로 봉사하는 능력이 부족합니다. 더 중요한 것은 기술적인 한계로 인해 스마트 스피커는 오랫동안 "볼륨을 높여/줄여줘", "누구누구의 노래를 누구누구의 노래를 틀어줘"와 같은 간단한 명령만 이해할 수 있었고 더 복잡한 명령만 이해할 수 있었다는 점입니다. 문장 인식이 어려운 경우가 많습니다.

ChatGPT, Wen Xinyiyan과 같은 생성 AI가 스마트 스피커에 갖는 의미는 전자가 스마트 스피커가 더 복잡한 문장을 이해하고 더 자연스러운 의사소통을 제공하도록 도울 수 있다는 것입니다. Microsoft Bing Chat, Baidu Wenxinyiyan 또는 ChatGPT를 사용해 본 친구들은 이러한 유형의 생성 AI와 대화할 때 "Hi, ChatGPT"와 같은 시작 문구를 사용할 필요가 없으며 다음을 직접 입력하여 시작할 수 있다는 것을 알아야 한다고 생각합니다. 내용. 대화 과정.

핫 생성 AI가 스마트 스피커에 생명을 불어넣을 수 있을까요?

생성 AI는 대규모 언어 모델(LLM, Large Language Model)을 기반으로 하기 때문에 수동 주석 데이터와 인간 피드백을 통한 강화 학습 기술을 추가하고 지식 그래프의 일종인 지식 그래프 기술로 보완합니다. -구조화된 트리플(엔티티, 개념 및 관계 포함)로 작성된 관계 다이어그램을 통해 AI는 인간 지시의 의미를 이해하고 궁극적으로 거대한 정보 데이터베이스에서 답변할 콘텐츠를 선택할 수 있습니다.

Siri 및 Xiaoai와 비교했을 때 ChatGPT와 같은 제품의 가장 큰 변화는 여러 차례의 대화가 가능하다는 것입니다. 거의 "물고기 기억"과 유사한 Siri와 비교할 때 ChatGPT는 항상 사용자와 대화할 수 있으며 감정에 대한 더 명확한 인식과 함께 사용자가 실제로 살아있는 사람과 대화하고 있다는 느낌을 줍니다. 소비자급 제품의 경우 사용자는 그 뒤에 숨은 기술적 원리가 얼마나 진보했는지에는 관심이 없지만 문제를 해결하거나 요구 사항을 충족할 수 있는지에 집중합니다.

핫 생성 AI가 스마트 스피커에 생명을 불어넣을 수 있을까요?

제너레이티브 AI의 매력은 높은 성능에 있습니다. 대표적인 예가 Microsoft Copilot입니다. 동시에 사용자의 사회적 요구도 어느 정도 충족할 수 있습니다. 현재 해외에서는 ChatGPT를 사용하여 출시하고 있습니다. 그는 자신을 모델로 한 '가상 동반자'를 만들어 1000명 이상의 사용자를 확보했다. 일반적으로 생성 AI와 스마트 스피커를 결합하면 후자의 단점을 거의 보완할 수 있어 소비자 시장에서 사용할 수 있는 수준의 지능을 제공할 수 있습니다.

실제로 일부 스마트 스피커 제조업체에서는 이미 조치를 취했습니다. 예를 들어, 올해 2월 Baidu가 Wen Xin Yi Yan을 준비하고 있을 때 Xiaodu는 이미 Wen Xin Yi Yan을 통합하여 Tmall에서 스마트 기기 시나리오용 AI 모델 'Xiaodu Lingji'를 만들겠다고 발표했습니다. Genie가 'Niaodu'에 액세스했습니다. '새가 새를 나눕니다' 모델로 만든 'AI 입 교체'도 Alibaba의 Tongyi Qianwen에 대한 액세스를 발표했습니다.

핫 생성 AI가 스마트 스피커에 생명을 불어넣을 수 있을까요?

하지만 생성 AI가 '만병통치약'이 아니라는 점을 지적할 필요가 있습니다. 현재 모든 생성 AI는 컴퓨팅 리소스의 부족이라는 피할 수 없는 문제에 직면해 있습니다. 생성적 AI 한계 GPT-4가 "멍청하다"는 최근 소식은 최근 출시 당시의 상태와 비교하여 GPT-4의 텍스트 코드 품질이 향상되었다는 것이 사용자들의 공감대가 되었습니다. 모든 면에서 거절당했습니다.

네, 사실 GPT-4뿐만 아니라 ChatGPT, Wenxinyiyan 등 공개 제품에서도 비슷한 상황이 발생했습니다. 사용자 수가 늘어나면서 대형 모델의 성능이 저하되었습니다.

현재 생성 AI 분야가 직면한 핵심 문제는 컴퓨팅 리소스가 부족하고 사용자의 유입에 대처할 수 없다는 것입니다. 이러한 제품은 사용자 경험을 보장하기 위해 대형 모델의 성능을 저하시키고 생성 시간을 단축시킬 수 있습니다. 콘텐츠. 서버 "부하 감소". 이에 비해 기존 스마트 스피커 시장 규모는 의심할 여지 없이 더 크기 때문에 생성 AI에 접근한 후에도 유사한 문제에 직면하는 것은 거의 불가피합니다.

핫 생성 AI가 스마트 스피커에 생명을 불어넣을 수 있을까요?

미래에 일어날 가능성이 있는 것은 스마트 스피커의 지능 수준이 포물선을 보일 것이라는 것입니다. 초기 사용자 경험은 비약적으로 향상되지만 사용자 수가 계속 증가함에 따라 지능 성능이 "저하"될 수 있습니다. 몇 년 전 수준으로 돌아갑니다.

위 내용은 핫 생성 AI가 스마트 스피커에 생명을 불어넣을 수 있을까요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 搜狐에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

Microsoft Work Trend Index 2025는 작업장 용량 변형을 보여줍니다Apr 24, 2025 am 11:19 AM

AI의 빠른 통합으로 악화 된 직장의 급성장 용량 위기는 점진적인 조정을 넘어 전략적 변화를 요구합니다. 이것은 WTI의 발견에 의해 강조됩니다. 직원의 68%가 작업량으로 어려움을 겪고 BUR로 이어

AI가 이해할 수 있습니까? 중국의 객실 논쟁은 아니오라고 말하지만 맞습니까?Apr 24, 2025 am 11:18 AM

John Searle의 중국 방 주장 : AI 이해에 대한 도전 Searle의 사고 실험은 인공 지능이 진정으로 언어를 이해할 수 있는지 또는 진정한 의식을 가질 수 있는지 직접 의문을 제기합니다. Chines를 무시하는 사람을 상상해보십시오

중국의 '스마트'AI 조수는 Microsoft Recall의 개인 정보 결함을 반향합니다Apr 24, 2025 am 11:17 AM

중국의 기술 거대 기업은 서부에 비해 AI 개발 과정에서 다른 과정을 차트하고 있습니다. 기술 벤치 마크 및 API 통합에만 초점을 맞추는 대신 "스크린 인식"AI 비서 우선 순위를 정합니다.

Docker는 AI 모델 및 MCP 도구에 친숙한 컨테이너 워크 플로를 제공합니다.Apr 24, 2025 am 11:16 AM

MCP : AI 시스템이 외부 도구에 액세스 할 수 있도록 권한을 부여합니다 MCP (Model Context Protocol)를 사용하면 AI 애플리케이션이 표준화 된 인터페이스를 통해 외부 도구 및 데이터 소스와 상호 작용할 수 있습니다. MCP를 통해 MCP는 인류에 의해 개발되고 주요 AI 제공 업체가 지원하는 언어 모델 및 에이전트가 사용 가능한 도구를 발견하고 적절한 매개 변수로 전화 할 수 있습니다. 그러나 환경 충돌, 보안 취약점 및 일관되지 않은 교차 플랫폼 동작을 포함하여 MCP 서버 구현에는 몇 가지 과제가 있습니다. Forbes 기사 "Anthropic의 모델 컨텍스트 프로토콜은 AI 에이전트 개발의 큰 단계입니다."저자 : Janakiram MSVDocker는 컨테이너화를 통해 이러한 문제를 해결합니다. Docker Hub Infrastructure를 구축했습니다

6 억 달러 규모의 스타트 업을 구축하기 위해 6 개의 AI Street-Smart 전략 사용Apr 24, 2025 am 11:15 AM

최첨단 기술을 활용하고 비즈니스 통제력을 발휘하여 통제력을 유지하면서 수익성이 높고 확장 가능한 회사를 창출하는 비전 기업가가 사용하는 6 가지 전략. 이 안내서는

Google 사진 업데이트 모든 사진에 대한 멋진 Ultra HDR 잠금 해제Apr 24, 2025 am 11:14 AM

Google 사진의 새로운 Ultra HDR 도구 : 이미지 향상을위한 게임 체인저 Google Photos는 강력한 Ultra HDR 변환 도구를 도입하여 표준 사진을 활기차고 높은 동기 범위 이미지로 변환했습니다. 이 향상은 사진가 a

Descope는 AI 에이전트 통합을위한 인증 프레임 워크를 구축합니다Apr 24, 2025 am 11:13 AM

기술 아키텍처는 새로운 인증 문제를 해결합니다 에이전트 Identity Hub는 문제를 해결합니다. 많은 조직이 AI 에이전트 구현을 시작한 후에 만 기존 인증 방법이 기계 용으로 설계되지 않았다는 것을 발견 한 후에 만 발견합니다.

Google Cloud 다음 2025 및 현대 작업의 연결된 미래Apr 24, 2025 am 11:12 AM

(참고 : Google은 회사 인 Moor Insights & Strategy의 자문 고객입니다.) AI : 실험에서 Enterprise Foundation까지 Google Cloud Next 2025는 실험 기능에서 엔터프라이즈 기술의 핵심 구성 요소까지 AI의 진화를 보여주었습니다.

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

PhpStorm 맥 버전

최신(2018.2.1) 전문 PHP 통합 개발 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 Linux 새 버전

SublimeText3 Linux 최신 버전

mPDF

mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.