2023년 8월 22일 상하이에서 'AI를 타고' 딩톡 생태학 컨퍼런스가 열렸습니다. 디지털 직원을 위한 특별 하위 포럼에서는 DingTalk 부사장이자 오디오 및 비디오 사업부 책임자인 Zhao Jiayu가 기조 연설을 통해 인텔리전스 및 현장에서 DingTalk 오디오 및 비디오의 진행 상황과 적용을 공유했습니다. DingTalk AI PaaS 기반 화상회의 미래를 향한 열린 전망
Zhao Jiayu는 DingTalk가 지난 4월 대형 모델을 완전히 통합하여 지능형 재구성을 완료할 것이라고 발표했다고 언급했습니다. 인공 지능과 오디오 및 비디오의 통합이 점점 더 심화됨에 따라 DingTalk Conference는 또한 많은 혁신적인 애플리케이션을 실현했습니다. 기존 실시간 번역, 자막 전사, 지능형 요약 외에 이번에는 회의 참석 대신 디지털 아바타, 회의 운영의 자연어 제어, 빈센트 가상 배경 등 3가지 새로운 기능이 출시됐다. 그 중 디지털 클론은 회의 시간이 겹칠 때 사용자를 대신하여 회의에 참여할 수 있고, 관련 회의 정보와 결론을 실시간으로 동기화할 수 있습니다
그는 앞으로 DingTalk Audio and Video가 생태계 파트너에게 더 많은 분야를 개방하고 풍부하고 가치 있는 애플리케이션을 공동으로 구축하며 사용자 경험과 효율성을 향상시키기를 희망한다고 말했습니다. 동시에 DingTalk는 오디오 및 비디오 SDK를 생태학적 파트너의 애플리케이션에 내장하여 다양한 산업 및 시나리오의 요구 사항을 충족하는 고품질의 사용하기 쉬운 오디오 및 비디오 솔루션을 공동으로 만들 계획입니다.
다음은 Zhao Jiayu의 연설 전문입니다:
지난 한 해 딩톡 음향영상 사업부의 키워드는 경험과 지능
지난해 우리는 DingTalk 회의를 종합적으로 최적화하기 위해 전담팀을 구성하고 내부적으로나 외부적으로 많은 개선을 이루었습니다. 이제 DingTalk Meeting의 인터페이스 상호 작용은 더욱 아름답고 편리하며 몰입감이 향상되었습니다. 동시에 기본 기술 아키텍처 측면에서 수집, 재생, 인코딩 및 디코딩, 네트워크 및 서버를 포괄적으로 최적화했습니다. 특히 오디오 및 비디오 측면에서 가장 기본적인 요구 사항은 원활한 회의가 가능하고 상대방의 음성을 들을 수 있어야 하므로 오디오 알고리즘 및 약한 네트워크 방지 측면을 개선했습니다. 저희 딩톡 모임을 더욱 많이 이용해주세요
지능과 관련하여 화상 회의 분야는 이러한 주요 개선 이전에 인공 지능과 매우 밀접하게 통합되었습니다. 인공 지능 기술은 오디오 알고리즘과 비디오 알고리즘에 통합되었습니다. 예를 들어 영상 알고리즘과 관련된 인공지능 응용 분야로는 매우 친숙한 장면 응용 분야인 미화, 가상 배경 등이 있다. 오디오 알고리즘은 인공 지능을 결합하여 더 나은 소음 감소 효과도 달성합니다. 현재 DingTalk Meeting은 자동차 경적, 키보드 두드리는 소리 등 300가지 이상의 일반적인 소음 제거를 지원하여 사용자가 더욱 집중적으로 회의를 진행할 수 있습니다
회의에서 우리가 흔히 갖는 또 다른 요구 사항은 자막인데, 이는 본질적으로 인공 지능의 기능입니다. 이제 DingTalk Conference는 Alibaba Tongyi Listening에 완전히 통합되어 중국어, 영어, 일본어 간의 번역을 지원하고 실시간 전사 및 번역을 실현합니다. 또한 지능형 내비게이션 기능도 있습니다. 회의실 회의 중에 온라인 동료가 토론에 참여하는 경우 너무 멀리 떨어져 앉아 있어 명확하게 들을 수 없거나 상대방이 귀하의 말을 듣지 못할 수 있습니다. 허밍버드 오디오 랩(Hummingbird Audio Lab)은 인공 지능과 독창적인 차동 배열 기술을 결합하여 단일 회의 장치에서 최대 10미터 떨어진 곳까지 사운드 픽업을 달성합니다. 화자가 말할 때 정확한 음원 위치 지정, 실시간 추적 및 아바타 확대를 지원하여 각 화자에게 초점을 맞추고 더 나은 대화 경험을 만들어냅니다
대형 모델 시대의 도래에 맞춰 관련 연구를 진행해 왔으며, 대형 모델을 활용해 딩톡 모임을 재현해 보려고 합니다. 오늘 DingTalk는 새로운 AI PaaS 지능형 기반을 출시하고 생태계 파트너에게 공개했습니다. 딩톡 미팅에서는 AI PaaS를 활용하여 많은 흥미로운 기능들을 구현해보았습니다
재작성된 콘텐츠: 우선 회의를 디지털 아바타로 대체하는 새로운 방식입니다. 직장에서 사람들은 종종 많은 회의에 직면하는데, 이제 우리는 스마트 문서를 사용하여 모든 사람이 이 문제를 해결하도록 돕습니다. 또한 사용자에게 디지털 아바타의 기능을 제공하기 위해 몇 가지 방법을 시도했습니다. 회의에 충돌이 있거나 특정 회의와 별로 관련이 없는 경우 디지털 도플갱어에게 대신 회의에 참석하도록 요청할 수 있습니다. 회의 중에 특정 주제에 집중하는 등 DingTalk Magic Wand의 대화 상자를 통해 일부 작업을 적극적으로 설정할 수 있습니다. 누군가 이 주제에 대해 토론하면 AI가 자동으로 이를 알리고 관련 내용을 알려줍니다. 또한 몇 분마다 회의 요약을 보내도록 디지털 아바타를 설정할 수도 있고, 디지털 아바타와 적극적으로 대화하여 회의에 참석한 사람이 누구인지, 분쟁이 있는지 등 다양한 정보를 배울 수도 있습니다. 회의가 끝나면 디지털 클론이 자동으로 회의 요약을 귀하에게 푸시합니다
다시 작성한 내용은 다음과 같습니다. 둘째, 회의를 지능적으로 제어하기 위해 자연어를 사용할 수 있습니다. 예전에는 딩톡에 기능이 너무 많고, 입구 찾기가 어렵다는 불만이 많았습니다. DingTalk Conference도 이 문제에 직면해 있습니다. 많은 단순화를 이루었지만 일부 사용자에게는 사용 기준이 여전히 약간 높습니다. 오늘은 DingTalk Magic Wand의 스마트 어시스턴트를 통해 기능 작동을 단순화했습니다. 자연어로 물어보기만 하면 인공지능이 자동으로 의도를 인식해 작업을 완료할 수 있도록 도와준다. 예를 들어 회의에 사람이 너무 많아서 누군가 실수로 마이크를 켠 경우 그 사람을 찾아 음소거하는 것이 번거로울 수 있지만 이제는 AI에게 말하고 있는 사람을 음소거하도록 지시할 수 있습니다. . 또한 회의에 참여할 사람을 초대해야 할 때 입구가 어디인지 고민하지 않고 직접 초대장을 입력할 수도 있습니다. 이러한 기능을 사용하면 회의 운영 및 관리가 더 쉬워집니다
다시 작성해야 할 내용은 다음과 같습니다. 세 번째 요점은 빈센트의 가상 배경에 관한 것입니다. 가상 배경은 항상 사용자들에게 사랑을 받아 왔으며, 특히 지난 몇 년 동안 우리 젊은이들은 때로는 "우주 교실"에서 수업을 듣고 때로는 "초원"에서 수업을 들으며 많은 즐거움을 얻었습니다. 우리는 또한 일상 업무에서 가상 배경을 사용하는데, 이는 어수선한 배경으로 인한 당황스러움을 효과적으로 피할 수 있습니다. 예전에는 기존 템플릿 이미지 외에 저희가 직접 이미지를 검색하고 다운로드해야 했지만 이제는 그럴 필요가 없습니다. Wensheng 사진을 통해 가상 배경을 자동으로 생성하여 상상력을 완전히 발휘할 수 있습니다
DingTalk 컨퍼런스는 파트너가 시나리오를 업그레이드할 수 있도록 AI PaaS를 통해 점진적으로 애플리케이션을 공개할 예정입니다. 앞으로는 인터뷰, 화이트보드, 기타 애플리케이션 등 DingTalk 회의에 더 많은 생태학적 제품이 포함될 것입니다. 우리는 채용 파트너와 협력하여 이력서 내용 및 커뮤니케이션 정보를 통해 인터뷰 프로세스에 실시간 지원을 제공할 수 있는 인터뷰 도우미를 개발하고 있습니다. 우리는 좋은 경험과 개방성을 제공하고 생태학적 파트너와 협력하여 지능형 시대의 사용자에게 더욱 흥미롭고 가치 있는 시나리오 애플리케이션을 제공하기를 희망합니다
위 내용은 DingTalk 컨퍼런스에서는 디지털 아바타, 대화 생성 가상 배경 등 새롭게 업그레이드된 AI 기능을 소개합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!