추앙/선전 비즈니스 일간지 첸 슈 기자 읽기
6월 1일, Alibaba Cloud는 Tongyi 대형 모델의 진행 상황을 발표했습니다. 오디오 및 비디오 콘텐츠에 초점을 맞춘 새로운 AI 제품인 "Tongyi Listening"이 공식 출시되어 공개 테스트에 공개된 중국 최초의 대형 모델 애플리케이션 제품이 되었습니다.
Tongyi Tingwu는 Tongyi Qianwen 대형 모델의 이해 및 요약 기능과 연결되어 업무 및 학습 중인 사용자를 위한 강력한 AI 보조자가 되어 언제든지 오디오 및 비디오 콘텐츠의 복사, 검색, 요약 및 구성을 효율적으로 완료하도록 돕습니다. 예를 들어 대형 모델을 사용하여 자동으로 메모 작성, 인터뷰 구성, PPT 추출 등을 수행할 수 있습니다. 공개 베타 기간 동안 사용자는 100시간 이상의 듣기 이해를 위한 무료 녹취 시간을 받을 수 있습니다.
"다른 방식으로 오디오와 비디오를 쉽게 읽고 정리하고 공유할 수 있습니다." Alibaba Cloud CTO Zhou Jingren은 Tingwu가 지식의 부가가치가 높은 오디오 및 비디오 콘텐츠 시나리오를 대상으로 하는 업무 학습 AI 도우미라고 소개했습니다. 미팅, 수업, 인터뷰, 트레이닝, 인터뷰, 라이브 방송, 영상 시청, 팟캐스트 청취 등 대형 모델 등 최신 AI 기술을 통해 빠르게 지식을 다듬고 축적할 수 있습니다.
[caption id="attachment_3846381" align="alignnone" width="1000"]
Tongyi Listening은 오디오 및 비디오에 대한 전체 텍스트 초록, 장 요약, 음성 요약을 자동으로 생성할 수 있습니다[/caption]
Tingwu는 오디오 및 비디오에서 그래픽 및 텍스트로의 지식 전달 효율성을 종합적으로 향상시킬 수 있는 10개 이상의 인공 지능 기능이 포함된 라이브 시연을 선보였습니다. "좋은 청각" 외에도 높은 정확도로 회의 기록을 생성하고 다양한 화자를 구별할 수 있습니다. 이 AI 보조자는 또한 "매우 지각적"입니다. 각 연사의 전문, 관점, 초점 구성 및 할 일 목록. 원클릭으로 PPT를 추출하고, 여러 오디오 및 비디오 콘텐츠에 대해 AI 질문을 하고, 특정 문단을 요약하는 등의 기능을 포함한 대형 모델도 조만간 출시될 예정이다.
[caption id="attachment_3846394" align="alignnone" width="736"]
Tongyi Tingwu Chrome 플러그인은 가까운 시일 내에 모든 사용자가 다운로드할 수 있게 될 예정입니다[/caption]
일부 틈새 시나리오의 경우 Tingwu는 많은 "보물 기능"도 설정했습니다. Chrome 플러그인을 열면 외국어 학습자와 청각 장애가 있는 사람이 이중 언어 플로팅 자막을 사용하여 언제 어디서나 자막 없이 동영상을 시청할 수 있습니다. Tingwu는 여전히 전문가를 위한 "회의 대리인"이 될 수 있습니다. 음소거 상황에서 회의에 참여할 때 AI는 회의를 녹음하고 사용자를 대신하여 핵심 사항을 정리할 수 있습니다. 뉴미디어 실무자의 비디오 후반 작업을 용이하게 하는 자막 파일로 청취 이해에 대한 Q&A 검토를 통해 기자, 분석가, 변호사, HR 및 기타 그룹이 인터뷰를 보다 효율적으로 구성할 수 있습니다.
Tingwu는 Alibaba Cloud Disk와 연결되어 있으며 클라우드 디스크의 오디오 및 비디오 콘텐츠를 한 번의 클릭으로 전사할 수 있습니다. 공개 베타 기간에 등록한 Tingwu 사용자는 더 큰 Alibaba Cloud Disk 저장 공간을 받고 클라우드에서 온라인으로 비디오를 재생할 수 있습니다. 디스크 재생 시 자막이 자동으로 생성될 수도 있습니다.
Zhou Jingren은 Tingwu가 Alibaba의 가장 진보된 음성 및 언어 기술을 통합한다고 소개했습니다. Alibaba의 차세대 산업용 음성 인식 모델이 내장되어 있으며, 자체 개발한 음성 의미론 다중 모드 스피커 알고리즘을 통합하여 인식 정확도가 여러 권위 있는 중국 데이터 세트에서 1위를 차지하고 있습니다. 10명 이상의 사람이 말하고 있습니다. Tongyi Qianwen 대형 모델에 액세스한 후 수만 단어의 오디오 및 비디오 콘텐츠를 요약할 수 있어 사실적 정확성과 핵심 사항의 완전성 측면에서 국가를 선도하고 전체에 대한 정확한 질문 및 답변 이해를 지원합니다. 다양한 오디오 및 비디오 콘텐츠.
검토자: Tan Lugang
위 내용은 [원본] 대형 모델을 사용해 자동으로 메모 작성, PPT 추출, 인터뷰 정리 알리바바 클라우드의 새로운 AI 제품 'Tongyi Listening'이 공개 테스트 중입니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!