>기술 주변기기 >일체 포함 >'눈'이 포함된 ChatGPT 애플리케이션이 출시되었습니다! 150억 개의 매개변수를 갖춘 대규모 멀티모달 모델을 지원해 사진 읽기와 채팅에 다재다능합니다.

'눈'이 포함된 ChatGPT 애플리케이션이 출시되었습니다! 150억 개의 매개변수를 갖춘 대규모 멀티모달 모델을 지원해 사진 읽기와 채팅에 다재다능합니다.

王林
王林앞으로
2023-04-11 13:55:031885검색

'눈'이 포함된 ChatGPT 애플리케이션이 출시되었습니다! 150억 개의 매개변수를 갖춘 대규모 멀티모달 모델을 지원해 사진 읽기와 채팅에 다재다능합니다.

많은 사람들의 마음 속에 ChatGPT는 전능한 "괴물"입니다.

시와 코드를 작성할 수 있고 심지어 긴 논문을 직접 생성할 수도 있습니다... 또한 ChatGPT는 매우 감정적이고 표현력이 뛰어납니다. 몇 번의 대화만으로 모든 사람을 사로잡을 수 있습니다.

그런데 ChatGPT가 정말 전능할까요?

ChatGPT는 챗봇으로서 뛰어난 언어 이해 및 텍스트 처리 기능을 갖추고 있지만 훈련 모델로 인해 ChatGPT는 사진 대화를 지원하지 않습니다. 평일에 친구들과 이야기를 나눌 때 사진을 보낼 수 없다면 자연스럽게 재미를 잃게 될 것이라고 상상해 보십시오.

중국에는 이런 AI R&D팀이 있습니다. 그들이 출시한 "Yuanchengxiang Chatlmg" 애플리케이션은 정확하게 사진을 식별하고 사용자와 채팅할 수 있습니다. 이는 ChatGPT에 한 쌍의 "눈"을 추가하는 것과 같습니다. 사진도 완벽하게 인식할 수 있습니다.

며칠 전 Magike.com은 Yuanchengxiang R&D 팀으로부터 “Yuanchengxiang Chatlmg”이 최근 출시되었다는 소식을 들었습니다.

WeChat 공개 계정“Yuanchengxiang”을 팔로우하면 애플리케이션을 경험할 수 있습니다. (참고: 컴퓨팅 성능의 제한으로 인해 초기 액세스 방법은 초대만입니다.)

그렇다면 "Yuancheng Xiang Chatlmg" 사용 경험은 어떠했으며, 이미지 인식 기능은 정말 마술적일까요? 제품 출시 전날 Magike.com은 종합 평가 요약을 실시했습니다.

눈이 포함된 ChatGPT 애플리케이션이 출시되었습니다! 150억 개의 매개변수를 갖춘 대규모 멀티모달 모델을 지원해 사진 읽기와 채팅에 다재다능합니다.

사진 | Yuan Cheng Xiang Chatlmg 로고

사진을 보고 대화를 나눠볼까요? 이 ChatGPT 애플리케이션은 놀랍습니다

"Yuancheng Xiang Chatlmg"를 입력하면 애플리케이션의 인터페이스가 매우

간단하고 명확하다는 것을 알 수 있습니다 - 하단의 텍스트 대화 상자, 대칭적인 아바타 레이아웃, 공통 채팅에 결합된 다양한 요소 소프트웨어 인터페이스.

앱 왼쪽 하단에 눈에 띄는 "

사진 업로드" 버튼이 있습니다.

현재 앱은 이미지 업로드를 위한 세 가지 방법, 즉

사진 갤러리, 사진 찍기파일 가져오기를 한 번에 하나씩 지원합니다.

여성의 날을 맞아 Magike.com에서도 두 가지 항목을 선택하여 "Yuancheng Xiang Chatlmg"에 전달하여 적합한지 판단하는 데 도움을 주었습니다. 하나는 ​

​검색 엔진​에서 다운로드한 립스틱 사진입니다. , 다른 하나는 휴대폰으로 촬영한 메모장 사진입니다:

눈이 포함된 ChatGPT 애플리케이션이 출시되었습니다! 150억 개의 매개변수를 갖춘 대규모 멀티모달 모델을 지원해 사진 읽기와 채팅에 다재다능합니다.

눈이 포함된 ChatGPT 애플리케이션이 출시되었습니다! 150억 개의 매개변수를 갖춘 대규모 멀티모달 모델을 지원해 사진 읽기와 채팅에 다재다능합니다.

"Yuancheng Xiang Chatlmg"이 두 사진의 제품을 정확하게 식별하고 일부 다른 설명도 확장한 것을 볼 수 있습니다. 메모장 위의 귀여운 곰, 흰색 배경 앞의 립스틱 등

동시에 이 두 아이템이 여자아이들을 위한 선물로 적합한지 스스로 판단했고, 받는 사람의 선호도에 따라 선물이 적합한지 합리적인 제안도 했습니다.

"Yuan Cheng Xiang Chatlmg"이 답장을 보낸 후

우리는 또 다른 질문을 물었습니다:

눈이 포함된 ChatGPT 애플리케이션이 출시되었습니다! 150억 개의 매개변수를 갖춘 대규모 멀티모달 모델을 지원해 사진 읽기와 채팅에 다재다능합니다.

글쎄, 제안은 매우 적절하고 상황에 따른 이해의 논리도 일관됩니다.

또한 Meike.com은 식별을 위해 "Yuan Cheng Xiang Chatlmg"에 대한 다른 사진도 업로드했습니다.

예를 들어 이것은:

눈이 포함된 ChatGPT 애플리케이션이 출시되었습니다! 150억 개의 매개변수를 갖춘 대규모 멀티모달 모델을 지원해 사진 읽기와 채팅에 다재다능합니다.

그리고 이것은:

눈이 포함된 ChatGPT 애플리케이션이 출시되었습니다! 150억 개의 매개변수를 갖춘 대규모 멀티모달 모델을 지원해 사진 읽기와 채팅에 다재다능합니다.

그리고 이것들은:

눈이 포함된 ChatGPT 애플리케이션이 출시되었습니다! 150억 개의 매개변수를 갖춘 대규모 멀티모달 모델을 지원해 사진 읽기와 채팅에 다재다능합니다.

눈이 포함된 ChatGPT 애플리케이션이 출시되었습니다! 150억 개의 매개변수를 갖춘 대규모 멀티모달 모델을 지원해 사진 읽기와 채팅에 다재다능합니다.

"Yuancheng Xiang Chatlmg"의 인식 능력이 꽤 정확하다는 것을 알 수 있습니다. 텍스트를 통해 보이는 사진의 내용을 설명할 수 있습니다.

시나 기사 쓰기와 같은 기본적인 상호 작용 외에도 순수한 텍스트 상호 작용을 기반으로 하는 ChatGPT와 비교할 때 "눈" 한 쌍이 추가된 "Yuancheng Xiang Chatlmg"는 분명히 몇 가지 새로운 기능과 항목 인식을 발견했습니다. 중요한 기능 중 하나입니다.

이후 데이터 양의 지속적인 확장과 제품의 지속적인 최적화를 통해 Meike.com은 "Yuanchengxiang Chatlmg"가 더욱 뛰어난 성능을 가져올 수 있기를 바랍니다.

수백억 개의 매개변수를 가진 대형 모델을 기반으로 하며 앞으로도 계속 업그레이드될 예정입니다

기본적으로 ChatGPT는 GPT-3 대형 모델의 도움을 받아 텍스트 생성 기능을 제공하는 챗봇 제품입니다. ChatGPT의 힘은 바로 GPT-3에 있습니다.

OpenAI에서 개발한 자연어 처리모델로 화점이 너무 많습니다. ChatGPT가 출시되기 오래 전에 GPT-3은 이미 AI 분야에서 성공적으로 등장했습니다.

모델은 1,750억 개의 매개변수에 도달하고 단일 교육에는 수만 개의 GPU가 필요하며 거의 460만 달러에 달하는 비용이 드는 것으로 보고됩니다. 이러한 미친 "금 삼키는 능력"은 자연스럽게 ChatGPT와 같은 미친 응용 프로그램을 지원할 수 있습니다.

그렇다면 ChatGPT의 단점은 무엇인가요? 대답은 '예'입니다!

Yuanchengxiang R&D 팀에 따르면 "Yuanchengxiang Chatlmg"에는 자체 개발한 수백억 개의 매개변수 다중 모달 대형 모델이 탑재되어 있습니다. 이는 ChatGPT에 "눈"을 두어 더욱 인간적으로 만드는 것과 같습니다. 대화로 이동과 같습니다.

AI 분야에서 이른바 멀티 모달리티(multi modality)는 인공지능이 외부 세계를 더 정확하게 이해하도록 돕기 위해 이미지, 텍스트, 음성 등 감각 정보의 협업을 의미하는 경우가 많습니다.

"Yuancheng Xiang Chatlmg"이 이미지를 이해할 수 있는 능력도 멀티모달 대형 모델의 지원 덕분입니다.

Yuanchengxiang R&D 팀에 따르면 현재 Yuanchengxiang AI 대형 모델매개변수 크기는 약 150억개입니다. 현재 데이터에는 이미지-텍스트 데이터, VQA 데이터 등이 포함됩니다. 훈련 과정에서 모델은 제한된 컴퓨팅 능력에 대한 효율적인 훈련을 보장하기 위해 학습 가능한 매개변수를 가능한 한 적게 공개합니다.

모델의 향후 개발 경로에 대해 물었을 때 Yuanchengxiang R&D 팀은 Meike.com에 현재의 이미지 및 텍스트 상호 작용 외에도 대형 모델에 향후 사진 생성 기능도 통합될 것이라고 밝혔습니다. 답변 시 자체 생성 이미지로 답변할 수도 있어 대화가 더욱 생생해집니다.

또한 이 모드에는 비디오, 오디오 등과 같은 더 많은 모드가 포함되며 Digital Human과 같은 기술과 결합되어 더욱 생생하고 3차원적인 이미지를 개발할 수도 있습니다.

Yuanchengxiang의 수백억 개의 매개변수 다중 모달 대규모 모델의 지원으로 챗봇과의 대화가 더욱 실제 사람과 유사해지고 AI 기술이 미래에 우리에게 점점 더 많은 놀라움을 선사할 것으로 예상됩니다.

중국 AI 제조사들이 난리를 피우고 있는데, 국내 ChatGPT는 어디까지?

이달 개최된 제14기 전국인민대표대회 제1차 회의 '장관채널'에서 과기부 장관​​Wang ZhigangChatGPT에 대해 이야기하면서 ChatGPT가 가져온 진전을 칭찬했습니다. AI 및 관련 산업 .

동시에 ChatGPT를 통해 촉발된 다양한 토론이 두 세션에 대표자와 위원들에 의해 가져왔습니다.

사실 우리나라가 2017년 인공지능 개발을 국가 전략으로 승격하기 전부터 AI는 이미 전국양회에 '단골 게스트'로 등장했습니다. 요즘 ChatGPT는 전 세계적으로 인기가 있으며 사람들은 다시 묻지 않을 수 없습니다. 중국의 AI 산업은 어떻게 ChatGPT의 추세를 잡을 수 있습니까?

Magike.com은 신제품 출시를 기회로 Yuanchengxiang의 R&D 팀장인 Dr. Gao Yizhao와 이 문제에 대해 논의했습니다.

그는

중국에서 대형 AI 모델을 구축하려면 진정한 혁신적인 기술을 개발하기 위해 장기적인 레이아웃과 작업 연속성이 필요하다고 생각합니다.

ChatGPT의 '개발 이력'을 되돌아보면 대규모 AI 모델을 구축하는 것이 쉽지 않다는 것을 알 수 있습니다. 그 이면에는 장기적인 자본 투자와 컴퓨팅 파워 기술의 반복이 필요합니다. 또한 훈련 데이터 및 컴퓨팅 성능의 최적화 및 기타 측면을 고려하십시오.

즉,

ChatGPT 같은 애플리케이션을 만들고 싶다면 단순한 '100미터 달리기'로는 할 수 없지만, 인내심을 가지고 '10,000미터 장거리 경주'를 해야 합니다. "최고의 경주"에 참가하기 전에.”.

그러나 현재 개발 상황으로 볼 때 국내 제조업체의 대형 AI 모델은 아직 연구 개발 단계에 있으며 "Yuancheng Xiang Chatlmg"과 같은 응용 수준에 도달할 수 있는 팀은 여전히 ​​매우 드뭅니다. 우선, 국내 대형 AI 모델의 R&D 개발은 일반적으로 늦게 시작되고 심각한 인재 격차가 있습니다. 둘째, 중국 환경에서 대형 모델을 교육하는 것은 영어보다 훨씬 어렵고 시간이 더 많이 걸립니다.

이러한 문제를 해결하려면 '인내'가 필요했지만, 마지막 AI 투자 붐이 식으면서 많은 기업이 예산을 삭감할 수밖에 없었고, 결국 AI 관련 사업 발전에 병목 현상이 발생했습니다.

반면에 Yuanchengxiang R&D 팀은 AI 애플리케이션 분야에 대한 장기적인 탐구를 진행하는 동시에 멀티모달에 대한 올바른 판단의 이점도 얻었습니다. 사전 훈련된 모델. 그리고 마침내 전체 팀의 끈기로 우리는 마침내 ChatGPT 시대의 "

Blooming and Fruiting

"을 열었습니다.

AI 기업의 미래 개척에 관해 Gao 박사는 다음과 같은 자신의 의견도 제시했습니다. "생태 건설 측면에서 중국은 ​

​오픈 소스​

​를 장려할 수 있습니다. 결국에는 강점이 있습니다. " 결론

ChatGPT는 지난해 출시 이후 '

경이로운 제품

'에서 '

기술의 상징'으로 진화했습니다. 국내 기술 제조사들은 ChatGPT와 같은 제품 출시를 서두르고 있습니다. 이 대회에서 소위 "승리"를 얻으십시오. 동시에 ChatGPT의 인기로 인해 국내 AI 업계는 다시 한 번 새로운 제품 붐을 일으켰습니다. 이 기간 동안 "Yuancheng Xiang Chatlmg"이 두각을 나타냈습니다.

"Yuancheng Xiang Chatlmg" 애플리케이션의 평가에 따르면, 그 경험은 이미 매우 친숙하며, ChatGPT에는 없는 "이미지 인식" 기능까지 갖추고 있습니다.

물론 "Yuanchengxiang Chatlmg"의 초기 버전으로서 일부 세부 사항에는 여전히 부족한 부분이 있지만 Yuanchengxiang R&D 팀의 노력과 끈기로 인해 국내 ChatGPT 애플리케이션도 향후 업계를 놀라게 할 수 있다고 믿습니다.

위 내용은 '눈'이 포함된 ChatGPT 애플리케이션이 출시되었습니다! 150억 개의 매개변수를 갖춘 대규모 멀티모달 모델을 지원해 사진 읽기와 채팅에 다재다능합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제