최근 인터넷 거대 기업들이 대형 모델 서킷에 합류했습니다.
어제 Li Mu 마스터가 천둥과 같은 대규모 모델 작업을 위해 Amazon을 떠났다는 소식이 모든 사람의 소셜 네트워크에서 폭발적으로 퍼졌습니다.
이에 따라 전 Kuaishou AI 핵심 보스인 Li Yan이 2022년 Kuaishou를 떠난 후 설립한 새로운 회사도 대형 모델을 만드는 것으로 오늘 밝혀졌습니다.
분명히 ChatGPT를 통해 AI의 적용 시나리오를 전 세계에 공개한 이후 국내 기업 간의 AI 모델 레이어 경쟁이 뜨거워지기 시작했습니다.
Li Yan은 2022년 하반기에 AI 회사 "Yuanshi Technology"를 설립하여 주로 다중 모드 대형 모델의 연구 개발을 수행했습니다.
Li Yan은 Kuaishou의 옛 직원이며 직위는 75명 정도이며 Kuaishou AI 기술 연구 개발의 핵심 인물이기도 합니다.
2015년 11월 Kuaishou의 CEO인 Su Hua의 지원으로 Li Yan은 최초의 내부 딥 러닝 부서 DL(Deep Learning) 그룹을 설립했습니다. 이는 불법 비디오 콘텐츠를 식별하기 위한 알고리즘 모델 구축을 목표로 합니다. .
이후 Kuaishou는 비디오 콘텐츠 이해에 대한 요구가 더 커졌습니다. 2016년 Li Yan은 팀 이름을 DL 그룹에서 MMU(멀티미디어 이해, 멀티미디어 콘텐츠 이해) 그룹으로 변경했습니다. 보안 규정 준수 문제를 해결하는 것 외에도 다양한 형태의 알고리즘 모델 연구 및 개발에도 참여했습니다. 음성, 문자, 이미지 등.
2018년 CNCC 컨퍼런스에서 Li Yan은 "멀티모달 콘텐츠 제작 및 이해"라는 주제로 연설하면서 멀티모달 모델 기술의 중요성을 강조했습니다. 더 효율적입니다
다중 모드 연구의 목적은 인간과 컴퓨터의 상호 작용 방식을 점점 더 자연스럽고 편안하게 만드는 것입니다.
그러나 다중 모드 연구는 꽤 어렵습니다.
한편으로는 단일 양식의 의미 격차 문제와 다른 양식의 데이터를 포괄적으로 모델링하는 방법에 대한 이질적인 격차 문제에 직면해야 하며, 다른 한편으로는 다중 구성의 어려움도 해결해야 합니다. - 모달 데이터 세트로 인해 데이터 누락 문제가 발생합니다.
당시 학계의 많은 연구는 여전히 단일 모드 분야에 머물렀지만 Li Yan은 다중 모드가 앞으로 더욱 가치 있는 연구 방향이 될 것이라고 굳게 믿었습니다.
Kaishou에서의 경험을 통해 Li Yan은 짧은 영상을 통해 AI 생태계에 대한 깊은 이해를 얻었습니다. 2021년에 그는 Kuaishou를 떠나기로 결정했습니다.
2022년 하반기에 Yuanshi Technology를 설립했습니다. 36Kr의 독점 검증에 따르면 Yuanshi Technology의 주요 초점은 다중 모드 대형 모델의 연구 개발입니다.
마스터와 견습생이 하나로: 책 쓰기, 사업 시작, 다른 사업 시작
그리고 어제 리무 마스터가 대형 모델 사업에 합류했다는 의혹이 있다는 소식도 즉시 소셜 네트워크에 넘쳐났습니다.
공개 계정 'Dear Data'에 따르면 '파라미터 서버의 아버지' 알렉스 스몰라(Alex Smola)는 올해 2월 아마존을 떠나 인공지능 기업 Boson.ai를 설립했다.
이번 신규 회사 소개에 대해서는 정보가 많지 않고, 공식 페이지도 아직 준비중입니다.
링크: https://boson.ai/
확실히 대형 모델 관련 프로젝트를 진행해야 합니다.
Alex의 LinkedIn 페이지에 따르면 “우리는 뭔가 큰 일을 하고 있습니다. 확장 가능한 기본 모델에 관심이 있다면 저에게 연락해 주세요.”
회사 GitHub에서 주목할 만합니다. 홈페이지에는 Amazon의 수석 과학자 Li Mu도 코드에 기여했습니다.
이에 리무는 Boson.ai에 합류해 멘토와 함께 사업을 시작했을 것으로 추측된다.
그러나 아직까지 홈페이지가 업데이트되지 않았습니다.
Li Mu와 Alex Smola는 2016년에 Marianas Labs라는 데이터 분석 알고리즘 회사를 설립했습니다.
당시 Li Mu는 CTO이자 공동 창립자였습니다.
Li Mu는 "박사 학위 5년"이라는 기사에서
당시 딥 러닝의 인기로 인해 막대한 자금을 보유한 스타트업 기업의 지속적인 인수가 이루어졌다고 언급한 적이 있습니다. .
Alex는 수십만 엔젤 투자를 통해 오랫동안 그와 함께 일했습니다. Alex는 크롤러를 작성하고 직접 모델을 운영했으며 나중에 소규모 상장 회사인 1-Page에 판매했습니다.
스승과 견습생은 카네기멜론대학교(CMU)에서 처음 만났다고 할 수 있습니다.
2012년 9월 Li Mu는 CMU에서 Alex Smola 밑에서 공부했습니다.
당시 Alex는 여전히 Google에서 일하고 있었고 자금이 없었기 때문에 그를 Dave Andersen에게 맡겼습니다. 따라서 Li Mu에게는 기계 학습을 담당하는 멘토와 분산 시스템을 담당하는 멘토가 두 명 있었습니다.
CMU에서 상반기에 Li Mu는 매주 한 시간 동안 두 명의 멘토와 대화를 나누었습니다.
두 강사의 스타일이 매우 다르고 Alex의 반응도 매우 빠르기 때문에 그의 리듬을 따라가기가 어렵습니다. 당신의 아이디어를 설명하고 싶다면 숙제를 더 많이 해야 합니다.
그리고 Dave는 Li Mu가 많은 아이디어를 제공하지 않고도 무언가를 철저하게 이해하도록 도와줄 것입니다.
두 멘토의 지도 아래 리무는 빠르게 성장했습니다.
CMU에서 공부한 2년차에 Yu Kai와 다른 사람들이 딥 러닝을 하고 있는 동안 Li Mu도 이 연구 붐에 동참했습니다.
분산형 딥러닝 프레임워크에 대한 관심을 바탕으로 그는 CXXNet을 출발점으로 딥러닝 관련 프로젝트를 진행하면서 Chen Tianqi와 협력하기로 결정했습니다.
두 사람이 xgboost 분산 시작 스크립트를 함께 작성했을 때 여러 프로젝트에서 파일 읽기를 사용할 수 있다는 사실을 발견했습니다.
바퀴 재발명을 피하기 위해 Li Mu와 Chen Tianqi는 함께 협력하여 Github에서 DMLC라는 조직을 만든 후 성공적인 MXNet을 만들었습니다.
2016년 7월 Alex는 Amazon에 합류했습니다. 동시에 Li Mu는 MXNet을 통해 Amazon에 파트타임 직원으로 합류했으며 졸업 후에도 머물기로 결정했습니다.
2019년에는 UC Berkeley에서도 스승과 제자가 함께 강의를 했습니다.
2021년에도 두 사람은 스탠포드 대학에서 'Practical Machine Learning'을 함께 가르칠 예정입니다.
"Hands-On Deep Learning"이라는 책은 Li Mu, 일리노이 대학 어바나-샴페인 캠퍼스의 컴퓨터 과학 박사인 Aston Zhang이 썼다는 점을 언급할 가치가 있습니다. 그의 멘토 알렉스.
이 책은 출간 이후 큰 인기를 끌었습니다. MXNet의 저자 중 한 명인 Li Mu의 "Hands-On Deep Learning"도 MXNet 프레임워크를 사용하여 작성되었습니다
다양한 방향은 Li Yan이 오랫동안 원했던 것입니다. Li Mu는 멘토를 따라 사업을 시작했는데, 이는 ChatGPT의 인기에 어느 정도 영향을 받았을 수 있습니다.
AI 모델 레이어에서 국내 기업 간의 경쟁이 심화되기 시작했습니다. 현재 대규모 모델 트랙에는 거인, 대기업 사장, 귀국자/대형 공장 임원, 소규모 스타트업 전환, 교수, 간장파 등 각계각층의 플레이어가 붐비고 있습니다.
2월 13일, 메이투안에서 은퇴한 지 2년이 된 왕휘원은 '그룹에 자본을 끌어들이기' 위해 5천만 달러를 지출하겠다고 밝히며 'AI 히어로 리스트'로 대중의 주목을 받았다. "저는 직위나 연봉, 직위에는 관심이 없습니다. 단지 팀을 구성하고 싶을 뿐입니다."
Wang Huiwen이 대형 모델 사업 시작 티켓 가격을 5천만 달러로 인상한 후, "Mobvoi"의 창립자 Li Zhiwen은 공식적으로 대형 모델 대회 종료를 발표했습니다.
Li Zhiwen은 팀을 이끌고 2020년에 대형 모델 UCLAL을 훈련시켰습니다
또한 전 Sogou CEO Wang Xiaochuan도 곧 "중국의 OpenAI" 전장에 참가할 것이라는 막연한 발표를 하고 에 보고했습니다. 36 크립톤은 자신이 신속하게 준비하고 있음을 인정합니다.
2월 26일, Xianyuan Technology의 창립자이자 수석 과학자인 Zhou Bowen도 ChatGPT의 중국어 버전을 구축하기 위해 파트너를 모집하고 있다는 메시지를 공개했습니다.
최근 수요 급증은 국내 인공지능 제품의 잠재 시장이 놀라울 정도로 크다는 것을 보여줍니다.
ChatGPT의 폭발은 특이점이 도래했음을 의미합니다. 이는 더 낮은 수준의 더 깊은 변화를 촉발했습니다. 차세대 AI는 물리적 세계와 정보 세계를 통합하여 지식, 계산 및 정보의 폐쇄 루프를 실현할 것입니다. 추리.
단 이틀 만에 두 명의 덩치 큰 남자가 사업을 그만두고 대형 모델 트랙을 시작한 것으로 밝혀졌습니다. 국내 거대 기업들이 예상하는 기자회견은 몇 달 안에 열릴 예정이다.
그래서 올해 초부터 시작된 이번 AI 대형모델 국내추격대회에서는 머지않아 결승선을 향해 질주하는 참가자들을 볼 수도 있을 것 같습니다.
위 내용은 위대한 스승 Li Mu와 Kuaishou 베테랑 Li Yan은 직장을 그만둔 후 유명 모델로 전환하여 AI 기업가 정신에 붐을 일으켰습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!