>  기사  >  기술 주변기기  >  Google StyleDrop은 제어성 측면에서 MidJourney를 능가하며 전 GitHub CTO는 AI를 사용하여 프로그래밍을 전복합니다.

Google StyleDrop은 제어성 측면에서 MidJourney를 능가하며 전 GitHub CTO는 AI를 사용하여 프로그래밍을 전복합니다.

PHPz
PHPz앞으로
2023-06-10 21:51:43801검색

谷歌StyleDrop在可控性上卷翻MidJourney,前GitHub CTO用AI颠覆编程

Alpha Commune이 발표한 AI Venture Capital Weekly Report는 대규모 언어 모델과 생성 AI로 대표되는 인공 지능의 새로운 트렌드에 초점을 맞췄습니다. 알파코뮌은 뛰어난 기업가(AlphaFounders)가 기술, 비즈니스, 사회의 큰 원동력이며 벤처캐피탈 생태계의 방향을 이끌어간다는 믿음으로, 뛰어난 창업가(AlphaFounders)를 발굴하고 투자하길 희망합니다.

이번 주에 우리는 AI 분야에서 다음과 같은 새로운 트렌드를 관찰했습니다.

1. AI 시각적 생성 및 다중 양식이 빠르게 진행되고 있습니다. Google StyleDrop은 스타일 일관성 및 제어 가능성 측면에서 새로운 "SOTA 모델"이 되었으며 Cambridge와 Tencent가 출시한 PandaGPT는 6개 양식을 통합합니다.

2. AI 프로그래밍 기능이 혁신의 초점이 되었습니다. Google은 새로운 DIDACT 프로그래밍 프레임워크를 출시했고, Baidu Comate 프로그래밍 어시스턴트가 출시되었으며, Github의 전 CTO는 1조 매개변수의 대규모 모델을 구축하는 사업을 시작했습니다. 프로그램 작성.

3. RLHF를 전복하려는 다양한 새로운 정렬 방법: 직접 선호도 최적화(DPO)는 선호도 학습 파이프라인을 단순화하고 Stanford와 Google DeepMind는 더 간단하고 효과적인 가치 정렬 방법을 개발했습니다.

4. 새로운 인공 지능 연구로 정렬 알고리즘이 70% 더 빨라졌습니다. Google DeepMind의 AlphaDev는 수조 번 실행하면서 C++ 정렬 알고리즘의 속도를 70% 향상시켰습니다.

5. 많은 스타트업이 AI 컴퓨팅 성능 문제를 해결하려고 노력하고 있습니다. 하버드 중퇴자 두 명이 대규모 언어 모델 추론을 위한 전용 칩을 구축하여 생성에 클라우드 컴퓨팅 기능을 제공하는 CoreWeave를 개발했습니다. AI, 한 달 안에 누적 펀딩 금액이 4억 달러를 넘어섰습니다.

谷歌StyleDrop在可控性上卷翻MidJourney,前GitHub CTO用AI颠覆编程

인공지능 제품 및 기술의 새로운 혁신

1. 미드저니의 라이벌이 왔어요! 구글 스타일드롭 에이스 '커스터마이징 마스터', AI 아트서클 돌풍

Google의 최신 StyleDrop은 Midjourney의 라이벌이라고 할 수 있습니다. 추상 작품, 다양한 스타일의 로고 등을 포함하여 참조 사진을 통해 복잡한 예술 스타일을 해체하고 재현할 수 있습니다. "SOTA 이전 모델"과 비교할 때 StyleDrop은 스타일 일관성이 뛰어납니다. 그리고 텍스트 정렬. 이는 보다 제어 가능한 페인팅 프로세스를 제공하고 이전에는 상상할 수 없었던 미세한 작업을 가능하게 합니다.

谷歌StyleDrop在可控性上卷翻MidJourney,前GitHub CTO用AI颠覆编程

StyleDrop은 마스크 생성 이미지 Transformer를 기반으로 하는 최첨단 텍스트-이미지 합성 모델인 Muse를 기반으로 구축되었습니다. 여기에는 기본 이미지 생성 및 초해상도를 위한 두 개의 합성 모듈이 포함되어 있으며, 각 모듈은 텍스트 인코더 T, 변환기 G, 샘플러 S, 이미지 인코더 E 및 디코더 D.

StyleDrop의 교육 과정에는 두 가지 주요 측면이 포함됩니다. 첫 번째는 매개변수의 효과적인 미세 조정입니다. 생성된 시각적 변환기의 매개변수를 미세 조정함으로써 주어진 참조 이미지에 대해 유사한 스타일의 이미지를 생성할 수 있습니다. 그 다음에는 피드백을 통한 반복 훈련이 이어지며, 반복적인 훈련 과정을 통해 생성된 이미지는 점차적으로 최적화되어 스타일 일관성과 텍스트 정렬이 향상됩니다.

2.AI는 정렬 알고리즘을 70% 더 빠르게 다시 작성합니다. Google DeepMind의 AlphaDev는 컴퓨팅의 기초를 혁신합니다

Google DeepMind Hassabis의 두 문장은 컴퓨터 분야를 충격에 빠뜨렸습니다. “AlphaDev는 새롭고 빠른 정렬 알고리즘을 발견했으며 이를 개발자가 사용할 수 있도록 기본 C++ 라이브러리에 오픈 소스로 제공했습니다. 이것은 단지 AI가 코드 효율성을 향상시키는 시작일 뿐입니다. ”

AlphaDev는 정렬 문제를 싱글 플레이어 "조립 게임"으로 변환하는 AlphaZero 모델을 기반으로 하며, 가능한 많은 명령어 조합을 검색하여 기존 알고리즘보다 빠른 정렬 알고리즘을 발견하고 실행 중인 C++ 정렬 알고리즘을 개선합니다. 70%의 속도. 관련 연구 논문이 권위 있는 과학 저널인 Nature에 게재되었습니다. 이 결과는 이제 LLVM 표준 C++ 라이브러리 Abseil에 포함되었으며 오픈 소스입니다.

AlphaDev의 주요 저자 중 한 명인 Daniel J. Mankowitz는 다음과 같이 말했습니다. 이 기술은 프로그래밍과 디지털 사회에 중요한 영향을 미치고 수십억 명의 사람들의 시간과 에너지를 절약하며 전체 컴퓨팅 생태계를 최적화할 것으로 예상됩니다.

3. 첫 번째 중국 작품이 CVPR 2023

에 포함됩니다.

NVIDIA와 Johns Hopkins University의 Neuralangelo라는 기술을 사용하면 일반 비디오에서 상세한 3D 모델을 자동으로 생성할 수 있습니다. SDF 기반 신경 렌더링 재구성 및 다중 해상도 해시 인코딩 아키텍처를 사용하여 깊이 데이터 없이 3D 구조를 생성합니다. 현재 CVPR 2023에 관련 논문이 선정되었습니다.

谷歌StyleDrop在可控性上卷翻MidJourney,前GitHub CTO用AI颠覆编程

논문에서 Neuralangelo는 DTU 및 Tanks and Temples 데이터 세트를 사용하여 테스트되었으며 결과는 3D 디테일 생성 및 이미지 복원에서 정확하게 수행되는 것으로 나타났습니다. NeuS 및 NeuralWarp와 같은 "SOTA 이전 모델"과 비교하여 Neuralangelo는 DTU 데이터세트와 Tanks and Temples 데이터세트 모두에서 탁월한 결과를 보여줍니다.

4. 대규모 언어 모델에 종합적인 시청각 기능을 추가한 DAMO 아카데미 오픈 소스 Video-LLaMA

다모아카데미 연구진은 대규모 언어 모델이 영상 콘텐츠를 이해하고 상호 작용할 수 있도록 시청각 기능을 갖춘 대규모 모델인 Video-LLaMA를 제안했습니다. 이 모델은 비디오 및 오디오 신호를 인식하고 이해하며, 사용자 지침을 이해하고, 오디오 및 비디오 설명, 질문 및 답변과 같은 복잡한 작업을 완료할 수 있습니다.

谷歌StyleDrop在可控性上卷翻MidJourney,前GitHub CTO用AI颠覆编程

그러나 이 모델에는 여전히 제한된 지각 능력, 긴 영상 처리의 어려움, 언어 모델 고유의 환각 등의 한계가 있습니다. DAMO 아카데미는 인식 능력을 향상시키기 위해 고품질 오디오-비디오-텍스트 데이터 세트를 구축하고 있다고 밝혔습니다.

5. Cambridge, Tencent AI Lab 등이 PandaGPT 모델을 제안했습니다. 하나의 모델이 6가지 양식을 통합합니다

최근 Cambridge, NAIST, Tencent AI Lab의 연구원들은 PandaGPT라는 크로스 모달 언어 모델을 출시했습니다. PandaGPT는 ImageBind의 모달 정렬 기능과 Vicuna의 생성 기능을 결합하여 6가지 모드에서 명령 이해 및 추적 기능을 달성합니다. 이 모델은 이미지/비디오 기반 Q&A, 창의적 글쓰기, 시각-청각 추론을 포함한 다양한 양식을 이해하는 능력을 보여줍니다. 모델은 이미지, 비디오, 텍스트, 오디오, 히트 맵, 깊이 맵 및 IMU 데이터를 처리하고 해당 의미를 자연스럽게 결합할 수 있습니다.

6. 70억 개의 매개변수만으로 GPT-4를 수학적으로 죽이는 Goat 출시 싱가포르국립대학교 연구진이 LLaMA 모델을 미세 조정하여 산술 전용 모델인 Goat를 개발했는데, 매개변수 크기가 70억 개로 GPT-4보다 산술 능력이 월등히 뛰어납니다. Goat는 Bloom, OPT, GPT-NeoX 등을 능가하는 정확도로 BIG-bench 산술 하위 작업에서 탁월한 성능을 발휘합니다. 그중 제로 샘플 Goat-7B가 달성한 정확도는 소수 샘플 학습 후에도 PaLM-540을 능가합니다.

Goat는 사전 훈련된 다른 언어 모델을 능가하는 합성 산술 데이터 세트를 미세 조정하여 큰 숫자 덧셈 및 뺄셈 연산에서 거의 완벽한 정확도를 달성합니다. 더 어려운 곱셈과 나눗셈 작업의 경우, 연구자들은 학습 가능한 하위 작업으로 분해하여 산술 성능을 향상시키는 작업 분류 및 분해 방법을 제안했습니다. 이 연구는 산술 작업에 대한 언어 모델의 발전에 유용한 탐구와 영감을 제공합니다.

7. iFlytek Spark Cognitive Large Model V1.5 출시, 다단계 대화 및 수학 기능이 업그레이드되었습니다

6월 9일, iFlytek Spark Cognitive Large Model V1.5가 출시되었습니다. 이 버전은 개방형 질문과 답변 분야에서 획기적인 발전을 이루었으며 여러 차례의 대화와 수학적 능력은 물론 텍스트 생성, 언어 이해 및 논리적 추론 능력도 업그레이드되었습니다. 또한 iFlytek은 'Spark 인지 모델'을 모바일 단말기에 도입하고 Spark 앱도 출시할 예정입니다.

계획에 따르면 iFlytek은 10월 24일 ChatGPT 벤치마킹을 목표로 올해 3차례에 걸쳐 반복적인 업그레이드를 수행할 예정입니다. 6월 9일 외에 다음 업그레이드 노드는 8월 15일이며 주로 코드 기능과 다중 모드 상호 작용을 업그레이드하는 것입니다.

8. Google의 공개 AI+ 소프트웨어 엔지니어링 프레임워크 DIDACT: 수천 명의 개발자가 수행한 내부 테스트

Google은 최근 AI 기술을 사용하여 소프트웨어 엔지니어링을 강화하고 개발자가 실시간으로 코드를 작성하고 수정하도록 지원하는 DIDACT라는 프레임워크를 발표했습니다.

DIDACT 프레임워크의 모델은 본질적으로 다중 모드이며 개발자의 과거 작업을 기반으로 다음 편집 작업을 예측할 수 있습니다. 이 기능을 통해 모델은 개발자의 의도를 더 잘 이해하고 정확한 권장 사항을 제공할 수 있습니다. 또한 모델은 빈 파일에서 시작하여 완전한 코드 파일이 생성될 때까지 후속 편집 작업을 지속적으로 예측하는 등 보다 복잡한 작업을 완료할 수도 있습니다.

DIDACT 도구에는 주석 구문 분석, 빌드 수정, 힌트 예측이 포함되어 있으며 각 도구는 개발 작업 흐름의 다양한 단계에 통합되어 있습니다. 이러한 도구와 개발자 간의 상호 작용 기록은 모델이 소프트웨어 엔지니어링 작업 중에 개발자 작업을 예측하는 데 도움이 되는 교육 데이터로 사용됩니다.

9. Baidu는 Wen Xinyiyan의 고성능 모델 추론 능력을 50배 향상시키는 대형 모델 기반 코드 작성 도우미인 Comate를 출시합니다

최근 Baidu Smart Cloud는 Comate 코딩 지능형 추천 도구를 출시하고 공식적으로 초대 테스트를 열었습니다. Comate는 GitHub Copilot과 같은 코드 작성 도우미와 유사하지만 더 많은 중국어 주석과 개발 문서를 학습 데이터로 사용합니다. 코딩 과정에서 Comate는 개발자가 현재 작성 중인 내용을 기반으로 가능한 다음 입력 선택에 대해 추론할 수 있습니다. Baidu에 따르면 Comate 기능은 Baidu의 모든 비즈니스 라인에 처음으로 통합되었으며 좋은 결과를 얻었습니다. 핵심 R&D 부서의 코드 중 50%가 Comate를 통해 생성될 수 있습니다.

또한 Baidu는 Wen Xinyiyan의 추론 성능이 10배 향상되었다고 밝혔습니다. 동시에 Wenxin Qianfan의 대형 모델 플랫폼이 제공하는 완전한 도구 체인을 기반으로 기업 애플리케이션의 고주파수 및 핵심 시나리오에서 Wenxinyiyan의 고성능 모드 "Wenxinyiyan-Turbo"는 추론 서비스 성능을 50배 향상시켰습니다.

10.생각복제! 전직 OpenAI 연구원, AI가 인간의 사고를 모방할 수 있게 되다

OpenAI 연구팀의 선임 멤버였던 Jeff Clune이 주도한 연구에 따르면 인공지능 에이전트가 인간의 사고와 행동을 모방하게 하면 성능과 안전성이 향상될 수 있다는 사실이 밝혀졌습니다. 이 연구는 인간이 행동할 때 말하는 생각의 데이터 세트를 사용하여 에이전트가 생각하는 능력을 학습하고 이를 모델링된 행동과 결합할 수 있도록 합니다. 이 접근 방식을 "사고 복제"라고 하며, 상위 수준 구성 요소는 아이디어를 생성하고 하위 수준 구성 요소는 작업을 수행합니다.

연구원들은 훈련을 위해 YouTube 동영상과 텍스트 녹음에서 수집한 수백만 시간의 사고 데이터를 사용했습니다. 실험 결과는 "사고 복제" 방법이 기존 행동 복제 방법보다 성능이 뛰어나고 배포되지 않은 작업에서 더 나은 성능을 발휘한다는 것을 보여줍니다. 본 연구는 인공지능의 발전에 큰 의의가 있으며, 에이전트의 지능 수준과 안전성을 향상시키고 에이전트를 더 쉽게 이해하고 제어할 수 있도록 합니다.

11 추론 프로세스가 크게 최적화되었으며 Byte 고성능 Transformer 추론 라이브러리가 IPDPS 2023 Best Paper Award

를 수상했습니다.

ByteDance, NVIDIA 및 University of California, Riverside에서 출판한 논문 "ByteTransformer: A High Performance Transformer Boosted for Variable-Length"가 IPDPS 2023에서 최우수 논문을 수상했습니다.

ByteTransformer는 ByteDance에서 개발한 GPU 기반 Transformer 추론 라이브러리입니다. ByteTransformer는 일련의 최적화 방법을 통해 BERT 변환기에서 고성능을 달성하는 효율적인 Transformer 구현입니다. 가변 길이 텍스트 입력의 경우 다른 Transformer 구현과 비교하여 ByteTransformer는 실험에서 평균 50% 이상의 가속을 달성할 수 있으며 자연어 처리 작업을 가속화하고 모델 훈련 및 추론의 효율성을 향상시키는 데 적합합니다.

12.RLHF에 "RL"이 꼭 필요한가요? 이진 교차 엔트로피를 사용하여 LLM을 직접 미세 조정하면 효과가 더 좋습니다

RLHF(Reinforcement Learning with Human Feedback)는 현재 대규모 모델을 인간과 정렬하는 데 널리 사용되는 방법입니다. 이는 모델에 인상적인 대화 및 코딩 기능을 제공하지만 RLHF 파이프라인은 지도 학습보다 훨씬 복잡하며 여러 언어 모델을 교육합니다. 훈련 루프 동안 언어 모델 정책에서 샘플링하므로 상당한 계산 비용이 발생합니다.

최근 스탠포드 대학과 기타 기관에서는 DPO(Direct Preference Optimization)라는 연구를 제안했습니다. 이 연구에서는 기존 방법에서 사용하는 RL 기반 목표를 간단한 이진 교차 엔트로피 목표로 정확하게 최적화하여 선호도를 단순화할 수 있음을 보여주었습니다. 학습 파이프라인. 즉, 명시적인 보상 모델이나 강화 학습 없이 인간의 선호도를 준수하도록 언어 모델을 직접 최적화하는 것이 전적으로 가능합니다.

13. 소셜 게임 데이터를 사용하여 RLHF

와 유사한 소셜 정렬 모델을 훈련합니다.

언어 모델 개발의 중요한 단계는 언어 모델의 행동이 가치 정렬이라고도 알려진 인간의 사회적 가치와 일치하도록 만드는 것입니다. 현재 주류 방식은 RLHF이다.

그러나 이 접근 방식에는 몇 가지 문제가 있습니다. 첫째, 에이전트 모델이 생성한 보상은 쉽게 해킹당해 기대에 미치지 못하는 반응을 보인다. 둘째, 에이전트 모델과 생성 모델은 지속적으로 상호 작용해야 하므로 훈련 프로세스에 시간이 많이 걸리고 비효율적입니다. 셋째, 보상 모델 자체가 인간의 사고 모델과 정확히 일치하지 않습니다.

Dartmouth, Stanford, Google DeepMind 및 기타 기관의 최근 연구에 따르면 소셜 게임을 사용하여 간단하고 효율적인 정렬 알고리즘과 결합된 고품질 데이터를 구축하는 것이 가치 정렬을 달성하는 열쇠가 될 수 있음을 보여줍니다. 연구진은 다중 에이전트 게임 데이터에 대한 정렬 훈련 방법을 제안했습니다. 그들은 사회적 개인이 사회적 규범에 반응하여 좋은 인상을 주는 샌드박스(Sandbox)라는 가상 소셜 모델을 개발했습니다. 샌드박스 이력 데이터로부터 학습하여 안정적인 정렬 알고리즘을 제안했습니다. 실험적으로 검증되고 정렬 훈련된 모델은 사회적으로 규범적인 반응을 더 빠르게 생성할 수 있습니다. 안정적인 정렬 알고리즘은 성능 및 훈련 안정성 측면에서 RLHF와 유사하며 보다 간단하고 효과적인 값 정렬 방법을 제안합니다.

谷歌StyleDrop在可控性上卷翻MidJourney,前GitHub CTO用AI颠覆编程

AI 스타트업을 위한 새로운 자금 조달

1. 전 GitHub CTO가 설립한 Poolside는 시드 라운드 파이낸싱에서 2,600만 달러를 받았습니다

최근 풀사이드는 레드포인트 ​​벤처스(Redpoint Ventures)가 주도하는 시드라운드 자금 2,600만 달러를 받았습니다. 풀사이드의 목표는 소프트웨어로 만들어진 AGI(Artificial General Intelligence)를 추구하여 인간의 잠재력을 발휘하는 것이며, 인간의 전환에서라는 기본 개념을 기반으로 합니다. AGI 경로는 일반적인 방법이 아닌 구체적인 역량을 구축하여 달성해야 합니다.

Poolside 창립자 Jason Warner는 이전에 Redpoint Ventures의 전무 이사를 역임했으며 이전에는 GitHub의 CTO를 역임했습니다. 그의 팀은 GitHub Copilot 개발을 담당했습니다. 그는 연쇄 창업가인 Eiso Kant와 함께 OpenAI를 직접 목표로 하는 Poolside를 공동 창립했습니다.

Poolside는 강력한 차세대 기본 모델 및 인프라를 구축하고 있습니다. 이는 소프트웨어 및 코드에 초점을 맞춘 1000조 매개변수 모델일 수 있으며, 이 모델의 기능을 사용하면 예술가, 의사, 과학자 및 교육자가 매우 낮은 임계값을 가질 수 있습니다. 오늘날보다 1,000배 빠르게 소프트웨어와 제품을 구축하여 소프트웨어를 만드는 것이 모든 사람이 가능하고 어디서나 사용할 수 있게 될 것입니다.

2. AI 기반 고객 성공 플랫폼 UpdateAI는 IdealabX, Zoom Ventures, a16z로부터 230만 달러의 초기 투자를 받았습니다

UpdateAI는 최근 IdealabX가 주도하는 230만 달러의 자금 조달을 받은 고객 성공 플랫폼 제공업체입니다.

UpdateAI는 지루한 고객 통화 작업을 단순화하여 고객 성공 관리자가 확장 가능한 고객 통찰력을 제공하는 데 집중할 수 있도록 합니다. 이 플랫폼은 Zoom Meetings와 통합되고 ChatGPT를 활용하여 간결한 회의 개요를 제공하고 고객에게 후속 이메일 전송과 같은 통화 후 작업을 자동화하는 스마트 회의 요약을 생성합니다.

UpdateAI의 공동 창업자이자 CEO인 Josh Schachter는 다양한 배경을 가진 연속 창업자입니다. 그는 UpdateAI를 창립하기 전에 대기업에서 제품 관리자로서 두 가지 기업 경험과 여러 가지 전문 경험을 쌓았을 뿐만 아니라 보스턴에서 이사로도 근무했습니다. 컨설팅 그룹은 요구사항을 깊이 이해합니다.

UpdateAI는 230만 달러의 자금 조달을 받았습니다. 이번 자금 조달은 Zoom Ventures와 a16z가 참여한 IdealabX가 주도했습니다. UpdateAI는 이전에 170만 달러의 자금을 지원받았으며 이번 라운드에서 총 자금이 400만 달러로 늘어났습니다.

3. 생성 AI를 위한 클라우드 컴퓨팅 기능 제공에 주력하는 CoreWeave는 한 달 만에 미화 2억 달러의 전략적 자금을 추가로 받았습니다

CoreWeave는 AI 클라우드 컴퓨팅에 주력하는 스타트업 회사입니다. 투자자인 Magnetar Capital은 이전에 2억 2,100만 달러 규모의 시리즈 B 자금 조달을 주도한 데 이어 현재 20억 달러 규모의 1인 회사입니다. .짐승.

CoreWeave는 H100, A100, A40 및 RTX A6000을 포함하여 12개 이상의 SKU를 갖춘 NVIDIA GPU 클라우드 서비스를 제공하며, 이는 인공 지능 및 기계 학습, 시각 효과 및 렌더링, 배치 처리 및 픽셀 스트리밍과 같은 다양한 사용 사례에 적합합니다.

CoreWeave는 Intrator, Brian Venturo 및 Brannin McBee에 의해 설립되었습니다. 이들은 처음에는 암호화폐 애플리케이션에 중점을 두고 이후 텍스트 생성 AI 모델과 같은 일반 컴퓨팅 및 생성 AI 기술로 전환했습니다.

CoreWeave가 이전에 완료한 2억 2,100만 달러의 시리즈 B 자금 조달에는 주요 투자자인 Magnetar Capital 외에도 NVIDIA, 전 GitHub CEO Nat Friedman, 전 Apple 임원 Daniel Gross와 같은 투자자도 있었습니다.

4. 워크플로우 자동화 엔진 8Flow.ai는 660만 달러의 시드 라운드 파이낸싱을 받았습니다

최근 8Flow.ai는 Caffeinated Capital이 주도하는 시드 라운드 파이낸싱에서 660만 달러를 받았습니다. BoxGroup, Liquid2 등의 기관과 전 GitHub CEO Nat Friedman, Howie Liu 등 개인 투자자도 참여했습니다.

회사는 Zendesk, ServiceNow 및 Salesforce Service Cloud와 같은 도구와 통합하여 상담원이 일상 작업을 완료하도록 지원하는 기업용 자가 학습 워크플로 자동화 엔진을 출시했습니다. 앞으로 회사는 이 모든 데이터를 사용하여 기계 학습 모델을 훈련하여 각 사용자의 요구에 맞는 AI 워크플로를 생성할 계획입니다.

8Flow.ai의 제품은 현재 한 프로그램에서 다른 프로그램으로 관련 데이터를 자동으로 복사하여 붙여넣을 수 있는 Chrome 브라우저 확장 프로그램으로 존재합니다. 이 도구는 각 에이전트의 일반적인 단계를 자동으로 학습하고 이를 한 번의 클릭으로 트리거할 수 있는 작업으로 렌더링합니다.

8Flow.ai 창립자 Boaz Hecht는 SkyGiraffe의 공동 창립자이자 CEO였으며 이후 ServiceNow 플랫폼의 부사장을 역임하여 모바일 및 인공지능 채팅 로봇 제품을 담당했습니다.

5. 의료분야 대화형 인공지능 플랫폼 하이로(Hyro)가 맥쿼리캐피탈 주도로 2천만 달러 규모의 시리즈B 파이낸싱을 유치했습니다

최근 의료분야 대화형 인공지능 플랫폼 하이로(Hyro)가 맥쿼리캐피탈이 주도하는 시리즈B 파이낸싱에서 2천만 달러를 유치했습니다.

Hyro는 두 명의 코넬 대학교 졸업생인 Israel Krush와 Rom Cohen이 공동 창립한 회사입니다. Israel Krush는 풍부한 업계 경험을 보유한 연쇄 기업가입니다.

Hyro는 고유한 자연어 처리 및 지식 그래프 기술을 사용하여 일반 의료 부서의 일상 업무 중 85%를 처리하는 의료 시스템용 플러그 앤 플레이 내부 채팅 인터페이스를 구축합니다. Hyro는 교육 데이터 없이 고객 유지 관리 작업을 수행하고 내부 정보를 실시간으로 업데이트할 수 있습니다. 플랫폼에 내장된 AI 도우미는 의료 부서의 원래 워크플로우와 일치하여 커뮤니케이션을 중앙 집중화하고 서비스를 개선하며 운영 비용을 절감하는 데 도움을 줄 수 있습니다.

하이로의 ARR은 전년 대비 100% 이상 증가한 것으로 알려졌으며, 주요 고객으로는 머시헬스, 침례교헬스, 인터마운틴헬스케어 등이 있습니다.

6. 상업용 로우코드 머신러닝 플랫폼인 Predibase가 시리즈 A 파이낸싱에서 1,220만 달러를 완료했습니다

Predibase는 개발자를 위한 상용 로우 코드 기계 학습 플랫폼으로, 기계 학습 기술이 없는 사용자가 복잡한 AI 애플리케이션을 빠르고 쉽게 구축, 반복 및 배포할 수 있도록 도와줍니다. 최근 Predibase는 Felicis가 주도하는 시리즈 A 자금 조달에서 1,220만 달러를 받았습니다.

Predibase의 플랫폼을 사용하면 기계 학습 기술이 없는 사용자라도 복잡한 AI 애플리케이션을 빠르고 쉽게 구축, 반복 및 배포할 수 있습니다. 사용자는 플랫폼 자체의 AI 모델을 통해 필요한 콘텐츠만 정의하면 되고, 나머지 작업은 플랫폼에서 자동으로 완료됩니다. 초보 사용자는 권장 모델 아키텍처를 선택할 수 있고, 전문 사용자는 자신의 필요에 따라 모든 모델 매개변수를 미세 조정할 수 있어 AI 애플리케이션의 원래 배포 시간을 크게 단축할 수 있습니다.

Predibase의 창립자이자 CEO인 Piero Molino는 산업계와 학계의 교차점에서 경력을 쌓았습니다. 그는 IBM과 Uber에서 전문적인 경험을 갖고 있으며 스탠포드 대학에서 연구 과학자로도 근무했습니다.

7. 비정형 고객 데이터 AI 분석 플랫폼 Beehive AI가 시드 라운드 파이낸싱에서 510만 달러를 받았습니다

Beehive AI는 구조화되지 않은 고객 데이터를 분석하도록 특별히 설계된 세계 최초의 AI 플랫폼입니다. 최근 Valley Capital Partners가 주도하는 시드 라운드 파이낸싱에서 510만 달러를 받았습니다.

Beehive AI는 전례 없는 정확성, 관련성 및 규모를 갖춘 소비자 조사를 위한 엔드투엔드 맞춤형 엔터프라이즈 AI 플랫폼입니다. Beehive AI는 정량적 데이터와 결합된 비정형 공개 데이터를 분석함으로써 기업이 새로운 통찰력을 추출하고 고객을 더 잘 이해하고 서비스를 제공할 수 있도록 지원합니다.

이 플랫폼을 통해 고객은 모든 플랫폼에서 수집된 기존 데이터를 업로드하거나 AI가 설계한 개방형 질문을 시작하여 고객으로부터 풍부하고 미묘한 피드백을 얻을 수 있습니다. 그런 다음 데이터에 대한 맞춤형 분석을 수행하고 고객이 직관적으로 프로그래밍 가능한 대시보드를 사용하여 통찰력을 탐색할 수 있도록 합니다.

8. 대규모 언어 모델 추론을 전문으로 하는 칩 설계 및 개발자인 Etched.ai는 시드 라운드 파이낸싱에서 536만 달러를 받았습니다

Etched.ai는 대규모 언어 모델 추론을 위한 전용 칩의 설계자이자 개발자입니다. 최근에는 전 Ebay CEO Devin Wenig 등이 참여한 가운데 Primary Venture Partners가 주도하는 536만 달러의 시드 자금 조달을 받았습니다. 회사의 현재 가치는 약 3,400만 달러입니다.

하버드 중퇴자 Gavin Uberti와 Chris Zhu가 설립한 Etched.ai는 생성 AI 모델을 실행하기 위한 보다 전문적이고 저전력 칩을 설계했으며 2024년 3분기에 칩을 시장에 출시하고 판매할 계획입니다. 주요 클라우드 서비스 제공업체에 제공됩니다.

Etched.ai의 창립자들은 시뮬레이션 결과 자사 칩이 기존 GPU에 비해 ​​달러당 성능이 140배 향상된 것으로 나타났습니다.

9. 인공 지능을 사용하여 클라우드 컴퓨팅의 비용 효율성을 개선한 Antimetal은 시드 라운드 파이낸싱에서 430만 달러를 받았습니다

최근 클라우드 컴퓨팅의 비용 효율성을 향상시키기 위해 AI 기술 개발에 전념하고 있는 Antimetal은 Framework Ventures가 주도하는 430만 달러 규모의 시드 라운드 자금 조달을 완료했습니다.

Antimetal은 독점적인 기계 학습 모델을 사용하여 클라우드 컴퓨팅 배포를 최적화하고 가장 주류인 AWS 클라우드 컴퓨팅 서비스에 진출하며 향후 Google 및 Microsoft와 같은 다른 클라우드 컴퓨팅 플랫폼으로 확장할 것입니다.

谷歌StyleDrop在可控性上卷翻MidJourney,前GitHub CTO用AI颠覆编程

회사는 온라인 알고리즘을 개발하고 인공 지능을 사용하여 시장 역학을 연구한 다음 이러한 클라우드 컴퓨팅 리소스를 통합, 예약 및 재판매합니다. 기업이 이러한 유휴 AWS 리소스를 판매하는 데 평균 90일이 걸리지만 Antimetal을 사용하면 거래가 약 3배 더 빨리 완료됩니다.

회사 설립자이자 CEO인 Matthew Parkhurst는 자신의 사업을 시작하기 전에 오랫동안 SaaS 회사에서 근무했으며 7년 이상의 업계 경험을 보유하고 있습니다.

10. AI 의료 영상 스타트업 Hypervision Surgical이 시드 라운드 파이낸싱에서 650만 파운드를 받았습니다

Hypervision Surgical은 최근 HERAN Partners, Redalpine 및 ZEISS Ventures로부터 시드 라운드 파이낸싱으로 650만 파운드를 받았습니다.

Hypervision Surgical은 임상의, 의료 영상 및 인공 지능 전문가로 구성된 팀이 설립한 King's College London의 분사 기업입니다. 그 목표는 임상의에게 고급 컴퓨터 보조 조직 분석을 제공하여 수술 정밀도와 환자 안전을 개선하고 수술 전문 분야에서 환자 이환율과 의료 비용을 줄이는 것입니다.

현재 이 회사는 AI 초분광 이미징과 엣지 컴퓨팅을 결합하여 수술 절차를 위한 의료 이미징을 개발하고 있습니다. 이 기술을 사용하면 외과의사는 복잡한 종양 수술 중에 건강한 조직과 건강에 해로운 조직을 구별하기 위해 정확한 측정과 조직 특성 정보에 의존할 수 있습니다.

회사 팀의 핵심 멤버인 Martin Frost는 수술용 로봇 회사인 CMR Surgical의 창립자이자 전 CEO였습니다. 회사 CEO인 Michael Ebner는 King's College London을 졸업하고 왕립 공학 아카데미(Royal Academy of Engineering) 회원으로 선출되었습니다.

이 기사는 여러 정보 소스에서 Alpha Commune에 의해 편집되었으며 ChatGPT의 도움을 받아 작성되었습니다.

알파 코뮌 소개

谷歌StyleDrop在可控性上卷翻MidJourney,前GitHub CTO用AI颠覆编程

위 내용은 Google StyleDrop은 제어성 측면에서 MidJourney를 능가하며 전 GitHub CTO는 AI를 사용하여 프로그래밍을 전복합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 sohu.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제