찾다

손으로 찢기 Llama3 레이어 1: 처음부터 llama3 구현

풀어 주다:2024-06-01 17:45:42
손으로 찢기 Llama3 레이어 1: 처음부터 llama3 구현

간단하고 보편적임: 시각적 기본 네트워크는 무손실 훈련을 최대 3배 가속화하며 Tsinghua EfficientTrain++가 TPAMI 2024에 선택되었습니다.

풀어 주다:2024-06-01 17:41:29
간단하고 보편적임: 시각적 기본 네트워크는 무손실 훈련을 최대 3배 가속화하며 Tsinghua EfficientTrain++가 TPAMI 2024에 선택되었습니다.

DPO를 완전히 능가함: Chen Danqi 팀은 단순 선호도 최적화 SimPO를 제안하고 가장 강력한 8B 오픈 소스 모델도 개선했습니다.

풀어 주다:2024-06-01 16:41:36
DPO를 완전히 능가함: Chen Danqi 팀은 단순 선호도 최적화 SimPO를 제안하고 가장 강력한 8B 오픈 소스 모델도 개선했습니다.

ControlNet의 새 작품 작성자가 인기를 끌고 있습니다. 도움을 요청하지 않고도 P 사진을 배경으로 변경할 수 있으며 AI 조명이 완벽하게 통합되어 있습니다.

풀어 주다:2024-06-01 16:23:10
ControlNet의 새 작품 작성자가 인기를 끌고 있습니다. 도움을 요청하지 않고도 P 사진을 배경으로 변경할 수 있으며 AI 조명이 완벽하게 통합되어 있습니다.

제어 가능한 핵융합의 새로운 이정표인 AI는 처음으로 이중 토카막 3D 필드의 완전 자동 최적화를 실현하며 Nature 하위 이슈에 게재되었습니다.

풀어 주다:2024-06-01 15:57:53
제어 가능한 핵융합의 새로운 이정표인 AI는 처음으로 이중 토카막 3D 필드의 완전 자동 최적화를 실현하며 Nature 하위 이슈에 게재되었습니다.

Palm Reading Technology는 Amazon Cloud Technology와 협력하여 생성 AI의 힘으로 독서 경험을 재구성합니다.

풀어 주다:2024-06-01 15:02:07
Palm Reading Technology는 Amazon Cloud Technology와 협력하여 생성 AI의 힘으로 독서 경험을 재구성합니다.

Li Feifei는 '공간 지능'의 기업가적 방향을 밝힙니다. 시각화는 통찰력으로 바뀌고, 보는 것은 이해가 되고, 이해는 행동으로 이어집니다.

풀어 주다:2024-06-01 14:55:34
Li Feifei는 '공간 지능'의 기업가적 방향을 밝힙니다. 시각화는 통찰력으로 바뀌고, 보는 것은 이해가 되고, 이해는 행동으로 이어집니다.

Tencent Hunyuan, 모델 매트릭스를 업그레이드하여 클라우드에서 256,000개의 긴 기사 모델 출시​

풀어 주다:2024-06-01 13:46:36
Tencent Hunyuan, 모델 매트릭스를 업그레이드하여 클라우드에서 256,000개의 긴 기사 모델 출시​

Amazon Cloud Technology와 협력하여 Beijing Lingao Technology는 기업이 대규모 모델과 데이터를 원활하게 결합할 수 있도록 지원합니다.​

풀어 주다:2024-06-01 12:48:21
Amazon Cloud Technology와 협력하여 Beijing Lingao Technology는 기업이 대규모 모델과 데이터를 원활하게 결합할 수 있도록 지원합니다.​

Clay Institute의 상금 100만 달러는 AI에게 돌아갈 것입니다. 수학의 규칙은 미래에 '대규모 추측'에 어떻게 대처할 것입니까?

풀어 주다:2024-06-01 11:02:46
Clay Institute의 상금 100만 달러는 AI에게 돌아갈 것입니다. 수학의 규칙은 미래에 '대규모 추측'에 어떻게 대처할 것입니까?

이 기사에서는 SHAP: 기계 학습을 위한 모델 설명을 이해하도록 안내합니다.

풀어 주다:2024-06-01 10:58:13
이 기사에서는 SHAP: 기계 학습을 위한 모델 설명을 이해하도록 안내합니다.

CCIG2024에서 Hehe 정보 문서 분석 기술로 대형 모델 코퍼스의 '기근' 문제를 해결했습니다.

풀어 주다:2024-05-31 22:28:49
CCIG2024에서 Hehe 정보 문서 분석 기술로 대형 모델 코퍼스의 '기근' 문제를 해결했습니다.

Tencent Cloud AI Code Assistant가 대중에게 완전히 공개되었습니다.

풀어 주다:2024-05-31 20:08:24
Tencent Cloud AI Code Assistant가 대중에게 완전히 공개되었습니다.

Flash Attention은 안정적인가요? Meta와 Harvard는 모델 중량 편차가 ​​수십 배로 변동한다는 사실을 발견했습니다.

풀어 주다:2024-05-30 13:24:53
Flash Attention은 안정적인가요? Meta와 Harvard는 모델 중량 편차가 ​​수십 배로 변동한다는 사실을 발견했습니다.

하나의 기사에서는 데이터 모델(개념적 모델, 논리적 모델, 물리적 모델)을 안내합니다.

풀어 주다:2024-05-30 12:00:35
하나의 기사에서는 데이터 모델(개념적 모델, 논리적 모델, 물리적 모델)을 안내합니다.