Meta Platforms는 오늘 Meta가 내부적으로 개발하여 200개 언어로 텍스트를 번역할 수 있는 인공 지능 시스템인 NLLB-200의 시스템 코드를 공개했습니다.
Meta는 연구원들이 NLLB-200을 소프트웨어 프로젝트에 보다 쉽게 적용할 수 있도록 설계된 도구 세트도 발표했습니다.
Meta에 따르면 NLLB-200이 이해할 수 있는 200개 언어 중 상당수는 다른 AI 번역 시스템에서는 잘 지원되지 않습니다. 현재 널리 사용되는 번역 도구는 25개 미만의 아프리카 언어를 지원하지만 NLLB-200은 최대 55개 아프리카 언어를 지원합니다.
Meta는 번역 정확도가 NLLB-200이 다른 도구보다 뛰어난 또 다른 영역이라고 말합니다. Meta는 기계 번역된 텍스트의 품질을 측정하는 데 사용되는 알고리즘인 BLEU 평가 시스템의 정확도 표준을 사용합니다. Meta에 따르면 NLLB-200의 BLEU 점수는 이전보다 평균 44% 높아졌습니다.
Meta CEO Mark Zuckerberg는 다음과 같이 말했습니다. "우리는 200개의 다양한 언어를 번역할 수 있는 자체 개발 AI 모델을 오픈 소스화했습니다. 그 중 다수는 현재 번역 시스템에서 지원되지 않습니다. 우리는 이 프로젝트를 For No Language Left Behind라고 부릅니다. 우리가 사용하는 인공지능 모델링 기술은 전 세계 수십억 명이 사용하는 언어에 대한 고품질 번역을 생산하고 있습니다.”
NLLB-200은 500억 개가 넘는 매개변수를 가지고 있으며 이러한 구성이 AI 시스템의 방식을 결정합니다. 데이터가 처리됩니다. AI 시스템에 매개변수가 많을수록 정확도가 높아집니다.
NLLB-200에 이렇게 많은 매개변수가 있다는 사실이 200개 언어를 높은 정확도로 지원할 수 있는 유일한 요소는 아닙니다. NLLB-200 시스템은 Meta가 개발한 다른 많은 AI 혁신도 활용하기 때문입니다. 엔지니어.
Meta는 자체 개발한 LASER 툴킷을 사용하여 머신러닝 관련 연구를 지원합니다. 연구자들은 툴킷을 사용하여 신경망을 훈련시켜 한 언어로 특정 작업을 수행한 다음 비교적 쉽게 신경망을 다른 언어에 적용할 수 있으며 이는 번역 목적에 유용합니다. Meta는 향상된 LASER 버전인 LASER3를 지원하는 새로운 NLLB-200 시스템을 개발했습니다.
LASER의 원본 버전에는 텍스트를 AI 시스템이 이해할 수 있는 수학적 표현으로 변환하는 특수 구성 요소인 LSTM이라는 신경망이 포함되어 있습니다. 이 수학적 표현은 보다 정확한 번역을 생성하는 데 도움이 됩니다. LASER3에서 Meta는 LSTM 신경망을 동일한 작업을 보다 효율적으로 수행할 수 있는 고급 자연어 처리 모델인 Transformer로 대체합니다.
Meta는 훈련 데이터를 수집하는 데 사용되는 시스템을 업그레이드하고 AI 훈련 워크플로를 변경하는 등 NLLB-200의 기능을 개선하기 위해 여러 가지 다른 방법도 사용했습니다.
Meta는 자체 개발한 Research SuperCluster 슈퍼컴퓨터(사진)를 사용하여 NLLB-200을 훈련합니다. Meta는 올해 1월 Research SuperCluster를 처음 출시했을 때 시스템에 Nvidia의 최신 A100 데이터센터 GPU 6,080개가 탑재되었으며 최종적으로 16,000 GPU로 업그레이드될 것이라고 밝혔습니다.
Meta는 NLLB-200을 사용하여 Facebook, Instagram 및 기타 플랫폼에서 더 나은 자동 번역 기능을 제공할 계획이며, 이 시스템은 하루 250억 건 이상의 번역을 지원할 것으로 예상됩니다.
Meta는 내부적으로 NLLB-200을 홍보하는 동시에 다른 기업 조직이 자체 소프트웨어 프로젝트에 시스템을 적용하도록 지원할 계획입니다.
Meta에는 NLLB-200 외에도 AI 훈련에 사용할 수 있는 오픈 소스 코드와 번역 정확도 평가를 위한 FLORES-200이라는 데이터 세트가 있습니다. Meta는 비영리 단체가 NLLB-200을 채택할 수 있도록 최대 200,000달러의 자금을 제공할 것입니다. 또한 Meta는 Wikimedia Foundation과 협력하여 Wikipedia 기사에 자동 번역 기술을 적용할 예정입니다.
위 내용은 500억 개 이상의 매개변수를 사용하여 200개 언어를 번역함으로써 AI 텍스트 번역 시스템의 품질이 44% 향상되었습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!