>기술 주변기기 >일체 포함 >autoML 기술로 더욱 쉽게 AI 개발

autoML 기술로 더욱 쉽게 AI 개발

王林
王林앞으로
2023-04-27 11:31:191035검색

독일 프라이부르크 대학교 기계 학습 연구소 소장인 프랭크 후터(Frank Hutter)는 이러한 모든 인간 결정의 결과로 복잡한 모델이 체계적으로 설계되기보다는 "직관적으로 설계"되게 된다고 말했습니다.

借助 autoML 技术更容易地开发AI

자동 기계 학습(autoML)이라는 성장 분야는 이러한 추측을 없애는 것을 목표로 합니다. 아이디어는 연구자들이 현재 모델을 설계할 때 내려야 하는 결정을 알고리즘이 대신하도록 하는 것입니다. 궁극적으로 이러한 기술은 머신러닝의 접근성을 더욱 높일 수 있습니다.

자동 기계 학습이 등장한 지 거의 10년이 되었지만, 연구자들은 여전히 ​​이를 개선하기 위해 노력하고 있습니다. 오늘 볼티모어에서 열리는 새로운 컨퍼런스에서는 autoML의 정확성을 향상하고 성능을 간소화하기 위한 노력을 소개합니다.

기계 학습을 단순화하는 autoML의 잠재력에 큰 관심이 있습니다. Amazon 및 Google과 같은 회사는 이미 autoML 기술을 활용하는 로우 코드 기계 학습 도구를 제공하고 있습니다. 이러한 기술이 더욱 효과적이라면 연구 속도가 빨라지고 더 많은 사람들이 기계 학습을 사용할 수 있게 될 수 있습니다.

사람들이 묻고 싶은 질문을 선택하고, autoML 도구를 가리키고, 원하는 결과를 얻을 수 있도록 하는 것이 아이디어입니다.

이 비전은 "컴퓨터 과학의 성배"라고 와이오밍 대학의 컴퓨터 과학 조교수이자 회의 주최자인 Lars Kottoff는 말했습니다. "당신이 문제를 지정하면 컴퓨터는 문제를 해결하는 방법을 알고 있으며 그게 전부입니다. 해야 합니다." 하지만 먼저 연구자들은 이러한 기술을 시간과 에너지 효율적으로 만드는 방법을 알아내야 합니다.

자동 머신러닝으로 무엇을 해결할 수 있나요?

언뜻 보면 autoML의 개념이 중복되어 보일 수 있습니다. 결국 기계 학습은 이미 데이터에서 통찰력을 도출하는 프로세스를 자동화하는 것입니다. 그러나 autoML 알고리즘은 기본 기계 학습 모델 위의 추상화 수준에서 작동하고 지침을 위해 해당 모델의 출력에만 의존하기 때문에 시간과 계산 노력을 절약할 수 있습니다.

연구원은 사전 훈련된 모델에 autoML 기술을 적용하여 기존 연구를 복제하는 데 컴퓨팅 성능을 낭비하지 않고 새로운 통찰력을 얻을 수 있습니다.

예를 들어, 미국 Fujitsu 연구소의 연구 과학자인 Mehdi Bahrami와 그의 공동 저자는 새로운 목적에 적응하기 위해 사전 훈련된 다양한 모델과 함께 BERT 정렬 알고리즘을 사용하는 방법에 대한 최근 연구를 발표했습니다.

BERT-sort는 데이터 세트를 학습할 때 "의미 순서"를 찾는 알고리즘입니다. 예를 들어, 영화 리뷰 데이터가 주어지면 "훌륭한" 영화가 "좋은" 영화와 "나쁜" 영화보다 순위가 더 높다는 것을 알고 있습니다.

autoML 기술을 사용하면 학습된 의미 순서를 일반화하여 암 진단은 물론 외국어 텍스트까지 분류할 수 있으므로 시간과 계산이 줄어듭니다.

"BERT는 수개월의 계산이 필요하며 모델을 생성하고 프로세스를 반복하는 데 100만 달러 정도의 비용이 많이 듭니다." Bahrami는 "따라서 모든 사람이 동일한 작업을 수행하려면 비용이 많이 듭니다. 이는 에너지 효율적이지 않고 나쁘지 않습니다. "

현장에서 보여준 가능성에도 불구하고 연구자들은 여전히 ​​autoML 기술을 더욱 계산적으로 효율적으로 만드는 방법을 찾고 있습니다. 예를 들어, 다양한 모델을 구축하고 테스트하여 가장 적합한 모델을 찾는 NAS(신경 아키텍처 검색)와 같은 방법을 사용하면 이러한 모든 반복을 완료하는 데 필요한 에너지가 상당할 수 있습니다.

자동 기계 학습은 무작위 결정 포레스트 생성이나 데이터 분류를 위한 지원 벡터 기계와 같이 신경망을 포함하지 않는 기계 학습 알고리즘에도 적용될 수 있습니다. 이 분야에 대한 연구가 진행 중이며, autoML 기술을 프로젝트에 통합하려는 사람들이 사용할 수 있는 코딩 라이브러리가 이미 많이 있습니다.

Hutter는 다음 단계는 autoML을 사용하여 불확실성을 정량화하고 알고리즘의 신뢰성과 공정성 문제를 해결하는 것이라고 말했습니다. 이 비전에서 신뢰성과 공정성에 대한 기준은 정확성과 같은 다른 기계 학습 제약 조건과 유사합니다. AutoML은 이러한 알고리즘이 출시되기 전에 이러한 알고리즘에서 발견된 편향을 캡처하고 자동으로 수정할 수 있습니다.

신경 아키텍처 검색의 지속적인 발전

그러나 딥 러닝과 같은 애플리케이션의 경우 autoML은 아직 갈 길이 멉니다. 이미지, 문서, 녹음된 음성 등 딥 러닝 모델을 훈련하는 데 사용되는 데이터는 밀도가 높고 복잡한 경우가 많습니다. 처리하려면 엄청난 컴퓨팅 성능이 필요합니다. 이러한 모델을 훈련하는 데 드는 비용과 시간은 돈이 많은 대기업에서 일하는 연구원을 제외하고 누구에게나 엄청나게 부담스러울 수 있습니다.

컨퍼런스의 경쟁 요구 사항 중 하나는 참가자가 신경 구조 검색을 위한 에너지 효율적인 대체 알고리즘을 개발하는 것입니다. 이 기술은 계산 요구 사항으로 악명 높기 때문에 이는 상당히 어려운 일입니다. 연구자들이 자신의 응용 분야에 적합한 모델을 선택할 수 있도록 수많은 딥 러닝 모델을 자동으로 순환하지만 프로세스에는 몇 달이 걸리고 백만 달러 이상의 비용이 소요될 수 있습니다.

비용이 전혀 들지 않는 신경 아키텍처 검색 에이전트라고 하는 이러한 대체 알고리즘의 목표는 계산 요구 사항을 줄여 신경 아키텍처 검색에 더 쉽게 접근하고 친환경적으로 만드는 것입니다. 결과를 실행하는 데 몇 달이 아니라 몇 초가 걸립니다. 현재 이러한 기술은 아직 개발 초기 단계에 있으며 종종 신뢰할 수 없지만, 기계 학습 연구자들은 모델 선택 프로세스를 보다 효율적으로 만들 수 있는 잠재력이 있다고 예측합니다.


위 내용은 autoML 기술로 더욱 쉽게 AI 개발의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제