>  기사  >  기술 주변기기  >  기업은 머신러닝 운영을 활용하여 비즈니스 이점을 얻고 있습니다.

기업은 머신러닝 운영을 활용하여 비즈니스 이점을 얻고 있습니다.

PHPz
PHPz앞으로
2023-04-10 08:51:05897검색

​기업이 처음 AI 배포와 머신러닝 프로젝트 시작을 시작할 때 이론적인 수준에 초점을 맞추는 경우가 많습니다. 필요한 결과를 제공할 수 있는 모델이 있습니까? 이 모델을 구축하는 방법은 무엇입니까?

기업은 머신러닝 운영을 활용하여 비즈니스 이점을 얻고 있습니다.

그러나 이러한 개념 증명을 개발하기 위해 데이터 과학자가 사용하는 도구는 종종 잘 해석되지 않습니다. 생산 시스템. 결과적으로 IDC에 따르면 AI 또는 머신러닝 솔루션을 배포하는 데 평균 9개월 이상이 소요됩니다.

IDC 분석가 Sriram Subramanian은 다음과 같이 말했습니다. "우리는 이를 '모델 속도'라고 부릅니다. 이는 모델이 처음부터 끝까지 진행되는 데 걸리는 시간입니다."

여기서 MLOps가 활용됩니다. MLOps(기계 학습 운영)는 기업이 데이터, 모델, 배포, 모니터링 및 이론적 개념 증명을 수행하고 AI 시스템을 사용하는 데 필요한 기타 측면을 관리하는 데 도움이 되는 일련의 모범 사례, 프레임워크 및 도구입니다.

Subramanian은 "MLOps는 모델 속도를 몇 주, 때로는 며칠로 줄일 수 있습니다."라고 말했습니다. “개발 운영(DevOps)을 사용하면 애플리케이션 개발에 소요되는 평균 시간을 단축할 수 있으므로 MLOps를 사용해야 합니다.”

그는 MLOps를 사용하면 기업이 더 많은 모델을 구축하고 더 빠르게 혁신하고 더 많은 것을 처리할 수 있다고 말했습니다. 사용 사례. "가치 제안은 매우 명확합니다"라고 그는 말했습니다.

IDC는 2024년까지 기업의 60%가 MLOps를 사용하여 기계 학습 워크플로를 구현할 것으로 예측합니다. Subramanian은 기업이 AI 및 머신러닝 기술을 사용할 때 직면하는 과제에 대한 설문조사를 실시했을 때 MLOps의 부족이 비용 다음으로 기업이 AI 및 머신러닝 기술을 채택하는 데 주요 장벽으로 나타났다고 말했습니다.

여기에서는 MLOP가 무엇인지, MLOP가 어떻게 진화하고 있는지, 조직이 AI 기술을 구현할 때 이 새로운 접근 방식을 최대한 활용하기 위해 사용하고 염두에 두어야 할 사항을 살펴보겠습니다.

MLOps의 진화

Eugenio Zuccarelli가 몇 년 전 처음으로 기계 학습 프로젝트 설계를 시작했을 때 MLOps는 단지 모범 사례 모음에 불과했습니다. 그 이후로 Zuccarelli는 의료 및 금융 서비스 분야를 포함한 여러 회사에서 AI 프로젝트에 참여했으며 시간이 지남에 따라 MLOps가 다양한 도구와 플랫폼을 포함하도록 발전하는 것을 확인했습니다.

현재 MLOps는 AI 기술 구현을 위한 상당히 강력한 프레임워크를 제공한다고 현재 CVS Health의 혁신 데이터 과학자인 Zuccarelli는 말했습니다. 예를 들어, Zuccarelli는 병원 재입원이나 질병 진행과 같은 불리한 결과를 예측할 수 있는 앱을 개발하기 위해 작업했던 이전 프로젝트를 지적했습니다.

“우리는 최고의 모델의 특성을 파악하기 위해 데이터세트와 모델을 살펴보고 의사들과 이야기를 나누었습니다.”라고 그는 말했습니다. "하지만 이러한 모델을 정말 유용하게 만들려면 이러한 모델을 실제 사용자에게 공개해야 합니다.

즉, 안정적이고 빠르며 안정적인 모바일 앱을 개발하고 백엔드 연결된 기계 학습에 API를 두는 것을 의미합니다." 시스템. “MLOps가 없었다면 우리는 이를 보장할 수 없었을 것입니다.”라고 그는 말했습니다.

그의 팀은 H2O MLOps 플랫폼과 기타 도구를 사용하여 모델에 대한 건강 대시보드를 만들었습니다. "모델이 크게 변경되는 것을 원하지 않습니다"라고 그는 말했습니다. "그리고 편견을 도입하고 싶지는 않습니다. 이 상태 대시보드를 통해 시스템에 변경 사항이 발생했는지 이해할 수 있습니다."

MLOps 플랫폼을 사용하면 프로덕션 시스템을 업데이트할 수도 있습니다. Zuccarelli는 "애플리케이션 실행을 중단하지 않고 파일을 교체하는 것은 매우 어렵습니다."라고 말했습니다. "시스템이 생산 중이더라도 MLOps 도구는 시스템 자체에 대한 중단을 최소화하면서 시스템을 교체할 수 있습니다."

그는 MLOps 플랫폼이 성숙해지면 이러한 플랫폼이 전체 모델 개발 프로세스의 속도를 높일 것이라고 말했습니다. 모든 프로젝트마다 반복적인 작업을 헛되이 수행할 필요가 없습니다. 데이터 파이프라인 관리 기능도 AI 구현에 중요합니다.

"서로 통신해야 하는 데이터 소스가 여러 개인 경우 MLOps가 작동합니다."라고 그는 말했습니다. “머신 러닝 모델에 유입되는 모든 데이터는 일관되고 품질이 좋기를 원합니다. 흔히 말하는 대로 쓰레기가 들어오면 쓰레기가 나가기 마련입니다. 모델에 제공되는 정보의 품질이 좋지 않으면 예측 자체도 좋지 않을 것입니다. .”

MLOps의 기본: 대상 이동

그러나 현재 사용 가능한 일부 플랫폼과 도구가 있다고 해서 MLOps의 핵심 원칙을 무시할 수 있다고 생각하지 마십시오. 이 분야에서 막 시작한 기업은 MLOps의 핵심이 데이터 과학과 데이터 엔지니어링 간의 강력한 연결을 만드는 것임을 기억해야 합니다.

“MLOps 프로젝트가 성공하려면 데이터 엔지니어와 데이터 과학자가 모두 같은 팀에 있어야 합니다.”라고 Zuccarelli는 말했습니다.

또한 편견을 방지하고 투명성을 보장하며 설명 가능성을 제공하고 윤리를 지원하는 데 필요한 도구(아직 개발 중인 도구)를 플랫폼에 갖추라고 그는 말했습니다. "이것은 매우 새로운 영역이기 때문에 확실히 많은 작업이 필요합니다."

따라서 완전한 턴키 솔루션을 사용할 수 없으면 기업은 AI 기술을 구현하기 전에 모든 측면에 능숙해야 합니다. 이것이 MLOps를 매우 효율적으로 만드는 이유입니다. 템피에 본사를 둔 Insight 기술 컨설팅 회사의 AI 팀 국내 실무 관리자인 Meagan Gentry는 이는 업무에 대한 전문 지식을 배우는 것을 의미한다고 말했습니다.

MLOps는 데이터 수집, 검증, 분석부터 기계 리소스 관리 및 모델 성능 추적까지 모든 것을 다룹니다. 비즈니스에 도움이 되는 일부 도구는 온프레미스, 클라우드 또는 엣지에 배포될 수 있습니다. 이러한 도구는 오픈 소스이거나 독점일 수 있습니다.

그러나 기술적인 지식을 갖는 것은 솔루션의 일부일 뿐입니다. MLOps는 또한 개발 운영(DevOps)과 반복 개발 원칙의 민첩한 방법을 활용한다고 Gentry는 말했습니다. 또한 애자일 개발과 관련된 영역과 마찬가지로 커뮤니케이션도 중요합니다.

“모든 캐릭터 간의 소통이 중요해요.”라고 그녀는 말했습니다. "데이터 과학자와 데이터 엔지니어 간의 커뮤니케이션. DevOps와의 커뮤니케이션, 그리고 대규모 IT 팀과의 커뮤니케이션."

이제 막 시작한 기업의 경우 MLOps가 혼란스러울 수 있습니다. 몇 가지 일반적인 원칙을 볼 수 있으며, 수십 개의 공급업체가 있으며, 훨씬 더 많은 오픈 소스 도구 상자가 있습니다.

Capgemini Americas의 엔터프라이즈 아키텍처 수석 관리자인 Helen Ristov는 "몇 가지 함정이 있습니다"라고 말했습니다. "이러한 함정 중 상당수는 개발 과정에 있습니다. DevOps에서 볼 수 있는 공식적인 지침 세트는 없습니다. 이는 새로운 기술이며 일부 지침과 전략은 개발하는 데 시간이 걸릴 것입니다. "

Ristov는 제안했습니다. 기업은 데이터 플랫폼에서 MLOps 여정을 시작합니다. "아마도 그들은 여러 개의 데이터 세트를 가지고 있을 것입니다. 그러나 그들은 서로 다른 장소에 있고 응집력 있는 환경에 있지 않습니다."라고 그녀는 말했습니다.

그녀는 기업이 모든 데이터를 하나의 플랫폼으로 이동할 필요는 없지만 애플리케이션에 따라 다를 수 있는 다양한 데이터 소스에서 데이터를 가져올 수 있는 방법이 필요하다고 말했습니다. 예를 들어 데이터 레이크는 저렴한 스토리지가 필요하고 대량의 분석을 자주 수행하는 기업에 적합합니다.

그녀는 MLOps 플랫폼이 일반적으로 다양한 버전의 훈련 데이터를 기록하면서 데이터 파이프라인을 구축하고 관리하는 몇 가지 도구를 제공하지만 이것이 일회성 솔루션은 아니라고 말했습니다.

그런 다음 모델 생성, 버전 관리, 로깅, 측정 기능 세트 및 모델 자체 관리의 기타 측면도 제공합니다.

Ristov는 "코딩 작업이 많이 필요합니다."라고 말하면서 MLOps 플랫폼을 설정하는 데 몇 달이 걸릴 수 있으며 통합 작업과 관련하여 플랫폼 공급업체는 여전히 해야 할 일이 많다고 덧붙였습니다.

“다양한 방향으로 많은 성장이 진행되고 있습니다.”라고 그녀는 말했습니다. "개발 중인 도구가 많고 생태계가 매우 크며 사람들은 필요한 것을 고르고 선택하고 있습니다. MLOps는 미성숙 단계에 있습니다. 대부분의 조직은 여전히 ​​최고의 구성을 찾고 있습니다." MLOps 환경 정보

IDC의 Subramanian은 MLOps 시장 규모가 2020년 약 1억 8,500만 달러에서 2025년까지 약 7억 달러로 성장할 것으로 예상한다고 밝혔습니다. 그러나 그는 MLOps 제품이 더 큰 플랫폼과 함께 번들로 제공되는 경우가 많기 때문에 이는 심각한 과소평가일 수 있다고 말했습니다. 2025년에는 시장의 실제 규모가 20억 달러를 초과할 수 있다고 그는 말했습니다.

Subramanian은 MLOps 제공업체가 일반적으로 세 가지 범주로 나누어진다고 말했습니다. 첫 번째는 Amazon Web Services(AWS), Azure Cloud 및 Google Cloud를 포함한 대규모 클라우드 제공업체입니다. 이러한 클라우드 플랫폼은 MLOps 기능을 서비스로 사용합니다.

그리고 DataRobot, Dataiku, Iguazio 등과 같은 일부 기계 학습 플랫폼 공급업체가 있습니다.

"세 번째 범주는 데이터 관리 공급업체라고 부르던 것입니다."라고 그는 말했습니다. "Cloudera, SAS 및 DataBricks와 같은 회사입니다. 이들 회사의 장점은 데이터 관리 기능과 데이터 운영에 있으며, 이후에는 기계 학습 기능을 갖추고 결국에는 MLOps 기능으로 확장됩니다.

Subramanian은 세 가지 영역 모두에서 경험하고 있는 것이 있다고 말했습니다. MLOps 공급업체를 돋보이게 만드는 핵심은 온프레미스와 클라우드 모두에서 모델 배포를 지원할 수 있는지, 신뢰할 수 있고 책임감 있는 AI를 구현할 수 있는지, 플러그 앤 플레이 기능을 제공할 수 있는지 여부입니다. 솔루션과 해당 솔루션을 쉽게 확장할 수 있는지 여부. "여기서 벤더 간의 차이가 발생합니다."라고 그는 말했습니다.

최근 IDC 조사에 따르면 책임 있는 AI를 구현하는 방법의 부족은 AI 및 기계 학습 기술 사용에 대한 3대 장벽 중 하나이며 MLOps 자체의 부족과 함께 2위를 차지했습니다.

컨설팅 회사 Gartner의 AI 및 기계 학습 기술 연구 분석가인 Sumit Agarwal은 MLOps를 사용하는 것 외에는 대안이 없기 때문이라고 말했습니다.

“다른 모든 방법은 수동입니다.”라고 그는 말했습니다. "따라서 다른 선택의 여지가 없습니다. 확장하려면 자동화가 필요합니다. 코드, 데이터 및 모델의 추적성이 필요합니다."

컨설팅 회사인 Gartner의 최근 설문 조사에 따르면 개념 증명부터 생산까지의 평균 시간이 9개월에서 7.3개월로 단축되었습니다. “그러나 7.3개월은 여전히 ​​긴 주기입니다.”라고 Agarwal은 말했습니다. "조직이 MLOps를 활용할 수 있는 기회는 많습니다."

조직 문화를 MLOps로 전환

Amaresh Tripathy, Genpact의 글로벌 분석 실무 리더, MLOps는 기업의 AI 팀에도 조직 문화 변화를 요구합니다. .

“데이터 과학자들에게 공통적으로 주어지는 이미지는 건초 더미에서 바늘을 찾으려는 미친 과학자의 이미지입니다.”라고 그는 말했습니다. "데이터 과학자는 위젯을 생산하는 공장 현장이 아니라 발견자이자 탐험가입니다. 하지만 실제로 확장을 원할 때 해야 할 일입니다."

그는 기업이 자신이 가지고 있는 것을 과소평가하는 경향이 있다고 말했습니다. .

“사람들은 소프트웨어 엔지니어링에 대해 더 잘 이해하고 있습니다.”라고 그는 말했습니다. “사용자 경험과 요구 사항에 대한 많은 규칙이 있습니다. 하지만 사람들은 모델을 배포할 때 동일한 프로세스를 거쳐야 한다고 생각하지 않습니다. 테스트에 능숙한 모든 데이터 과학자는 오해도 있습니다. 환경 사람들은 자연스럽게 특정 모델을 배포할 수도 있고, 작업을 완료하기 위해 몇 명의 IT 동료를 보낼 수도 있습니다.”

기업에서는 이를 인식하지 못했습니다. 회사의 다른 부분에 파급 효과를 줄 수 있으며 종종 극적인 변화를 가져옵니다.

“MLOps를 고객 서비스 센터에 배포할 수 있지만 일부 간단한 작업은 기계와 AI가 처리하기 때문에 평균 응답 시간이 실제로 늘어나는 반면, 사람에게 넘겨지는 작업은 실제로 더 오랜 시간이 걸립니다. 콤플렉스”라고 말했다. "따라서 업무가 어떻게 될지, 어떤 종류의 사람이 필요한지, 어떤 기술이 있어야 하는지 다시 생각해야 합니다."

오늘날 조직에서 결정의 5% 미만이 결정에 의해 결정된다고 그는 말했습니다. 하지만 이는 빠르게 변화하고 있습니다. "우리는 향후 5년 내에 의사결정의 20~25%가 알고리즘에 의해 주도될 것으로 예측합니다. 우리가 연구하는 모든 통계는 우리가 AI의 급속한 확장의 변곡점에 있음을 보여줍니다." MLOps는 핵심 요소입니다.

“100퍼센트”라고 그는 말했습니다. “MLOps 없이는 AI를 지속 가능하게 사용할 수 없습니다.

위 내용은 기업은 머신러닝 운영을 활용하여 비즈니스 이점을 얻고 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제