화산 엔진과 대형 모델을 사용하여 데이터 플라이휠을 '점화'합니다.-일체 포함-php.cn

집

기술 주변기기

일체 포함

화산 엔진과 대형 모델을 사용하여 데이터 플라이휠을 '점화'합니다.

王林

Sep 20, 2023 pm 09:21 PM

화산 엔진프로젝트

수천 개의 산업을 변화시키는 대형 모델의 과정에서 Volcano Engine은 데이터 산업에 맞춤형 답변을 제공하는 데 앞장섰습니다.

9월 19일 상하이에서 열린 "Data Flywheel V-Tech Data Driven Technology Summit"에서 Volcano Engine은 디지털 지능 플랫폼 VeDI의 대규모 언어 모델(Large Language Models) 기능을 발표했습니다.

제품 업그레이드 후 자연어를 사용하여 "숫자 찾기", 데이터 웨어하우스 모델 개발 지원, 코드 최적화, 시각적 차트 생성 완료, 대화 및 기타 기능 중 속성 분석 구현이 가능합니다. 코딩 실력이 없는 일반 운영자도 빠르게 숫자를 찾고 분석할 수 있습니다. 현재 VeDI 관련 데이터 상품이 테스트 대상으로 초청되어 있습니다.

업그레이드된 데이터 제품으로 인해 데이터 사용의 한계가 대폭 낮아졌습니다. 과거에는 일반 운영자가 번호를 찾으려면 번호를 검색하는 데 도움이 되는 코드를 작성하는 R&D 직원에게 문의해야 하는 경우가 많았습니다. 데이터를 분석하려면 많은 전문 지식이 필요했습니다. 이제 업그레이드된 데이터 제품의 도움으로 운영자는 언제든지 자연어로 요구 사항을 입력하고 원하는 데이터를 실시간으로 얻을 수 있습니다.

이것은 데이터의 가치를 더욱 자극할 것입니다. 기업 내에서 사용 임계값이 낮아지면 데이터 소비 체인에 있는 더 많은 사람들이 데이터에 접근하고 사용할 수 있게 됩니다. 과거에 실제 임계값으로 인해 억제되었던 데이터 요구 사항이 충족되고 데이터를 기반으로 한 비즈니스 통찰력이 제공됩니다. 보다 시기적절하고 의사결정이 더욱 시기적절해질 것입니다. 더욱 과학적이고 데이터 기반의 비즈니스 상상력이 발휘될 것입니다.

디지털화를 진행 중인 기업의 경우, 데이터의 가치는 더 높은 유통 빈도로 공개되고, 데이터 플라이휠은 더욱 가속화될 것입니다.

대형 모델은 전체 데이터 링크에 통합되어 데이터 생성 및 사용에 대한 임계값을 더욱 줄입니다.

소형 모델에 비해 대형 모델은 강력한 일반화 추론 기능, 외부 도구 검색 기능 및 코드 생성 능력. 이러한 기능은 데이터 제품에 상당한 영향을 미칩니다.

일반화된 추론 능력이 강할수록 지능도 높아지지만 동시에 수학과 분석 능력 등 다양한 능력을 조정할 수 있는 여러 도구를 결합하여 보완해야 합니다. 대형 모델 시대에 열린 자연어 상호 작용 모델은 데이터 제품의 활용에도 새로운 상상의 공간을 가져왔습니다.

올해 3월부터 Byte는 내부적으로 대규모 모델과 데이터 제품을 결합하기 시작했습니다. 빠른 반복을 통한 소규모 테스트에서 Luo Xuan 팀은 곧 데이터 제품의 주요 시나리오에서 대규모 모델이 개선과 변화는 분명합니다. 그 후 팀은 데이터 제품 시나리오에서 대규모 실험을 시작하여 지속적으로 시나리오의 우선 순위를 정량화하고 제품에서 대규모 모델 구현을 촉진했습니다.

데이터 산업을 변화시키는 대규모 모델 과정에서 시나리오 선택은 가장 중요한 단계 중 하나입니다 적절한 사용 시나리오는 현재 기술이나 예측 가능한 기술을 기반으로 구축되어야 할 뿐만 아니라 대형 모델을 추가한 후에는 사용자 또는 비즈니스 당사자가 더 나은 경험을 가질 수 있고 동시에 더 많은 데이터 소비 가치를 제공하여 데이터 생산을 더욱 촉진할 수 있다는 것이 보장됩니다.

Luo Xuan은 예를 들어 일부 시나리오에서 원래 솔루션이 1~2초만 소요된다면 대형 모델을 사용한 후 대형 모델의 지연 문제로 인해 5초 이상 걸릴 수 있다고 공유했습니다. 자연어를 사용하는 경우 이 시나리오는 적시성에 대한 비즈니스 경험 요구를 충족할 수 없으며 유효하지 않습니다.

“그러나 예를 들어 단축 코드 생성 과정에서 자연어를 추가하면 장면의 효율성이 크게 향상됩니다. 앞으로는 대형 모델의 성능이 모든 측면에서 지속적으로 향상될 것입니다. 완전한 데이터 링크, 대형 모델이 가져올 지능적인 변화는 더욱 기대할만한 가치가 있을 것입니다.”

이번 "Data Flywheel V-Tech Data Driven Technology Summit"에서는 디지털 지능의 제품 업그레이드가 Volcano Engine이 발표한 VeDI 플랫폼은 주로 DataLeap과 DataWind의 두 부분으로 구성됩니다. 그 중 DataLeap의 "Number Assistant"는 질문과 답변 방식으로 숫자 찾기를 지원할 수 있으며, "Development Assistant"는 자연어로 SQL 코드 생성 및 최적화를 지원할 수 있습니다. DataWind - Analysis Assistant는 자연어를 지원할 수 있습니다. 데이터 시각화 쿼리 및 분석을 완료하는 언어입니다. 숫자를 찾고, 검색하고, 분석하는 전체 링크를 포괄하여 데이터 생산 및 소비의 전 과정에 대한 기술적 한계를 낮춥니다.

DataLeap - 숫자 찾기 도우미

"숫자 찾기"는 일반적으로 전체 데이터 소비 체인의 첫 번째 단계입니다. 올바른 데이터 자산을 찾는 것만으로도 데이터 소비가 실현될 수 있습니다.그러나 전통적인 프로세스의 "숫자 찾기"는 간단한 작업이 아니며 비즈니스 전문 지식의 입력에 크게 의존해야 합니다. 일반적으로 사람들은 키워드 검색 후 수동 심사를 통해서만 확인할 수 있거나 전문 데이터 개발자를 찾을 수 있습니다. P DataLEAP 사용 - 보조자 "찾기 계산" 찾기

화산 엔진과 대형 모델을 사용하여 데이터 플라이휠을 점화합니다.

^{"어시스턴트 찾기" 기능은 대형 언어 모델(LLM)과 결합되어 "찾기 계산"의 임계값을 크게 줄입니다.}"수치 검색 도우미"를 사용하면 코딩 기술이 없는 사람도 자연어를 통해 "의인화" 쿼리를 수행할 수 있습니다

. 예를 들어 전자상거래 운영자는 "하오우 라이브 방송룸의 운영 조건은 어떻습니까?" 지난 7일?" DataLeap - 데이터 검색 도우미는 비즈니스 지식 베이스를 기반으로 비즈니스 조건과 관련된 테이블을 추천하고, 각 테이블에 해당하는 데이터 차원을 설명합니다.

현재 "Number Finder Assistant"는 Hive 테이블, 데이터 세트, 대시보드, 데이터 표시기, 차원 등을 포함한 다양한 데이터 유형 및 관련 비즈니스 지식에 대한 질문 및 답변 검색을 구현하고 의인화된 쿼리를 실현할 수 있습니다. .

또한 "숫자 찾기"를 더 쉽게 만드는 것 외에도 대형 모델의 기능과 결합된 "숫자 찾기 도우미"는 "숫자 찾기"의 정확도를 더욱 향상시킬 수 있습니다. 과거의 전통적인 기술 솔루션에서는 데이터 자산 검색이 정형 데이터 관리에 의존했으며, 구조화되지 않은 비즈니스 데이터에는 연결이 누락될 수 있습니다. 비즈니스 시나리오를 효율적으로 찾고 소비하세요. 또한, 검색은 키워드를 기반으로 일련의 후보 답변을 제공하므로 수동 심사 및 확인이 필요하므로 사용자가 좋은 경험을 하기 어렵습니다.

이제 사용자와의 대화 과정에서 LLM(대형 언어 모델)이 사용자의 실제 의도를 이해할 수 있어 검색 프로세스가 더욱 집중화되고 인간의 판단 비용이 절약되며 "숫자 찾기" 자체가 더욱 쉬워집니다. 동시에 모델 의미 이해 및 분석 기능이 점진적으로 향상됨에 따라 대화형 검색은 단순 키워드 검색보다 전체 링크에서 검색 효율성이 더 높습니다.

DataLeap - Development Assistant

데이터 생성 및 처리 과정에서 "Development Assistant"는 자연어 사용을 지원하고 자동으로 SQL 코드를 생성하여 버그 복구 및 코드를 자동으로 구현할 수 있습니다. 기존 코드에 대한 최적화, 설명, 코멘트 등을 제공합니다. 또한, 문서 검색, 기능 사용법, 코드 예제 등 SQL 사용 문제도 대화를 통해 상담할 수 있습니다.代 SQL 코드 자동 개발

하위 계층의 개발 보조 장치는 대규모 코드 및 코퍼스 트레이닝 후 사용자의 자연어 정보에 따라 입력하고 고품질을 생성할 수 있습니다. 데이터 처리 코드를 이해하고, 다시 작성하고, 질문하고 답변하는 능력을 갖추고 있습니다.

화산 엔진과 대형 모델을 사용하여 데이터 플라이휠을 점화합니다.

码 자동 복구 기존 코드 复 개발 보조 기능은 언어 장벽을 허물고 데이터 개발의 문턱을 크게 낮췄습니다. "원래 데이터를 (처리)하려면 SQL이나 Python과 같은 프로그래밍 언어를 알아야 할 수도 있는데, 이는 상대적으로 강력한 기술 요구 사항입니다. 그러나 이제는 더 이상 프로그래밍 언어가 필요하지 않으며 자연어를 사용할 수 있습니다. 그래서, 이는 이를 수행하는 사람들에 대한 요구 사항이 더욱 줄어들었다는 것을 의미합니다. "

데이터 소비 요구 사항이 있는 분석가 및 운영자의 경우 SQL을 이해하지 못하더라도 기본적인 ETL을 수행할 수 있습니다.

운영자는 DataLeap이 도시별 주문 판매, 기간별 생방송실 트래픽 등 비즈니스 조건에 맞는 데이터 수요 코드를 자동으로 생성하도록 할 수 있습니다. 운영자는 "이 테이블이 실행되는 동안 최적화 계획이 있나요?"와 같이 코드의 의미에 대해 질문하거나 "이 코드 문자열을 확인하고 수정하는 데 도움을 주세요."와 같이 대화할 수도 있습니다. 또한 생성된 코드를 한 번의 클릭으로 구문 분석하고, SQL 도구를 호출하여 테이블을 확인하고, 클릭하여 AI 자동 복구를 확인하여 데이터 자산을 더욱 최적화할 수도 있습니다.

더 중요한 것은 전문 개발자의 경우 DataLeap - Development Assistant가 몇 가지 기본 작업을 수행하고 데이터에 의존하는 데이터 분석가 및 비즈니스 운영자의 복잡하지만 기본적인 요구 사항을 처리하는 데 도움을 줄 수 있다는 것입니다. 마지막에 생성된 코드의 정확성.

결과적으로 R&D 인력은 더욱 창의적인 작업에 집중하고, 복잡한 시나리오의 요구 사항에 더욱 집중하고, 개발 지원을 사용하여 코드를 최적화하고, R&D 생산성과 코드 품질을 향상시킬 수 있습니다.

DataWind - Analysis Assistant

숫자찾기와 검색을 하다보니 데이터분석링크로 왔습니다. DataWind - 대규모 모델 기능을 결합한 Analysis Assistant는 비분석 위치에 있는 사람들이 데이터 시각화 쿼리 및 자연어 대화를 통한 분석과 같은 일련의 비즈니스 탐색을 완료하도록 도와 이 링크에 대한 임계값을 낮출 수 있습니다.

첫 번째는 "데이터 세트" 생성입니다. 데이터 자산을 통해 운영자는 DataWind 드래그 앤 드롭 방식을 사용하여 데이터 세트를 생성한 다음 자연어를 사용하여 "대형 연예인 생방송 기간"의 데이터를 직접 확인하는 등 다양한 분야의 논리를 정의합니다.

필드가 생성된 후 后 이를 확인한 후 운영자는 분석 및 탐색을 시각화할 수 있습니다. 과거 BI 도구는 일반적으로 드래그 앤 드롭 방식을 채택해 대시보드 제작의 문턱이 낮아졌지만, 분석 및 인사이트 분야에서는 여전히 데이터를 더 잘 이해하기 위해 많은 양의 전문 지식이 필요합니다. 이것이 "임계값"입니다. ㅋㅋㅋ 시각적 탐색

화산 엔진과 대형 모델을 사용하여 데이터 플라이휠을 점화합니다.

그러나 대형 모델의 더욱 강력해진 일반화 추론 기능 덕분에 DataWind는 기본적인 가정과 검증을 수행하고 분석 아이디어를 제안할 수 있었습니다. ^{DataWind에서 제공하는 AI 자동 분석 기능은 차트를 기반으로 그 이유에 대한 추가 탐색을 지원할 수 있습니다. 예를 들어 '기간별 생방송 방 트래픽 그래프', '생방송 방 매출 상위 지역' 등 생성된 시각적 차트를 AI가 자동으로 분석할 수 있으며, 운영자는 분석 결과를 바탕으로 대화를 통해 추가 귀속만 하면 됩니다.}

동시에 DataWind는 Feishu와 같은 사무실 협업 도구와도 연결되어 사용자는 IM 메시지 구독 및 자연스러운 대화를 통해 보다 확장된 분석을 수행하여 언제 어디서나 유연한 분석을 수행하고 데이터 세트, 시각적 요구 사항을 충족할 수 있습니다. 전체 링크에 대한 셀프 서비스 인텔리전스와 China Unicom 사무실 통합을 통해 데이터 분석을 일상 생활에 원활하게 통합할 수 있습니다.

화산 엔진과 대형 모델을 사용하여 데이터 플라이휠을 점화합니다. 조정된 IM 메시지 확장 분석 구독

분석 보조원의 임계값 분석은 "데이터 다이어그램"을 읽는 것부터 자연어 대화를 통해 결과를 직접 이해하는 것까지 분석의 임계값을 더욱 줄여줍니다. 과거 분석의 문제를 해결하기 위해 대폭 단축되었습니다. 많은 전문 지식이 필요한 Pain Point에 대한 통찰력을 얻고 데이터 분석 주기를 단축합니다.

이 단계에서 DataWind - Analysis Assistant의 응용 프로그램 시나리오는 이미 매우 풍부합니다. 분석 도우미는 핵심 분석 시나리오에서 대화형 탐색을 활성화하는 것 외에도 이전에 더 많은 것이 필요했던 표현 생성 및 기타 작업까지 기능을 확장합니다. 현장의 기술적 한계.

대형 모델은 데이터 플라이휠을 가속화하여 기업이 데이터 기반

ByteDance에는 심오한 데이터 기반 유전자를 가지고 있습니다. ByteDance 내의 거의 모든 시나리오는 A/B 테스트를 거쳤으며 데이터 피드백을 통해 조정이 이루어지며 Douyin 비디오 품질의 최적화 효과가 좋은지, 추천 알고리즘 전략 최적화가 좋은지 등 비즈니스 전략을 추진합니다. 정확하며 Toutiao의 이름도 A/B 테스트를 거쳤습니다.

바이트 내에서는 데이터 소비 범위가 매우 넓습니다. 조직적으로는 일선 직원뿐만 아니라 최고 경영진부터 중간 관리자까지 모든 사람이 기본적으로 데이터를 보고 이를 활용하여 회사의 운영 상태, 매출 및 지출, 사업 진행 상황, 제품 전략을 평가할 수 있습니다. 라이브 전자상거래의 실시간 마케팅과 같은 특정 시나리오에서는 실시간 데이터를 기반으로 운영을 설계하고 해당 마케팅 전략을 추진합니다.

바이트는 데이터 소비를 통해 과학적인 의사 결정과 민첩한 행동을 달성했으며, 이는 빈번한 데이터 소비와 비즈니스 이점을 통해 비즈니스 가치를 향상시켰으며, 더 나은 품질의 데이터 자산을 저렴한 비용으로 구축하는 것을 목표로 삼았습니다. 비즈니스 애플리케이션을 지원합니다.

올해 4월, Volcano Engine은 ByteDance의 10년 이상의 데이터 중심 실무 경험을 바탕으로 "Data Flywheel"을 사용하여 엔터프라이즈 디지털 인텔리전스 업그레이드의 새로운 패러다임인 "Data Flywheel"을 출시했습니다. 엔터프라이즈 데이터 흐름 요약 비즈니스 흐름에 통합된 후 데이터 자산 및 비즈니스 애플리케이션을 개선하는 플라이휠 효과를 얻을 수 있습니다.

전반적인 디지털화 추세에 따라 수천 가지 산업 분야의 기업 비즈니스가 디지털화에 가까워지고 있으며 데이터는 기업에 점점 더 중요해지고 있습니다. 새로운 생산 요소로서 데이터는 기업의 디지털 및 지능적 혁신을 지원하고 있습니다. 그러나 객관적으로 보면 많은 기업들이 디지털 구축을 많이 했음에도 불구하고 데이터의 가치를 온전히 발휘하지 못하고 있습니다.

"기업은 데이터 제품을 높은 가격에 배포할 수 있지만 실제로 내부적으로 사용하는 사람은 거의 없을 수 있습니다. 데이터 흐름이 어렵다면 그 가치를 실현하기 어려울 것입니다." 데이터 상품 시장에서 관찰된 바에 따르면,

디지털 구축을 진행 중인 많은 기업은 높은 데이터 구축 및 관리 비용, 높은 데이터 상품 사용 장벽, 낮은 데이터 자산 가치 등의 문제를 안고 있습니다.

전체 디지털화 과정의 관점에서 볼 때 "데이터 중심"이라는 것은 어렵지만 올바른 것입니다. Luo Xuan은 Byte를 예로 들어 현재 ByteDance 직원의 80%가 데이터 제품을 직접 사용할 수 있으며 관리 가능하고 운영 가능한 데이터 자산이 일일 분석 시나리오의 80%를 다루고 있다고 밝혔습니다. Byte의 경험에 따르면 이는 기업 내에서 좋은 "데이터 플라이휠"을 형성하기 위해 기업 내 내부 데이터 제품의 활용률과 시나리오에서 관리 가능하고 운영 가능한 데이터 자산의 적용 범위를 더 높은 수준으로 높여야 함을 의미합니다. 회사. .

이 과정에서 대형 모델이 지원하는 데이터 제품은 기업의 목표 달성을 돕는 중요한 원동력이 될 수 있습니다.

대형 모델 기능으로 업그레이드된 디지털 지능 플랫폼 VeDI는 숫자 찾기, 숫자 검색, 데이터 분석 등 데이터 생산과 소비의 전 과정을 더욱 줄였습니다. 동일한 수요 하에서 업그레이드된 VeDI를 사용하여 회사 내에서 데이터 제품을 사용할 수 있는 사람의 수가 전문 데이터 분석가에서 운영진, 상사, 제품 관리자, 관리자, 관리자, 관리자 등 데이터가 필요한 모든 사람으로 확대되었습니다. 등, 데이터 소비가 포함됩니다.

"문턱을 낮추고 데이터를 활용해야만 데이터가 유통되면서 어떤 가치를 창출할지 알 수 있습니다." 이제 막 디지털화 과정에 돌입한 기업에게 데이터의 가치는 실제와는 거리가 멀습니다. 보물이 발굴되면 임계값이 낮은 데이터 제품이 보물을 잠금 해제하는 열쇠가 될 수 있습니다.

대형 모델의 지원으로 기업 내 '데이터 플라이휠'의 회전이 가속화됩니다.

회사의 비즈니스 엔진은 더욱 강력해지며 비즈니스 담당자는 "초 단위로 데이터 출력"을 통해 신속하게 데이터 피드백을 얻을 수 있으므로 데이터 흐름이 가속화되는 과정에서 더 많은 고품질 데이터 자산이 계속해서 축적됩니다. 비즈니스에 더 많은 통찰력을 제공하고 궁극적으로 더 과학적이고 민첩한 비즈니스 결정을 내리세요.

위 내용은 화산 엔진과 대형 모델을 사용하여 데이터 플라이휠을 '점화'합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 机器之心에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

SecList

SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.