지난해부터 AIGC 열풍이 불면서 AIGC와 그 활용에 대한 화두가 폭발적으로 성장했습니다. 많은 사람들이 강력한 인공지능 시대가 멀지 않았다고 한탄합니다. 그러나 호황의 이면에는 실제로 구현될 수 있는 시나리오가 여전히 거의 없다는 것을 알 수 있습니다. 현재 더 성공적인 응용 프로그램은 주로 개인 소비 분야에 집중되어 있는 반면 AIGC의 응용 프로그램은 대부분 업계에 있습니다. 아직 탐색 단계에 있습니다.
Sequoia Capital은 9월 22일 AIGC에 대해 다음과 같이 예측했습니다. 2023년에는 텍스트 기반 AI 세대가 황금 시대에 진입하고, 2025년경에는 이미지 기반 AI 세대가 황금 시대에 진입하며, 3D 및 비디오 AI 세대가 도래할 것입니다. 2023년에 초안 단계에 있을 수 있으며 2030년에 황금기에 진입할 수 있습니다. 3D 모델, 비디오 및 게임 생성이 아직 개발 단계에 있는 반면 텍스트와 이미지의 AI 생성이 실제로 앞서 있다는 것은 부인할 수 없습니다.
Sequoia Capital의 AIGC 관련 제품 성숙도 예측
제조, 건설 등 거대 수직 기업 등 AIGC 산업용 애플리케이션을 고려한다면 AIGC의 C/ 콘텐츠 콘텐츠는 더 이상 그림과 텍스트의 영역에만 머물지 않고, 더욱 풍부한 정보를 담은 입체적인 영역으로 들어가야 합니다. 다음으로 AIGC 기술 -> 제품 -> 비즈니스 적용 및 가치 실현의 개발 경로에 대해 논의하고, 산업 사례를 통해 AIGC가 산업 현장에서 폐쇄 루프와 가치 구현을 어떻게 달성할 수 있는지 살펴보겠습니다.
ChatGPT에 대한 테스트 수가 증가하는 것을 보면 ChatGPT가 의미론을 구문 분석하고 구조화할 뿐만 아니라 NLP를 사용하여 자연스럽게 언어 처리를 통해 데이터 분석을 수행할 수 있음을 알 수 있습니다.
ChatGPT 구조화된 콘텐츠 및 데이터 분석 - Jiage Data에서 제공
실제로 Stable Diffusion이 주도하는 수많은 AI 드로잉 프레임워크나 플랫폼이 작년에 있었습니다. 더 일찍 저어주세요. 그림은 텍스트보다 더 복잡한 정보 콘텐츠를 갖고 있는 것처럼 보이지만, AIGC 프레임워크가 어떻게 작동하는지 검토하려면 주류 오픈 소스 프레임워크인 Stable Diffusion을 예로 들어 그림의 기술이 성숙해져야 합니다.
Stable Diffusion으로 생성된 그림은 인간 화가와 비교할 수 있는 능력이 있습니다.
Stable Diffusion은 주로 세 가지 구성 요소로 구성되며 각 부분에는 자체 신경망이 있습니다.
1. CLIP은 텍스트 인코더에 사용됩니다. 텍스트를 출력 의미 정보로 사용하여 77*768 행렬을 형성하는 CLIP은 AI가 자연어 이해와 컴퓨터 비전 분석을 동시에 수행하도록 교육합니다. CLIP은 건물 이미지와 "건축"이라는 단어를 점차적으로 일치시키는 등 이미지와 텍스트 프롬프트 간의 일치 정도를 확인할 수 있으며, 전 세계 텍스트 설명이 포함된 40억 개 이상의 사진을 통해 능력 훈련이 이루어집니다.
CLIP의 트레이닝 세트
2, UNET 및 스케줄러: 유명한 확산 모델 메인 프로그램입니다(2021년 12월 CompVis 및 Runway 팀에서 제안). "(LDM/Latent Diffusion Model)을 사용하여 잡음을 예측하고 역잡음 제거 프로세스를 달성함으로써 정보 공간에서 그림 생성을 실현합니다. 그림에서 볼 수 있듯이 염료 확산 과정은 사진에서 노이즈 포인트로 점차 변화하는 과정과 같다. 연구진이 사진에 무작위로 노이즈 포인트를 추가하고 AI가 전체 과정을 역으로 학습하게 하면, 그들은 정보 공간 노이즈 맵에서 이미지를 생성하는 일련의 역학습 방법을 가지고 있습니다.
확산모델 역노이즈 제거 과정
흔한 예로 설명하자면, 깨끗한 물에 염료를 무작위로 떨어뜨리면 시간이 지나면서 아래 사진과 같은 멋진 모양을 얻게 됩니다. 그렇다면 특정 시간, 특정 상태를 기준으로 초기 염료 투입량, 순서, 수조에 떨어지는 초기 상태 등의 정보를 역으로 추론할 수 있는 방법이 있을까? 분명히 이것은 AI의 방법을 빌려오지 않고는 달성하기가 거의 불가능합니다.
다른 염료를 물에 떨어뜨리고 다른 모양으로 확산됩니다.
3 정보 공간에서 실제 사진 공간으로 디코더: 즉, 매트릭스 정보를 변환합니다. 정보 공간 육안으로 볼 수 있는 RGB 이미지로 변환합니다. 우리가 듣는 소리 신호가 뇌가 이해할 수 있는 텍스트 신호로 변환되어 뇌에 저장되는 과정을 상상해 보세요. 특정 언어를 통해 텍스트 신호를 표현하려고 하면 이 프로세스를 디코딩이라고 할 수 있습니다. 여기서 표현은 모든 언어일 수 있으며 각 언어는 서로 다른 디코더에 해당합니다. 디코딩은 표현의 한 방법일 뿐이며 그 본질은 여전히 있습니다. 인간의 마음 속에 있는 어떤 것에 대한 설명과 이해를 바탕으로 합니다.
입력에서 출력까지 StableDiffusion의 전 과정을 해석
Stable Diffusion이 전능한 AI 드로잉 로봇을 성공적으로 탄생시킨 것은 바로 이러한 일련의 핵심 기술 단계였습니다. 의미를 이해하고 이를 정보 공간의 정보 흐름으로 변환할 수도 있지만, 정보 공간의 시뮬레이션된 노이즈 감소를 통해 생성하고 디코더를 통해 육안으로 볼 수 있는 그림으로 복원할 수도 있습니다. AI가 존재하는 것은 세상의 관점에서 보면 기적이라고 할 수 있다.
사진 생성은 획기적인 결과를 얻었지만 이러한 결과를 더욱 최적화하고 더 많은 분야에 적용할 수 있다면 더 큰 가치를 달성할 수 있을 것입니다. 예를 들어, 장면 이해, 다양한 데이터 세트 추가 및 매개변수 조정을 통해 텍스트의 지속적인 시행착오를 통해서가 아니라 이미지 생성에 대한 더 나은 제어를 얻을 수 있습니다.
2.1 Design Intent Map Generation
2019년 초 GAN을 활용하여 생성한 "This XX Does Not Existence" 시리즈가 국내에서도 많은 주목을 받았고, 국내에서도 많은 기업들이 론칭하는 성과를 보았습니다. 분할된 필드. 연구팀은 지난 8월 22일 휴대폰에서 'AI 크리에이티브 라이브러리'를 실험적으로 출시했다. 문장만 입력하면 대화형 로봇이 1분 만에 의미를 빠르게 이해하고 건축 개념도에 가까운 세부 효과가 있는 여러 장의 그림을 생성할 수 있다. 의도 다이어그램. 또한, 기존 사진을 입력하고 일부 설명의 키워드를 수정함으로써 'AI 크리에이티브 라이브러리'는 디자이너가 일상 창작물에서 영감을 찾는 데 도움이 되는 일련의 파생 사진을 생성할 수 있습니다.
Xiaoku 기술 "이 건물은 존재하지 않습니다", GAN 모델은 건축 이미지와 반복 프로세스를 생성합니다.
왼쪽 사진: Xiaoku "AI 창의적 라이브러리" 세대, 명령문 실행 Louis Kahn 스타일, 산과 강으로 둘러싸인 작은 박물관, 오른쪽 사진: 왼쪽의 Louis Kahn 스타일 사진을 기반으로 Xiaoku "AI Creative Library"에서 생성되었으며 완성된 스타일은 Le Corbusier
"AI 크리에이티브 라이브러리"를 더욱 효과적으로 만들기 위해 팀은 몇 가지 새로운 탐색을 수행했습니다. 기존 알고리즘과 모델이 일반 인터넷 자료에 더 집중되어 있기 때문에 건축 관련 사진, 설명 및 스타일 데이터가 저장됩니다. 전문성만으로는 충분하지 않습니다. 여기서는 건축 관련 단어에 대한 특수 식별자를 사용하여 미세 조정된 사전 데이터 세트를 형성하고, 데이터 세트를 융합 및 학습하여 모델 향상을 달성합니다. 건설 전문 분야에서 강화된 신규 모델을 통해 건설업 전용 AI 크리에이티브 라이브러리가 구축됐으며, 짧은 시공 설명 문장의 경우 테스트 세트 내 우수 제품 비율이 기존 모델 대비 13.6% 증가했다.
Google Dreambooth Fine-Tuning Algorithm Schematic
예를 들어 박물관 사진과 "자하 하디드(고인이 된 세계적으로 유명한 여성 건축가)"라는 단어를 입력하면 모델은 박물관에 자하 하디드의 캐릭터나 초상화를 추가하거나 AI 세계에서 자하 하디드의 만화 초상화를 만드는 것보다 박물관의 건축 양식이나 특징을 자하 하디드의 작품에 더 가깝게 가져오는 것이 필요하다는 것을 이해해주세요 - 이는 종종 일반 모델이 반환하는 결과 중 하나입니다.
건축 모델을 미세 조정한 후 작은 도서관 "AI 크리에이티브 라이브러리"는 "자하 하디드"라는 특별한 단어의 숨겨진 의미를 완전히 이해할 수 있습니다
2.2 3D 모델 생성
2차원 사진은 훌륭하지만, 산업 응용에서는 아직까지는 '의도 라이브러리' 역할만 할 뿐입니다. 앞으로 디자인을 정확하게 표현할 수 있는 결과물이 되려면 필요합니다. 3D 및 더 높은 정보 차원으로 이동합니다.
AIGC가 지금만큼 성숙하지 않았던 2020년, 위에서 언급한 팀은 AI를 사용하여 3D 모델을 생성하는 방법을 모색하고 있었고, 통지대학교에서 DigitalFUTURES 워크샵을 강의하는 동안 연구 결과를 공개했습니다. 그리고 그래픽으로부터 이미지를 더욱 생성하기 위한 개발. 모델의 알고리즘에 관해서는 당시 모델의 효과가 그다지 만족스럽지 않았음을 알 수 있습니다. 그래픽-이미지-모델의 연계가 중요합니다.
2020 Tongji University DigitalFUTURES 워크샵 Xiaoku 교육 팀 결과, 손으로 그린 그래픽이 이미지를 생성한 후 모델을 생성합니다.
Tongji University DigitalFUTURES 워크샵 교육 2년차에 팀은 An을 출시했습니다. GAN을 이용해 그래프와 실제 3차원 모델의 관계를 학습하고, 그래프를 실제 3차원 모델로 생성하는 알고리즘입니다. 이미지의 다양한 레이어 요소에서 특징을 학습함으로써 이 알고리즘은 이미지에 해당하는 주 개체의 3차원 확장 모양을 대략적으로 복원하고 다양한 개체의 투영에 해당하는 원래 개체의 높이를 예측할 수 있습니다. 물론 이 방법은 여전히 사진 장면에서만 사용할 수 있는 결함이 있으며, 다른 장면에서 유사한 그림과 3차원 형상 간의 관계를 축적하기가 어렵습니다. 둘째, 복원된 3차원 형상은 대략적으로만 사용할 수 있습니다. 높이를 예측하고 기타 세부 사항을 통과해야 합니다. 알고리즘이 재생성되므로 실제 3차원 모델과 큰 오류가 있습니다. 이는 프로젝트의 초기 연구 및 판단에만 사용할 수 있으며 적용 시나리오가 제한됩니다. .
도시 3D 모델을 위한 계층적 특징 추출 훈련의 개략도
2021 Tongji University DigitalFUTURES 워크숍 Xiaoku 교육팀 결과, GANS 기반 피규어 재구성 3D 모델
AIGC 알고리즘의 폭발적인 증가와 3D 생성 알고리즘의 성숙도 증가 덕분에 수직적 AI 회사가 모델 개선을 위해 더 진보된 기술과 아이디어를 흡수하기 시작했으며 3D-AIGC 경로에 대한 몇 가지 새로운 아이디어를 갖게 되었습니다. 시도하는 방향. 예를 들어 OPENAI는 알고리즘을 통해 2차원 이미지를 포인트 클라우드로 예측한 다음 포인트 클라우드를 통해 3차원 객체를 예측할 수 있는 Point-E 프레임워크를 출시했습니다.
PointE 프레임워크의 전체 프로세스에 대한 개략도
그러나 모델 생성의 품질에는 여전히 특정 제한이 있으며 모델의 사용 불가능성은 주로 다음과 같습니다. 세 가지 측면:
1. 3D 형상 복원의 어려움: 우선 2D 이미지 데이터가 3D 모델 데이터보다 먼저 나타났습니다. 동시에 현재 사용할 수 있는 2D 이미지 데이터는 후자보다 많습니다. 더 많은 양의 교육 자료로 사용할 수 있지만 3D 모델 데이터의 일반화 능력이 제한되어 있으며 원래의 3차원 형태를 복원하기가 어렵습니다.
2. 재료 부족: 입체 모델에서 가장 중요한 부분은 재료의 채우기와 선택입니다. 그러나 AI 세대의 경우 그림에서 재료를 직접 추정하는 방법은 아직 성숙되지 않았습니다. 모양, 환경 및 광원 이러한 변수가 하나의 그림에 집중되면 재료 재구성이 거의 불가능합니다.
3 생성된 모델의 정확도는 표준에 미치지 못합니다. 객체 표면 메시를 재구성하기 위한 포인트 클라우드의 밀도입니다. 포인트 클라우드가 너무 적으면 객체가 심각하게 왜곡되고 모델이 재구성되지 않을 수도 있습니다.
Xiaoku 팀은 Point-E 모델을 테스트했습니다. 왼쪽의 건축 그림은 포인트 클라우드를 생성하고 오른쪽의 3차원 모델을 시뮬레이션했습니다. 무의미한 포인트 클라우드 모델의 무리 Point-E는 여전히 건물 사진을 이해할 수 없습니다
물론 현재의 기술적 병목 현상을 이해할 수는 있지만 목표를 조금 더 낮게 설정하면 간단한 모양을 선택할 수 있습니다. 3D 모델링 소프트웨어에서 생성하고 2D 스크린샷을 만듭니다. Point-E 모델로 재구성하면 놀랍게도 위의 테스트보다 효과가 더 좋다는 것을 알 수 있지만 여전히 "예비 초안"의 범위에 국한됩니다. 이는 훈련 세트와 밀접한 관련이 있습니다. 3D 모델링 소프트웨어를 통해 각 관점에서 2D 보기를 생성하는 것은 이 모델에 대한 훈련 데이터를 얻는 가장 쉬운 방법 중 하나입니다.
Xiaoku 팀은 Point-E 모델을 테스트하고 모델링 소프트웨어에서 간단한 3D 모델을 선택하여 어떤 각도에서든 스크린샷을 찍고 3D 모델을 재구성했으며 종종 꽤 좋은 결과를 얻었습니다
결론적으로 텍스트 -> 그림 -> 포인트클라우드 -> 입체물까지의 기술적인 루트는 참으로 놀랍지만, 산업현장에 적용하려면 아직 해야할 작업이 많이 남아있습니다. AI 과학자들이 할 일이다.
그러나 이것이 3D 모델 생성을 달성하는 유일한 기술적 경로입니까?
일반 분야의 대형 모델 개발에서 Nvidia 및 Google과 같은 거대 기업을 포함하여 OpenAI를 주도하는 제조업체들도 불행히도 자체적인 범용 3D-AIGC 프레임워크를 출시하고 있습니다. , 아직 초기 단계입니다. 수직적 물리적 산업의 경우, 실제 적용까지는 분명히 아직 갈 길이 멀습니다.
글로벌 관점에서 볼 때 3D 모델 생성 분야에서는 대규모 팬 필드 모델 외에도 일부 수직 산업에서도 AIGC 적용 방법을 모색하고 있습니다. 예를 들어, Siemens는 엔진 설계 및 제조 과정에서 생성된 모델에 대한 정책 시뮬레이션 및 추가 최적화를 수행합니다. 마지막으로 3D 프린팅 엔터티를 통해 3D 모델 결과 제공 및 폐쇄형 비즈니스 루프를 실현합니다.
Siemens는 생성 알고리즘을 통해 엔진 설계 및 시뮬레이션을 구현합니다.
이러한 결과의 실현은 기본 비즈니스 콘텐츠와 산업 논리에 따른 데이터 표준의 지속적인 반복에 달려 있습니다.
ISO/IEC에 따른 콘텐츠의 디지털 표준 정의는 SMART(Standards Machine Applicable, Readable and Transferable)입니다. L1 수준은 종이 텍스트이며 기계 상호 작용이 불가능합니다. L3 수준은 매우 개방적인 디지털 형식입니다. 낮은 기계 상호작용성; L3 수준은 기계가 읽을 수 있는 문서이지만 기계는 검색 결과와 내용을 이해할 수 없습니다. L4 수준은 의미론적으로 상호작용할 수 있는 기계가 읽을 수 있는 콘텐츠이지만 기계가 컨텍스트의 논리적 관계를 이해할 수 없습니다. ; 레벨 L5, 자동 식별 및 자동 생성과 같은 지능형 속성을 실현할 수 있는 기계 대화형 콘텐츠입니다.
산업 분야에서는 현재 L3 수준의 정보 콘텐츠가 널리 활용되고 있으며, L4 수준의 디지털 콘텐츠가 개발되고 있는 반면, L5 수준의 인텔리전스는 Industry 4.0과 스마트 제조의 핵심 기반입니다. 따라서 L4 레벨 이상의 기계 판독 가능한 콘텐츠, 특히 L5 레벨 지능형 콘텐츠를 생성하는 것이 향후 AIGC의 방향입니다.
ISO/IEC SMART 디지털 표준 "중국 공학 과학" 23권 2021년 6호 "표준 디지털화의 발전 현황 및 동향에 관한 연구" Liu Xize, Wang Yiyi, Du Xiaoyan, Li Jia, Che Di
산업 응용 분야에서 AIGC를 해외에서 실천하기 시작한 반면, 국내 탐사는 아직 상대적으로 부족하지만, 버티컬 분야에 깊이 관여하고 있는 기업도 찾았습니다. 예를 들어 위에서 언급한 것처럼 Xiaoku 기술팀은 건설 산업에 깊이 관여하고 있습니다. 수직 산업에서의 AIGC 구현 경로를 논의하기 위해 건설 산업을 예로 들어 보겠습니다.
현재 국내 실물경제는 전환의 창구에 있습니다. 국가 차원에서는 '인공지능과 실물경제의 통합'이라는 중요한 과제를 제시했습니다. 개념에 머무르는 DEMO 제품이나 저녁 식사 후에 논의할 재미있는 것보다는 지능적인 업그레이드입니다.
건설산업은 연매출 30조에 육박하는 국가 기간 산업이지만, 디지털화 수준은 전국 산업 중 꼴찌입니다. 현재 중국은 지능형 건설 정책을 제안했으며 '메이드 인 차이나(Made in China)'의 새로운 수준에 도달하기를 희망하고 있습니다. 지능형 건설은 신건축 산업화(산업화/조립식, 디지털, 지능화)를 기반으로 차세대 정보기술과 첨단 건설기술의 심층적 융합을 기반으로 설계, 생산, 시공, 운영 등 건설 활동 전 과정을 총괄한다. 자기인식, 자기결정, 자기실행, 자기적응, 자기학습의 특성을 가지며, 품질, 효율성, 건설산업 전 생애주기의 핵심 경쟁력입니다.
2011년부터 2021년까지 중국 건설 산업 총 생산량 및 성장 - 국가 통계국 - 예측 산업 연구소,
출처: 가트너;케이블; OECD; Bloomberg; McKinsey Global Institute 분석
건설 업계에서 기본 데이터 표준은 L3 수준의 기계 판독 가능 문서 시대에서 기계 판독 가능 L4 수준 BIM으로 이동하고 있습니다. 내용 시대는 앞으로 나아갑니다. 건설 산업에서 3D 모델에 대한 요구 사항은 콘텐츠 개체가 모델, 데이터 및 기타 차원을 포함하여 3차원 공간에서 전체 차원의 정확한 정보를 가지고 있어야 한다는 것입니다. 규칙 차원도 포함할 수 있으면 자체 인식을 가질 수 있습니다. 자가 학습, 자가 반복 등 지능형 기능. 현재 L3급 CAD와 L4급 BIM 응용소프트웨어는 해외에서 독점화되어 있으며, 저차원에서 고차원까지 커버할 수 있는 L5급 소프트웨어에 개발 공간과 잠재력이 집중되어야 합니다.
건설 분야의 디지털 표준 SMART 콘텐츠 형식
Xiaoku 팀은 건설 산업의 디지털 전환에 대한 통찰력을 바탕으로 전체 산업의 데이터 하위 계층이 반드시 필요하다는 것을 깨달았습니다. 재정의됩니다. 2016년 설립 이후 L5급 3D모델 AIGC 기반기술 연구개발과 건설산업 적용에 전념해 왔다. 비즈니스 흐름 로직을 포함하는 일련의 AI 시스템을 기반으로 건물 정보, 다차원 데이터, 3D 모델, 규칙/규범/법칙을 포함하는 "디지털 모델 규모" 연결 가능한 콘텐츠를 생성하여 건축 설계의 지능형 생성을 실현합니다. 계획.
이러한 기본 데이터를 팀에서는 이를 AI 기반 클라우드 빌딩 정보 모델 인공 지능이 생성한 클라우드 빌딩 정보 모델(ABC)이라고 부르며, 지능형 세대의 달성을 4가지 실제 단계에 귀속시킵니다. AI 교육 또는 구조화된 데이터 재구성, 데이터 평가 및 시뮬레이션, 예비 데이터 결과 최적화 및 최종적으로 일련의 AI 모델로 구성된 비즈니스 결과를 생성합니다.
L5 레벨 구축 지능형 형식 ABC 지능형 클라우드 모델
AI 인식 분야에서 팀은 다양한 비즈니스 유형의 수천만 개의 CAD 도면 데이터를 정리하고 훈련하여 달성했습니다. 100% 클라우드 복원과 99.8%* 정확한 의미 분석 및 L3 수준의 의미 CAD 도면 보완으로 이 분야에서 세계 최고 수준에 도달했습니다. 이 성과는 회사의 많은 제품과 솔루션에 깊이 적용되었습니다. 예를 들어 건축 도면 검토를 위한 "지능형 도면 검토"의 조항 검토 정확도는 약 96%입니다.
소규모 도서관 건축 도면 구성요소 및 공간 식별
AI 분석 분야, 프로젝트의 효과적인 식별을 기반으로 주택, 쇼핑몰 등 일반적인 토목 건물 유형에 대해 물리적 환경 시뮬레이션 분석, 인간 행동 데이터 시뮬레이션 및 예측, 프로젝트 관련 빅데이터 분석 및 시뮬레이션을 수행하는 팀입니다. 애플리케이션 수준에서는 고객이 프로젝트 계획을 정량적으로 분석하는 데 도움을 줄 수 있습니다. 예를 들어 부동산 회사의 전체 주거용 제품을 평가함으로써 다양한 가치 평가 계수를 얻어 부동산 회사의 제품 품질 개선에 도움을 줄 수 있습니다. 따라서 Xiaoku Technology는 중국 주택 협회 주택 디자인 대회의 첫 번째 AI 심사위원으로도 선정되었습니다. 이 역량은 홍콩과 중국의 10개 이상의 쇼핑몰 건물 개발 및 운영에도 적용됐다.
작은쿠 「제품력 가치 평가」
AI 최적화 분야에서 팀은 "최적화"는 선주문 "식별" 이후 추가 최적화를 기반으로 한다고 믿습니다. " 및 "분석" 반복, 즉 기존 콘텐츠를 기반으로 더 나은 결과를 다시 생성하는 것입니다. 이러한 유형의 기술은 이미 회사별 제품 및 솔루션에 사용되고 있습니다. 예를 들어 Design Cloud 2022 버전의 "스마트 선샤인 최적화" 기능에서 Xiaoku는 햇빛을 통과하지 못하는 솔루션을 자동으로 미세 조정하여 원래 패턴을 크게 조정하지 않고도 햇빛 검증을 통과할 수 있습니다. 이 기능은 커튼월 설계 최적화 시나리오와 같은 건축 솔루션의 설계 개발에도 사용됩니다. 쓰촨성 상업 디자인 연구소와 협력한 쓰촨성 박물관 커튼월 프로젝트에서 Xiaoku 알고리즘은 30,000개 이상의 원래 불규칙 삼각형 커튼월 패널을 12가지 유형의 표준 모듈로 최적화했습니다. 이는 현재 세계 수준에서 가능한 116가지 유형보다 낮습니다. 90% 절감, SKU 및 금형수량 감소로 인해 커튼월 시공비용이 대폭 절감됩니다.
Xiaoku "커튼월 최적화 AI 알고리즘"
AI 세대 분야는 지능형 디자인의 핵심 부분입니다. 건설 산업의 경우 경제적이고 적용 가능하며 아름다운 설계 계획을 선택하고 안전하고 효율적이며 고품질의 건설 결과를 제공하려면 다양한 분야와 역할의 조정과 조정이 필요합니다. 거시적 규모, 중간 규모, 미시적 규모로 하나씩 세분화할 필요가 있을 뿐만 아니라 점차적으로 건축, 구조, 전기기계, 배관, 조경 등 여러 전공을 포괄해야 합니다. 또한 주거, 아파트, 산업, 사무실, 상업 등 다양한 유형을 포괄해야 합니다. 따라서 수직 분야의 전문적인 결과 생성은 특정 모델 알고리즘과 데이터 세트로 해결할 수 없습니다. 이를 위해서는 다중 모델, 다중 양식, 다중 데이터 세트 등 여러 기술과 비즈니스 로직의 유기적인 통합이 필요합니다. , 세분화된 시나리오에 맞는 제품 설계를 통해 최종적으로 이를 달성할 수 있습니다.
샤오쿠 팀은 비즈니스 로직에서 시작하여 전통적인 건축 설계에 필요한 24개의 비즈니스 프로세스 단계를 정리하고 핵심 콘텐츠를 6개의 비즈니스 모듈로 추출 및 재구성한 후 AI 시스템과 클라우드 아키텍처를 핵심으로 설정했습니다. 건축 설계 AIGC 비즈니스 프로세스: 조정(정보 호출 및 AI 인식), 수행(전체 AI 생성 및 인간-컴퓨터 협업 생성), 수정(수동 수정 및 AI 최적화), 검토(데이터 검증 및 AI 검토), 협업( 클라우드에서 다자간 협업 및 비즈니스 관리), 내보내기(자동으로 더 많은 형식 출력 - 3D 모델/2D 도면/이미지/PPT/Excel 등).
왼쪽 사진: 건축 설계의 원래 비즈니스 프로세스 24단계, 오른쪽 사진: Xiaoku는 AI가 지원하는 6개 비즈니스 프로세스 섹션으로 재구성됩니다.
비즈니스 이해를 바탕으로 Deeply 비즈니스 로직을 이해하고 재구성하며, 6가지 주요 비즈니스 모듈을 AI 인식, AI 생성, 빅데이터, 클라우드 협업 등의 기술과 제품 디자인에 심층적으로 통합하여 건축 계획, 유닛 디자인, 컴포넌트 생성 및 기타 다양한 깊이를 실현합니다. 분석부터 설계, 검토, 협업 및 출력에 이르기까지 비즈니스 요구 사항은 점차적으로 주거용 비즈니스에 대한 요구 사항의 폭과 깊이를 포괄합니다.
"Xiaoku Design Cloud - 건축 계획" 제품 6개 주요 모듈
"Xiaoku Design Cloud - Building Individual" 제품 6개 주요 모듈
대부분의 산업에서 AIGC의 적용은 아직 초기 단계이며 전반적인 AI 기술의 지속적인 개발은 AIGC의 후속 혁신적인 적용을 촉진할 것입니다. 건설 업계의 현재 관행을 예로 들면, AIGC는 현재 투자 연구, 설계, 평가 등과 같이 사용자가 인지할 수 있는 가치를 생성하는 일부 세부 비즈니스 시나리오에서 효율성에 대한 요구 사항이 더 높은 특정 비즈니스 시나리오를 개선하는 데 도움을 줄 수 있습니다. 건설 산업에서.
4.1 최적 솔루션 확보 및 효율성 향상
건설산업의 투자 및 연구 단계에서는 2021년 도입된 '2중 집중' 정책(토지 공급 집중화와 토지 집중화)으로 대규모 투자가 집중됐다. 이달 안에 착공한 개발회사는 각 토지에 대한 투자평가를 단기간에 완료해야 한다. 핵심은 취득할 토지에 대한 최적의 건축계획 솔루션을 찾는 것이다. 최대 제품 가치 및 투자 수익 계산. 원래 주거 계획 개념 계획을 완료하는 데 최소 3~5일이 걸렸기 때문에 비즈니스 요구를 충족할 수 없었으며 이로 인해 투자 전 건축 계획 계획의 효율성이 극대화되었습니다.
Xiaoku 팀은 AIGC의 건축 계획 계획을 시작했고, 예비 계획을 출력하는 데 원래 시간의 약 30%만 소요되었습니다. 더 중요한 것은, AI는 사람들이 생각하지 못했던 솔루션이나 수동으로 철저하게 개선하기 어려운 솔루션을 생성하고 최적화하여 성능이나 경제성 측면에서 더 나은 결과를 얻을 수 있다는 것입니다. 예를 들어, 중국 진마오(Jinmao)의 장시(Jiangxi) 프로젝트에서 AI가 생성한 계획은 시간적으로 원래 방법의 20%만 소요했을 뿐만 아니라 원래 계획에 비해 프로젝트 총 가치를 5,600만 위안 증가시켰습니다. 2021년 9개월 동안 부동산 경매 시장에서 팀은 거의 천 개에 가까운 프로젝트와 거의 만 개에 달하는 계획을 완료하여 고객이 수십 개의 토지를 성공적으로 확보할 수 있도록 도왔습니다.
"Xiaoku Design Cloud" AI가 실제 주택용 토지 취득 계획 생성
4.2 비용 절감 및 에너지 절약 및 배출 감소
실제 건물 건설 과정에서 Xiaoku 팀이 결합 DFMA(Design For Manufacture and Assembly) 설계 방식을 AI에 적용하고 거대 건설업체 중국건설그룹의 자회사인 중국건설과학과 손잡고 박스형 조립식 건물과 AI 설계세대 L5 ABC를 결합한다. "데이터-금형-규모" 연결의 긴밀한 통합으로 구현 전 투자-계획-비용의 실시간 연결을 실현하고 설계 및 비용 변경을 80% 줄이며 전체 조립 부품 SKU 및 금형 개방량을 효과적으로 줄여 50%를 달성합니다. % % 이상 에너지 절약 및 배출 감소. 더 나은 성능과 경제적 결과를 얻으면서 "기본 데이터"는 공장 생산 라인 및 스마트 건설 현장과 효과적으로 "트윈 데이터"로 연결될 수 있습니다. 심천의 한 호텔 프로젝트에서는 설계부터 시공까지 4개월 만에 완료해 전체 공사 기간을 최소 14개월 단축하고 시간을 60% 이상 절약했다.
심천의 한 호텔이 "Xiaoku Assembly Cloud"와 중국 건설 과학 기술과 협력하여 지능형 설계 및 지능형 건설의 전 과정)
L5 레벨 지능형 구성 모델과 기존 모델의 비교
위 사례에서 볼 수 있듯이 L5 수준 AIGC는 데이터 생성 소스에서 시작할 수 있으며 산업 체인이 더 높은 수준을 달성하도록 효과적으로 지원할 수 있습니다. 산업 체인의 각 링크에서 세분화된 시나리오의 특정 응용 프로그램 전체 수명 주기 품질, 효율성 및 핵심 경쟁력. 앞으로 AIGC는 텍스트와 그림에서 고차원의 3D, L5 콘텐츠 결과물로 옮겨가는 것이 대세다. 이는 건설업계의 인공지능에 대한 미래의 기대일 뿐만 아니라 모든 업종의 공통된 기대이기도 하다. 산업.
참고: *레이어에 명백한 오류가 없다는 사실을 바탕으로 현재 Xiaoku AI 인식 정확도는 표준 구성 요소(문, 창문, 벽, 계단, 엘리베이터, 에어컨, 화재)에 대해 99.8%입니다. (테스트 세트는 수천 개의 건축 CAD 도면으로 구성되며 도면은 여러 주요 개발자의 내부 표준 라이브러리에서 제공됩니다.)
위 내용은 ChatGPT를 기반으로 하는 AIGC는 수직 산업에 어떤 역할을 할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!