-
FATE 2.0개인 컴퓨팅 연합 학습의 대규모 적용을 촉진하기 위한 포괄적인 업그레이드
FATE 오픈 소스 플랫폼은 FATE 2.0 버전 출시를 발표했습니다. 세계의 업계 최고의 연합 학습 산업 등급 오픈 소스 프레임워크입니다. 이 업데이트는 연합된 이기종 시스템 간의 상호 연결을 실현하고 개인 정보 보호 컴퓨팅 플랫폼의 상호 연결 기능을 지속적으로 향상시킵니다. 이러한 진전은 연합 학습 및 개인 정보 보호 컴퓨팅의 대규모 응용 프로그램 개발을 더욱 촉진합니다.
FATE 2.0은 포괄적인 상호 운용성을 설계 컨셉으로 채택하고 오픈 소스 방법을 사용하여 애플리케이션 계층, 스케줄링, 통신 및 이기종 컴퓨팅(알고리즘)의 네 가지 레벨을 변환합니다. , 시스템과 시스템, 시스템과 알고리즘, 알고리즘과 알고리즘 간의 이종 상호 운용성 능력을 실현합니다.
FATE 2.0은 Beijing Financial Technology Industry Alliance의 "금융 산업 개인 정보 보호 컴퓨팅 상호 운용성API기술 문서"와 호환되도록 설계되었습니다. [3] 및 기타 산업 표준을 출시하기 전에 FATE 2.0은 여러 이기종 개인 정보 보호 컴퓨팅 플랫폼과의 상호 연결 및 상호 운용성 검증을 완료했습니다. 최근 Beijing Financial Technology Industry Alliance는 문서 공개에서 “연구 팀은 FATE 오픈 소스 커뮤니티 및 선도적인 기술 기업과 협력하여 5자 간 교차 플랫폼 및 교차 알고리즘 상호 운용성을 완성했으며 공동 디버깅, 인터페이스 문서가 다자간 이기종 플랫폼 상호 연결의 타당성과 보안을 지원하는지 확인".
FATE 2.0 버전을 얻으려면 다음 URL을 방문하세요:
https://www.php.cn/link/99113167f3b816bdeb56ff1af6cec7af
-
FATE 2.0 주요 내용 개요
- 애플리케이션 계층 상호 연결: 확장 가능한 연합 DSL 구축, 애플리케이션 계층 상호 연결 지원 및 DSL을 통합하여 다중 헤테로에 적응 다양한 개인 정보 보호 컴퓨팅 플랫폼 임무 설명
-
스케줄링 레이어상호 연결: 다양한 레벨에서 시스템 모듈을 분리하여 개방적이고 표준화된 상호 연결 스케줄링 플랫폼을 구축, 여러 이기종 개인 컴퓨팅 플랫폼 간의 작업 스케줄링을 지원
- 전송 계층 교차 사이트 상호 연결: 개방형 교차 사이트 상호 연결 통신 구성 요소 구축, 다중 전송 모드 및 다중 통신 프로토콜 지원, 여러 이기종 개인 정보 보호 컴퓨팅 플랫폼 간의 데이터 전송에 적응할 수 있으며 전송 효율성 및 시스템 안정성 향상
-
연방 이기종 컴퓨팅 상호 연결: 분산 및 일반 텍스트 구축 Tensor/DataFrame, DecouplingHE, MPC 및 기타 보안 프로토콜 및 연합 알고리즘 프로토콜, 도움말 연합된 이기종 컴퓨팅 엔진
-
코어 알고리즘 마이그레이션 및 확장의 상호 연결, 알고리즘 개발 경험 및 성능이 크게 향상됩니다. 분산되고 명확한 CiphertextTensor/Dataframe 프로그래밍 모드를 사용하여 핵심 알고리즘을 실현합니다. 마이그레이션 및 확장, 핵심 알고리즘 성능 개선: PSI개인정보 보호 교차 알고리즘 성능 개선 1.8+배, 수직 연합SSHE-LR 알고리즘 성능 4.3+배 향상 수직 연합 신경망 알고리즘 성능이 143배
FATE 2.0전체 상호 연결 아키텍처의 개략도
FATE-Client 2.0: 확장 가능한 연합 DSL 구축 , 지원 애플리케이션 계층 상호 연결
1.소개합니다. 새로운 확장 가능하고 표준화된 연합 DSL IR, 즉 연합 모델링 프로세스 DSL 표준화 중간 계층 표현2. DSL IR
3. DSL IR프로토콜 확장 기능 향상: 다중 당사자 비대칭 스케줄링 지원
4. 연방 DSL IR 및 기타 프로토콜(예: Beijing Financial Technology Industry Alliance Interoperability BFIA 프로토콜
5)의 상호 변환 Flow Cli 및 Flow SDK 기능 마이그레이션 완료
FATE-Flow 2.0: 표준화된 개방형 상호 연결 일정 플랫폼 구축
1. 확장 가능하고 표준화된 FATE 2.0 Federal DSL IR
2. 상호 연결 예약 계층 프레임워크를 구축하고 "프라이버시 컴퓨팅 상호 운용성 API 기술 문서"에 포함된 제어 계층 인터페이스와 같은 어댑터를 통해 다른 프로토콜을 지원합니다.
3. 프로세스 스케줄링, 분리 및 사용자 정의 가능한 스케줄링 논리 최적화, 우선순위 스케줄링 추가
4. 알고리즘 구성 요소 스케줄링 최적화, 컨테이너 수준 알고리즘 로딩 지원 및 이기종에 대한 크로스 플랫폼 지원 개선 시나리오5.
다중 버전 알고리즘 구성요소 등록 최적화 및 구성요소 작동 모드 등록 지원6.
Federated DSL IR 확장 개선: 다자간 비대칭 스케줄링 지원 7.
클라이언트 인증 로직을 최적화하고 여러 클라이언트의 권한 관리를 지원합니다8.
RESTful 인터페이스를 최적화하여 입력 필드 및 유형, 반환 필드 및 상태 코드를 더 명확하게 만듭니다9
. OFX(Open Flow Exchange) 모듈 추가: 스케줄링 클라이언트를 캡슐화하여 크로스 플랫폼 스케줄링을 허용합니다. 10.
FATE Flow 1.x 11의 모든 엔진과 호환되는 동시에 새로운 통신 엔진 OSX를 지원합니다.
시스템 레이어와 알고리즘 레이어가 분리되고 시스템 구성이 FATE 저장소에서 Flow 저장소로 이동됩니다12.
FATE Flow 패키지가 PyPI에 출시되고 서비스 관리를 위한 새로운 서비스가 제공됩니다. 레벨 CLI가 추가되었습니다.13. 1.x 주요 기능 마이그레이션 완료
OSX(Open Site Exchange) 1.0: 개방형 사이트 간 상호 연결 통신 구성 요소 구축
-
참고 베이징 핀테크 산업 연합에서 발표한 "금융 산업 개인 정보 보호 컴퓨팅 상호 운용성 API 기술 문서"는 FATE 1.X 버전 및 FATE 2.X 버전과 호환되는
상호 운용성- 전송 인터페이스를 구현합니다. grpc 동기 전송 및 스트리밍 전송 지원, TLS 보안 전송 프로토콜 지원, FATE 1.X 롤사이트 구성 요소와 호환
- Http 1 지원. 전송 중 예외 처리 로직의 Rabbitmq 및 pulsar 구성 요소는 예외를 빠르게 찾을 수 있도록 보다 정확한 로그 출력을 제공합니다.
- 라우팅 구성은 기본적으로 원본 롤사이트와 동일하여 이식의 어려움이 줄어듭니다
-
라우팅 테이블 수정을 위한 http 인터페이스 지원, 간단한 권한 확인 제공
- 네트워크 연결 관리 개선 로직, 연결 누출 위험 감소, 전송 효율성 향상
- 다양한 포트를 사용하여 클러스터 내부와 외부의 액세스 요청을 처리하므로 포트마다 서로 다른 보안 정책을 더 쉽게 채택할 수 있습니다.
- FATE-Arch 2.0:
-
통일되고 표준화된 API를 구축하여 연합된 이기종 컴퓨팅 엔진의 상호 연결을 촉진합니다
-
Context: "분산 컴퓨팅", "연합 학습", "암호화 알고리즘", "텐서 연산", "메트릭" 및 "입력 및 출력"과 같은 개발자 친화적인 API를 관리하기 위해 "컨텍스트"를 도입합니다. 관리"
-
Tensor: 텐서 데이터 구조를 도입하여 로컬 및 분산 행렬 작업을 처리하고 내장된 이기종 가속을 지원합니다. PHETensor 추상화 계층 최적화, 표준 인터페이스를 통한 다양한 기본 PHE 구현 사용, 무료 전환
- DataFrame: 데이터 입력 및 출력과 기본 기능 엔지니어링을 위한 "DataFrame" 2차원 표 형식 데이터 구조를 소개합니다. 새로운 데이터 블록 관리자는 열 다중 유형 관리를 지원하고 통계, 비교, 인덱싱, 데이터 비닝 및 변환 등과 같은 30개 이상의 연산자 인터페이스를 추가합니다.
-
재구성된 연합: 통합 연합 제공 Communication통합 직렬화/역직렬화 제어 및 보다 친숙한 API를 포함한 인터페이스
-
Config: 보안 구성, 시스템 구성 및 알고리즘 구성을 포함하여 FATE에 대한 통합 구성 설정 제공
- "로거" 리팩터링 : 다양한 사용 방법과 요구 사항에 따라 로깅 세부 정보 사용자 정의
-
Launcher: 단순화된 연합 프로그램 실행 도구, 특히 독립 실행형 실행 및 로컬 디버깅에 적합
-
프로토콜 계층: SSHE 지원(하이브리드 보안 다자간 계산 및 동형 암호화 프로토콜), ECDH, 보안 집계 프로토콜
- Deepspeed 통합: Eggroll을 통해 분산 GPU 클러스터의 훈련 일정 지원
- Crypten의 실험적 통합: SMPC 지원, 더 많은 프로토콜 기능은 향후 추가될 예정입니다
FATE-Component 2.0: 다양한 스케줄링 엔진에 적응할 수 있도록 표준화된 알고리즘 구성 요소 구축
- 구성 요소 도구 상자 소개: 기계 캡슐화 학습 모듈을 표준 실행 프로그램으로
- 스펙과 로더를 통해 명확한 API를 제공하여 내부 확장 및 외부 시스템과의 통합을 용이하게 합니다
- 입력 및 출력: FATE-Flow를 추가로 분리하고 표준화된 블랙박스 호출 프로세스 제공
- 구성 요소 정의: 유형 기반 정의 지원, 구성 요소 매개 변수 자동 확인, 다중 데이터 및 모델 입력 및 출력 유형, 다중 입력 지원
FATE-ML 2.0: 핵심 알고리즘 마이그레이션 그리고 확장, 알고리즘 개발 경험과 성능이 대폭 향상되었습니다
-
분산형, 일반 및 암호문 채택Tensor/Dataframe프로그래밍 모델을 채택하여 핵심 알고리즘 마이그레이션 및 확장 실현:
-
데이터 사전 처리: DataFrame Transformer 추가, Reader, PSI, Union 및 DataSplit 마이그레이션 완료
- 기능 엔지니어링: HeteroFederatedBinning, HeteroFeatureSelection, DataStatistics, Sampling, FeatureScale 및 Pearson Correlation 마이그레이션 완료
- Federated 학습 알고리즘 마이그레이션: HeteroSecureBoost, HomoNN, HeteroCoordinatedLogisticRegressio, HeteroCoordinatedLinearRegression, SSHE-LogisticRegression 및 SS HE-LinearRegression 포함
- 새로운 연합 증가 훈련 알고리즘 프로토콜: MPC 및 동형 암호화 하이브리드 프로토콜 기반 SSHE-HeteroNN
, FedPASS 프로토콜 기반 FedPASS-HeteroNN
- 획기적인 성능 개선
-
PSI개인 정보 보호 교차점 : 테스트됨 1억 개의 ID로 구성된 데이터 세트에서 교차 결과는 1억이며 성능은 FATE-1.11
- 세로 연합 비닝 알고리즘: 게스트에서 100,000행 * 30차원 기능, 호스트에서 테스트됨 100,000행*300차원 특징 데이터, 성능은 FATE-1.11의 1.5배 이상
- 수직 연합 SSHE-LR 알고리즘: 게스트에서 100,000행*300차원 특징, 호스트 100,000행 *3개의 데이터로 테스트됨 100차원 특징, 성능은 FATE-1.11
- 종방향 연방 벨트 코디네이터 LR 알고리즘: 게스트 100,000행*30 차원 특징, 호스트 100,000행*300 차원 특징이 있는 데이터에서 테스트되었으며 성능은 1.2입니다. + FATE-1.11의 배
- 종방향 연합 신경망(FedPass 프로토콜 기반): 게스트 100,000행*30차원 특징, 호스트 100,000행*300차원 특징 데이터 테스트 결과, 성능은 기본적으로 일반 텍스트 성능과 일치합니다. , 성능은 FATE-1.11
Eggroll 3.0: 시스템 성능, 가용성 및 안정성이 완전히 향상되었습니다
1. JVM 향상
- 핵심 구성 요소 재구성: 클러스터 관리자 및 노드 관리자 구성 요소는 Java 언어를 사용하여 완전히 재구성되어 균일성을 보장하고 성능을 향상합니다.
- 전송 구성 요소 수정: 롤사이트 전송 구성 요소 제거, 보다 효율적인 osx 구성 요소로 교체
- 프로세스 관리 개선: 더욱 발전된 프로세스 관리 로직을 구현하여 프로세스 누출 위험을 대폭 줄였습니다.
-
데이터 저장 로직 개선: 데이터 저장 메커니즘 최적화, 성능 및 신뢰성 향상
- 동시성 제어 개선: 동시성 제어 로직 업그레이드 성능 향상을 위해 원래 구성 요소에
- 시각적 구성 요소: 새로운 시각적 구성 요소를 추가하여 계산 정보 모니터링을 용이하게 합니다
- 로그 개선: 로그 시스템이 향상되고 출력이 더 정확해졌습니다.
2. 파이썬업그레이드
-
roll_pair 및 egg_pair 재구성: 호출자가 제어하는 직렬화 및 파티셔닝 방법 지원 , 직렬화 보안은 호출자가 균일하게 관리합니다.
- 중간 테이블의 자동 정리: 연합 및 계산 문제 해결 중급 호출자의 추가 작업 없이도 테이블이 자동으로 정리됩니다. 통합 구성 제어: 다양한 요구 사항을 충족하기 위해 직접 전송, 구성 파일 및 환경 변수를 지원하는 유연한 구성 시스템 도입: Eggroll 3.0.0은 쉬운 클라이언트를 지원합니다. PyPI를 통한 설치
- 로그 구성 최적화: 호출자는 필요에 따라 로그 형식을 사용자 정의할 수 있습니다
- 코드 구조 조정: 코드 베이스가 간소화되고, 구조와 논리가 더 명확해지고, 중복되는 코드가 많이 제거됩니다
-
민간 컴퓨팅 산업의 발전을 돕기 위한 오픈 소스 역량 결집
- 금융, 통신, 의료, 공무, 광고 마케팅 등 산업 간, 기관 간 데이터 통합 , 스마트 시티 및 기타 여러 시나리오에는 광범위한 요구 사항이 있습니다. 개인 정보 보호 컴퓨팅은 산업 간 데이터 장벽을 허무는 강력한 도구가 되었으며, 상호 연결은 이 강력한 도구를 최대한 활용하기 위한 숫돌입니다. FATE 2.0은 상호 연결 및 상호 운용성을 달성하기 위한 오픈 소스 프레임워크를 제공하여 업계의 주요 문제점을 해결합니다. 대부분의 개인 정보 보호 컴퓨팅 플랫폼은 개방형 상호 운용성 인터페이스를 구현하여 이기종 시스템과 상호 작용하고 통합하려는 목적을 달성할 수 있습니다.
FATE 2.0의 출시는 이기종 플랫폼 간의 상호 연결 및 상호 운용성에 대한 강력한 지원을 제공하며 지속적인 반복은 지속적인 기술 개선에 대한 의지를 보여줍니다. 이는 데이터 개인 정보 보호뿐만 아니라 전체 산업 발전에 관한 것입니다. 이 과정에서 개인 정보 보호 컴퓨팅 업계 사용자와 기술 파트너는 더 많은 참여 기회를 갖게 됩니다. 커뮤니티의 공동 노력을 통해 우리는 데이터 보안 및 개인 정보 보호 문제를 더 잘 해결하고 보다 안전하고 신뢰할 수 있는 디지털 사회를 구축하기 위한 견고한 기반을 마련할 수 있습니다. FATE 2.0
의 출시는 업계 협력과 상생의 새로운 장입니다. 더 많은 혁신가와 실무자가 참여하여 개인 정보 보호 컴퓨팅 기술의 활발한 발전을 공동으로 추진할 수 있기를 기대합니다.
[1] 국가 데이터국: "데이터 요소 [2]
발행에 관한 국가 데이터국 및 기타 부서의 공지 통신 기술 및 기타: 우리나라 데이터 요소 시장 육성의 진행 상황과 동향[3]
"금융 산업 개인 정보 보호 컴퓨팅 상호 운용성 API 기술 문서" v1.0이 출시되었습니다. FATE 커뮤니티 저장소에 호스팅됨 : https://github.com/FederatedAI/InterOp
위 내용은 FATE 2.0 출시: 이기종 연합 학습 시스템의 상호 연결 실현의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!