보다 빠른 대수 제곱 계산을 위해 NTT(정수 이론 변환) 및 모듈식 산술을 어떻게 최적화할 수 있습니까?-C++-php.cn

집

백엔드 개발

C++

보다 빠른 대수 제곱 계산을 위해 NTT(정수 이론 변환) 및 모듈식 산술을 어떻게 최적화할 수 있습니까?

Patricia Arquette

Dec 30, 2024 am 05:20 AM

How Can I Optimize My Number Theoretic Transform (NTT) and Modular Arithmetic for Faster Big Number Squaring?

모듈식 연산 및 NTT(유한장 DFT) 최적화

원래 질문:

I 빠른 제곱을 위해 NTT를 사용하고 싶었습니다(빠른 빅넘 제곱 계산 참조). 하지만 12000비트가 넘는 매우 큰 숫자의 경우에도 결과가 느립니다.

내 질문은 다음과 같습니다.

내 NTT를 최적화할 수 있는 방법이 있습니까? 변환?
병렬성(스레드)으로 속도를 높이려는 것은 아닙니다. 이것은 하위 수준 레이어에만 해당됩니다.
모듈러 연산 속도를 높일 수 있는 방법이 있나요?

코드:

//---------------------------------------------------------------------------
class fourier_NTT                                    // Number theoretic transform
    {

public:
    DWORD r,L,p,N;
    DWORD W,iW,rN;
    fourier_NTT(){ r=0; L=0; p=0; W=0; iW=0; rN=0; }

    // main interface
    void  NTT(DWORD *dst,DWORD *src,DWORD n=0);               // DWORD dst[n] = fast  NTT(DWORD src[n])
    void iNTT(DWORD *dst,DWORD *src,DWORD n=0);               // DWORD dst[n] = fast INTT(DWORD src[n])

    // Helper functions
    bool init(DWORD n);                                       // init r,L,p,W,iW,rN
    void  NTT_fast(DWORD *dst,DWORD *src,DWORD n,DWORD w);    // DWORD dst[n] = fast  NTT(DWORD src[n])

    // Only for testing
    void  NTT_slow(DWORD *dst,DWORD *src,DWORD n,DWORD w);    // DWORD dst[n] = slow  NTT(DWORD src[n])
    void iNTT_slow(DWORD *dst,DWORD *src,DWORD n,DWORD w);    // DWORD dst[n] = slow INTT(DWORD src[n])

    // DWORD arithmetics
    DWORD shl(DWORD a);
    DWORD shr(DWORD a);

    // Modular arithmetics
    DWORD mod(DWORD a);
    DWORD modadd(DWORD a,DWORD b);
    DWORD modsub(DWORD a,DWORD b);
    DWORD modmul(DWORD a,DWORD b);
    DWORD modpow(DWORD a,DWORD b);
    };

//---------------------------------------------------------------------------
void fourier_NTT:: NTT(DWORD *dst,DWORD *src,DWORD n)
    {
    if (n>0) init(n);
    NTT_fast(dst,src,N,W);
//    NTT_slow(dst,src,N,W);
    }

//---------------------------------------------------------------------------
void fourier_NTT::INTT(DWORD *dst,DWORD *src,DWORD n)
    {
    if (n>0) init(n);
    NTT_fast(dst,src,N,iW);
    for (DWORD i=0;i<n dst intt_slow bool fourier_ntt::init n p else ntt overflow can ocur r="2;" if>0x10000000)) { r=0; L=0; p=0; W=0; iW=0; rN=0; N=0; return false; } L=0x30000000/n; // 32:30 bit best for unsigned 32 bit
//    r=2; p=0x78000001; if ((n0x04000000)) { r=0; L=0; p=0; W=0; iW=0; rN=0; N=0; return false; } L=0x3c000000/n; // 31:27 bit best for signed 32 bit
//    r=2; p=0x00010001; if ((n0x00000020)) { r=0; L=0; p=0; W=0; iW=0; rN=0; N=0; return false; } L=0x00000020/n; // 17:16 bit best for 16 bit
//    r=2; p=0x0a000001; if ((n0x01000000)) { r=0; L=0; p=0; W=0; iW=0; rN=0; N=0; return false; } L=0x01000000/n; // 28:25 bit
     N=n;                // size of vectors [DWORDs]
     W=modpow(r,    L);    // Wn for NTT
    iW=modpow(r,p-1-L);    // Wn for INTT
    rN=modpow(n,p-2  );    // scale for INTT
    return true;
    }

//---------------------------------------------------------------------------
void fourier_NTT:: NTT_fast(DWORD *dst,DWORD *src,DWORD n,DWORD w)
    {
    if (n>1,w2=modmul(w,w);
    // reorder even,odd
    for (i=0,j=0;i<n2 dst for j="1;i<n" recursion ntt_fast even odd restore results a0="src[i];" a1="modmul(src[j],w2);" void fourier_ntt:: ntt_slow n w dword i a="0;" wi="modmul(wi,wj);" wj="modmul(wj,w);" fourier_ntt::intt_slow fourier_ntt::shl return fourier_ntt::shr>>1)&0x7FFFFFFF; }

//---------------------------------------------------------------------------
DWORD fourier_NTT::mod(DWORD a)
    {
    DWORD bb;</n2></n>

위 내용은 보다 빠른 대수 제곱 계산을 위해 NTT(정수 이론 변환) 및 모듈식 산술을 어떻게 최적화할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

C에서 XML 사용 : 라이브러리 및 도구에 대한 안내서May 09, 2025 am 12:16 AM

XML은 데이터, 특히 구성 파일, 데이터 저장 및 네트워크 통신에서 데이터를 구조화하는 편리한 방법을 제공하기 때문에 C에서 사용됩니다. 1) TinyXML, PugixML, RapidXML과 같은 적절한 라이브러리를 선택하고 프로젝트 요구에 따라 결정하십시오. 2) XML 파싱 및 생성의 두 가지 방법을 이해하십시오. DOM은 자주 액세스 및 수정에 적합하며 SAX는 큰 파일 또는 스트리밍 데이터에 적합합니다. 3) 성능을 최적화 할 때 TinyXML은 작은 파일에 적합하며 PugixML은 메모리와 속도에서 잘 작동하며 RapidXML은 큰 파일을 처리하는 데 탁월합니다.

C# 및 C : 다른 패러다임 탐색May 08, 2025 am 12:06 AM

C#과 C의 주요 차이점은 메모리 관리, 다형성 구현 및 성능 최적화입니다. 1) C#은 쓰레기 수집기를 사용하여 메모리를 자동으로 관리하는 반면 C는 수동으로 관리해야합니다. 2) C#은 인터페이스 및 가상 방법을 통해 다형성을 실현하고 C는 가상 함수와 순수한 가상 함수를 사용합니다. 3) C#의 성능 최적화는 구조 및 병렬 프로그래밍에 따라 다르며 C는 인라인 함수 및 멀티 스레딩을 통해 구현됩니다.

C XML 파싱 : 기술 및 모범 사례May 07, 2025 am 12:06 AM

DOM 및 SAX 방법은 XML 데이터를 C에서 구문 분석하는 데 사용될 수 있습니다. 1) DOM 파싱은 XML로드를 메모리로, 작은 파일에 적합하지만 많은 메모리를 차지할 수 있습니다. 2) Sax Parsing은 이벤트 중심이며 큰 파일에 적합하지만 무작위로 액세스 할 수는 없습니다. 올바른 방법을 선택하고 코드를 최적화하면 효율성이 향상 될 수 있습니다.

특정 도메인의 C : 거점 탐색May 06, 2025 am 12:08 AM

C는 고성능과 유연성으로 인해 게임 개발, 임베디드 시스템, 금융 거래 및 과학 컴퓨팅 분야에서 널리 사용됩니다. 1) 게임 개발에서 C는 효율적인 그래픽 렌더링 및 실시간 컴퓨팅에 사용됩니다. 2) 임베디드 시스템에서 C의 메모리 관리 및 하드웨어 제어 기능이 첫 번째 선택이됩니다. 3) 금융 거래 분야에서 C의 고성능은 실시간 컴퓨팅의 요구를 충족시킵니다. 4) 과학 컴퓨팅에서 C의 효율적인 알고리즘 구현 및 데이터 처리 기능이 완전히 반영됩니다.

신화를 파악 : C는 정말로 죽은 언어입니까?May 05, 2025 am 12:11 AM

C는 죽지 않았지만 많은 주요 영역에서 번성했습니다 : 1) 게임 개발, 2) 시스템 프로그래밍, 3) 고성능 컴퓨팅, 4) 브라우저 및 네트워크 응용 프로그램, C는 여전히 유명한 활력 및 응용 시나리오를 보여줍니다.

C# vs. C : 프로그래밍 언어의 비교 분석May 04, 2025 am 12:03 AM

C#과 C의 주요 차이점은 구문, 메모리 관리 및 성능입니다. 1) C# Syntax는 현대적이며 Lambda 및 Linq를 지원하며 C 기능을 유지하고 템플릿을 지원합니다. 2) C# 자동으로 메모리를 관리하고 C는 수동으로 관리해야합니다. 3) C 성능은 C#보다 낫지 만 C# 성능도 최적화되고 있습니다.

C를 사용하여 XML 애플리케이션 구축 : 실제 예제May 03, 2025 am 12:16 AM

tinyxml, pugixml 또는 libxml2 라이브러리를 사용하여 C에서 XML 데이터를 처리 할 수 있습니다. 1) XML 파일을 구문 분석 할 수 있습니다. dom 또는 sax 메소드 사용, dom은 작은 파일에 적합하며 Sax는 큰 파일에 적합합니다. 2) XML 파일 생성 : 데이터 구조를 XML 형식으로 변환하고 파일에 씁니다. 이러한 단계를 통해 XML 데이터를 효과적으로 관리하고 조작 할 수 있습니다.

C의 XML : 복잡한 데이터 구조 처리May 02, 2025 am 12:04 AM

C에서 XML 데이터 구조로 작업하면 tinyxml 또는 pugixml 라이브러리를 사용할 수 있습니다. 1) pugixml 라이브러리를 사용하여 XML 파일을 구문 분석하고 생성하십시오. 2) 책 정보와 같은 복잡한 중첩 XML 요소를 처리합니다. 3) XML 처리 코드를 최적화하면 효율적인 라이브러리 및 스트리밍 구문 분석을 사용하는 것이 좋습니다. 이러한 단계를 통해 XML 데이터를 효율적으로 처리 할 수 있습니다.

See all articles