Comment puis-je optimiser ma transformation théorique des nombres (NTT) et mon arithmétique modulaire pour une mise au carré rapide de très grands nombres ?-C++-php.cn

Comment puis-je optimiser ma transformation théorique des nombres (NTT) et mon arithmétique modulaire pour une mise au carré rapide de très grands nombres ?

Linda Hamilton

Dec 18, 2024 pm 04:56 PM

How Can I Optimize My Number Theoretic Transform (NTT) and Modular Arithmetic for Fast Squaring of Very Large Numbers?

Arithmétique modulaire et optimisations NTT (DFT à champs finis)

Problème : Je voulais utiliser NTT pour une mise au carré rapide (voir Calcul rapide du carré bignum), mais le résultat est lent même pour les très grands nombres .. plus de 12 000 bits.

Ma question est donc :

Y a-t-il un moyen d'optimiser mon Transformation NTT ?

Je ne voulais pas l'accélérer par parallélisme (threads) ; il s'agit uniquement d'une couche de bas niveau.

Existe-t-il un moyen d'accélérer mon calcul modulaire ?

Voici mon code source (déjà optimisé) en C pour NTT (il est complet et 100% fonctionne en C sans avoir besoin de bibliothèques tierces et doit également être thread-safe. Attention, le tableau source est utilisé comme temporaire !!!, il ne peut pas non plus transformer le tableau en lui-même).

//---------------------------------------------------------------------------
class fourier_NTT                                    // Number theoretic transform
    {

public:
    DWORD r,L,p,N;
    DWORD W,iW,rN;
    fourier_NTT(){ r=0; L=0; p=0; W=0; iW=0; rN=0; }

    // main interface
    void  NTT(DWORD *dst,DWORD *src,DWORD n=0);               // DWORD dst[n] = fast  NTT(DWORD src[n])
    void INTT(DWORD *dst,DWORD *src,DWORD n=0);               // DWORD dst[n] = fast INTT(DWORD src[n])

    // Helper functions
    bool init(DWORD n);                                       // init r,L,p,W,iW,rN
    void  NTT_fast(DWORD *dst,DWORD *src,DWORD n,DWORD w);    // DWORD dst[n] = fast  NTT(DWORD src[n])

    // Only for testing
    void  NTT_slow(DWORD *dst,DWORD *src,DWORD n,DWORD w);    // DWORD dst[n] = slow  NTT(DWORD src[n])
    void INTT_slow(DWORD *dst,DWORD *src,DWORD n,DWORD w);    // DWORD dst[n] = slow INTT(DWORD src[n])

    // DWORD arithmetics
    DWORD shl(DWORD a);
    DWORD shr(DWORD a);

    // Modular arithmetics
    DWORD mod(DWORD a);
    DWORD modadd(DWORD a,DWORD b);
    DWORD modsub(DWORD a,DWORD b);
    DWORD modmul(DWORD a,DWORD b);
    DWORD modpow(DWORD a,DWORD b);
    };

//---------------------------------------------------------------------------
void fourier_NTT:: NTT(DWORD *dst,DWORD *src,DWORD n)
    {
    if (n>0) init(n);
    NTT_fast(dst,src,N,W);
//    NTT_slow(dst,src,N,W);
    }

//---------------------------------------------------------------------------
void fourier_NTT::INTT(DWORD *dst,DWORD *src,DWORD n)
    {
    if (n>0) init(n);
    NTT_fast(dst,src,N,iW);
    for (DWORD i=0;i<n dst intt_slow bool fourier_ntt::init n p else ntt overflow can ocur r="2;" if>0x10000000)) { r=0; L=0; p=0; W=0; iW=0; rN=0; N=0; return false; } L=0x30000000/n; // 32:30 bit best for unsigned 32 bit
//    r=2; p=0x78000001; if ((n0x04000000)) { r=0; L=0; p=0; W=0; iW=0; rN=0; N=0; return false; } L=0x3c000000/n; // 31:27 bit best for signed 32 bit
//    r=2; p=0x00010001; if ((n0x00000020)) { r=0; L=0; p=0; W=0; iW=0; rN=0; N=0; return false; } L=0x00000020/n; // 17:16 bit best for 16 bit
//    r=2; p=0x0a000001; if ((n0x01000000)) { r=0; L=0; p=0; W=0; iW=0; rN=0; N=0; return false; } L=0x01000000/n; // 28:25 bit
     N=n;                // size of vectors [DWORDs]
     W=modpow(r,    L);    // Wn for NTT
    iW=modpow(r,p-1-L);    // Wn for INTT
    rN=modpow(n,p-2  );    // scale for INTT
    return true;
    }

//---------------------------------------------------------------------------
void fourier_NTT:: NTT_fast(DWORD *dst,DWORD *src,DWORD n,DWORD w)
    {
    if (n>1,w2=modmul(w,w);
    // reorder even,odd
    for (i=0,j=0;i<n2 dst for j="1;i<n" recursion ntt_fast even odd restore results a0="src[i];" a1="modmul(src[j],w2);" void fourier_ntt:: ntt_slow n w dword i>>1;
    for (wj=1,j=0;j<n a="0;" for wi="modmul(wi,wj);" dst wj="modmul(wj,w);" void fourier_ntt::intt_slow n w dword i>>1;
    for (wj=1,j=0;j<n a="0;" for wi="modmul(wi,wj);" dst wj="modmul(wj,iW);"></n></n></n2></n>

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article connexe

Construire des applications XML avec C: Exemples pratiquesMay 03, 2025 am 12:16 AM

Vous pouvez utiliser les bibliothèques TinyXML, PUGIXML ou LIBXML2 pour traiter les données XML dans C. 1) Parse Fichiers XML: utilisez des méthodes DOM ou SAX, DOM convient aux petits fichiers et SAX convient aux fichiers volumineux. 2) Générez le fichier XML: convertissez la structure de données au format XML et écrivez dans le fichier. Grâce à ces étapes, les données XML peuvent être gérées et manipulées efficacement.

XML en C: Gestion des structures de données complexesMay 02, 2025 am 12:04 AM

Travailler avec des structures de données XML en C peut utiliser la bibliothèque TinyXML ou PUGIXML. 1) Utilisez la bibliothèque PUGIXML pour analyser et générer des fichiers XML. 2) Gérer les éléments XML imbriqués complexes, tels que les informations du livre. 3) Optimiser le code de traitement XML, et il est recommandé d'utiliser des bibliothèques efficaces et des analyses de streaming. Grâce à ces étapes, les données XML peuvent être traitées efficacement.

C et performance: où il domine encoreMay 01, 2025 am 12:14 AM

C domine toujours l'optimisation des performances car sa gestion de la mémoire de bas niveau et ses capacités d'exécution efficaces le rendent indispensable dans le développement de jeux, les systèmes de transaction financière et les systèmes intégrés. Plus précisément, il se manifeste comme suit: 1) dans le développement de jeux, la gestion de la mémoire de bas niveau de C et les capacités d'exécution efficaces en font le langage préféré pour le développement du moteur de jeu; 2) Dans les systèmes de transaction financière, les avantages de performance de C assurent la latence extrêmement faible et le débit élevé; 3) Dans les systèmes intégrés, la gestion de la mémoire de bas niveau de C et les capacités d'exécution efficaces le rendent très populaire dans des environnements limités aux ressources.

C Frameworks XML: Choisir le bon pour vousApr 30, 2025 am 12:01 AM

Le choix du cadre C XML doit être basé sur les exigences du projet. 1) TinyXML convient aux environnements liés aux ressources, 2) PUGIXML convient aux exigences à haute performance, 3) Xerces-C prend en charge la vérification complexe XMLSChema et les performances, la facilité d'utilisation et les licences doivent être prises en compte lors du choix.

C # vs C: Choisir la bonne langue pour votre projetApr 29, 2025 am 12:51 AM

C # convient aux projets qui nécessitent l'efficacité du développement et la sécurité des types, tandis que C convient aux projets qui nécessitent des performances élevées et un contrôle matériel. 1) C # fournit la collection des ordures et LINQ, adapté aux applications d'entreprise et au développement de Windows. 2) C est connu pour ses performances élevées et son contrôle sous-jacent, et est largement utilisé dans les jeux et la programmation système.

Comment optimiser le codeApr 28, 2025 pm 10:27 PM

L'optimisation du code C peut être réalisée grâce aux stratégies suivantes: 1. Gérer manuellement la mémoire pour l'utilisation d'optimisation; 2. Écrivez du code conforme aux règles d'optimisation du compilateur; 3. Sélectionnez les algorithmes et structures de données appropriés; 4. Utiliser les fonctions en ligne pour réduire les frais généraux d'appel; 5. Appliquer la métaprogrammation du modèle pour optimiser au moment de la compilation; 6. Évitez la copie inutile, utilisez la sémantique mobile et les paramètres de référence; 7. Utilisez Constir correctement pour aider à l'optimisation du compilateur; 8. Sélectionnez des structures de données appropriées, telles que STD :: Vector.

Comment comprendre le mot-clé volatil en C?Apr 28, 2025 pm 10:24 PM

Le mot-clé volatil en C est utilisé pour informer le compilateur que la valeur de la variable peut être modifiée en dehors du contrôle du code et ne peut donc pas être optimisée. 1) Il est souvent utilisé pour lire des variables qui peuvent être modifiées par des programmes de service matériel ou interrompus, tels que l'état du capteur. 2) Volatile ne peut garantir la sécurité multi-thread et doit utiliser des serrures mutex ou des opérations atomiques. 3) L'utilisation du volatile peut entraîner une légère diminution des performances, mais assurer l'exactitude du programme.

Comment mesurer les performances du fil en C?Apr 28, 2025 pm 10:21 PM

La mesure des performances du thread en C peut utiliser les outils de synchronisation, les outils d'analyse des performances et les minuteries personnalisées dans la bibliothèque standard. 1. Utilisez la bibliothèque pour mesurer le temps d'exécution. 2. Utilisez le GPROF pour l'analyse des performances. Les étapes incluent l'ajout de l'option -pg pendant la compilation, l'exécution du programme pour générer un fichier gmon.out et la génération d'un rapport de performances. 3. Utilisez le module Callgrind de Valgrind pour effectuer une analyse plus détaillée. Les étapes incluent l'exécution du programme pour générer le fichier callgrind.out et la visualisation des résultats à l'aide de Kcachegrind. 4. Les minuteries personnalisées peuvent mesurer de manière flexible le temps d'exécution d'un segment de code spécifique. Ces méthodes aident à bien comprendre les performances du thread et à optimiser le code.

See all articles

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Afficher plus

Article chaud

Quoi de neuf dans Windows 11 KB5054979 et comment résoudre les problèmes de mise à jour

1 Il y a quelques moisByDDD

Comment réparer KB5055523 ne parvient pas à s'installer dans Windows 11?

3 Il y a quelques semainesByDDD

Comment réparer KB5055518 ne parvient pas à s'installer dans Windows 10?

3 Il y a quelques semainesByDDD

Niveaux de force pour chaque ennemi et monstre de R.E.P.O.

3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

Blue Prince: Comment se rendre au sous-sol

3 Il y a quelques semainesByDDD

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 Linux nouvelle version

Dernière version de SublimeText3 Linux

VSCode Windows 64 bits Télécharger

Un éditeur IDE gratuit et puissant lancé par Microsoft

Adaptateur de serveur SAP NetWeaver pour Eclipse

Intégrez Eclipse au serveur d'applications SAP NetWeaver.

mPDF

mPDF est une bibliothèque PHP qui peut générer des fichiers PDF à partir de HTML encodé en UTF-8. L'auteur original, Ian Back, a écrit mPDF pour générer des fichiers PDF « à la volée » depuis son site Web et gérer différentes langues. Il est plus lent et produit des fichiers plus volumineux lors de l'utilisation de polices Unicode que les scripts originaux comme HTML2FPDF, mais prend en charge les styles CSS, etc. et présente de nombreuses améliorations. Prend en charge presque toutes les langues, y compris RTL (arabe et hébreu) et CJK (chinois, japonais et coréen). Prend en charge les éléments imbriqués au niveau du bloc (tels que P, DIV),

Afficher plus

Sujets chauds

1653

1413

1304

1251

1224