recherche
Maisondéveloppement back-endC++Comment puis-je optimiser ma transformation théorique des nombres (NTT) et mon arithmétique modulaire pour un calcul plus rapide, en particulier avec de très grands nombres (par exemple, plus de 12 000 bits) ?

How can I optimize my Number Theoretic Transform (NTT) and modular arithmetic for faster computation, especially with very large numbers (e.g., over 12000 bits)?

Arithmétique modulaire et optimisations NTT (DFT à champs finis)

Énoncé du problème


Je voulais utiliser NTT pour obtenir rapidement quadrature (voir Calcul rapide du carré bignum), mais le résultat est lent même pour de très grands nombres .. plus de 12000 bits.


Ma question est donc :

< ;ol>

  • Y a-t-il un moyen d'optimiser ma transformation NTT ? Je ne voulais pas l'accélérer par parallélisme (threads) ; il s'agit uniquement d'une couche de bas niveau.

  • Existe-t-il un moyen d'accélérer mon calcul modulaire ?


  • Voici mon code source (déjà optimisé) en C pour NTT (il est complet et fonctionne à 100% en C sans avoir besoin de bibliothèques tierces et doit également être thread-safe. Attention, le tableau source est utilisé comme temporaire !!!, il ne peut pas non plus transformer le tableau en lui-même).

    Solution optimisée

    1. Utilisation de puissances précalculées : Précalcul et stocker les puissances de W et iW (la racine primitive de l'unité et son inverse) pour éviter de les recalculer pendant le processus NTT. Cela peut réduire considérablement le nombre de multiplications et de divisions, conduisant à des calculs plus rapides.
    2. Déroulage des boucles : Déroulez les boucles dans l'algorithme NTT pour réduire la surcharge associée aux itérations de boucle. Cela peut améliorer les performances en réduisant le nombre d'instructions de branchement.
    3. Optimisation de l'arithmétique modulaire : Utilisez les opérations au niveau des bits et le langage d'assemblage pour implémenter efficacement les opérations arithmétiques modulaires (addition, soustraction, multiplication et exponentiation). . Cela peut éliminer les branchements inutiles et les instructions conditionnelles, ce qui entraîne une exécution plus rapide.

    Exemple d'implémentation

    Voici un exemple d'implémentation NTT optimisée en C utilisant des puissances précalculées et des opérations au niveau du bit :

    class NTT {
    public:
        NTT() {
            // Initialize constants
            p = 0xc0000001;
            W = modpow(2, 0x30000000 / n);
            iW = modpow(2, p - 1 - 0x30000000 / n);
            rN = modpow(n, p - 2);
            NN = n >> 1;
    
            // Precompute W and iW powers
            WW = new uint32_t[n];
            iWW = new uint32_t[n];
            WW[0] = 1;
            iWW[0] = 1;
            for (uint32_t i = 1; i  0) {
                // Reorder even, odd elements
                for (uint32_t i = 0, j = 0; i = p) d -= p;
            return d;
        }
    
        inline uint32_t modsub(uint32_t a, uint32_t b) {
            uint32_t d = a - b;
            if (d > a) d += p;
            return d;
        }
    
        inline uint32_t modmul(uint32_t a, uint32_t b) {
            uint32_t m = (uint64_t)a * b;
            return m - (p * (m / p));
        }
    
        inline uint32_t modpow(uint32_t a, uint32_t b) {
            if (b == 0) return 1;
            uint32_t t = modpow(a, b / 2);
            t = modmul(t, t);
            if (b & 1) t = modmul(t, a);
            return t;
        }
    };

    Conseils supplémentaires

    • Utilisez un langage de niveau supérieur prenant en charge opérations au niveau du bit et assemblage en ligne, tels que C .
    • Utilisez un profileur pour identifier les goulots d'étranglement dans votre code et ciblez-les pour l'optimisation.
    • Envisagez de paralléliser l'algorithme NTT à l'aide de plusieurs threads ou d'instructions SIMD.

    Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

    Déclaration
    Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
    C Questions et réponses d'entrevue: Ace votre prochaine évaluation techniqueC Questions et réponses d'entrevue: Ace votre prochaine évaluation techniqueApr 28, 2025 am 12:10 AM

    C Dans les interviews, les pointeurs intelligents sont les outils clés qui aident à gérer la mémoire et à réduire les fuites de mémoire. 1) STD :: UNIQUE_PTR fournit une propriété exclusive pour s'assurer que les ressources sont automatiquement publiées. 2) STD :: Shared_ptr est utilisé pour la propriété partagée et convient aux scénarios multi-références. 3) STD :: Faible_PTR peut éviter les références circulaires et assurer une gestion sécurisée des ressources.

    L'avenir de C: adaptations et innovationsL'avenir de C: adaptations et innovationsApr 27, 2025 am 12:25 AM

    L'avenir de C se concentrera sur l'informatique parallèle, la sécurité, la modularisation et l'apprentissage AI / Machine: 1) L'informatique parallèle sera améliorée par des fonctionnalités telles que les coroutines; 2) La sécurité sera améliorée par le biais de mécanismes de vérification et de gestion de la mémoire plus stricts; 3) La modulation simplifiera l'organisation et la compilation du code; 4) L'IA et l'apprentissage automatique inviteront C à s'adapter à de nouveaux besoins, tels que l'informatique numérique et le support de programmation GPU.

    La longévité de C: examiner son statut actuelLa longévité de C: examiner son statut actuelApr 26, 2025 am 12:02 AM

    C est toujours important dans la programmation moderne en raison de sa nature efficace, flexible et puissante. 1) C prend en charge la programmation orientée objet, adaptée à la programmation système, au développement de jeux et aux systèmes intégrés. 2) Le polymorphisme est le point culminant de C, permettant à l'appel de dériver des méthodes de classe par des pointeurs de classe de base ou des références pour améliorer la flexibilité et l'évolutivité du code.

    C # vs. C Performance: analyse comparative et considérationsC # vs. C Performance: analyse comparative et considérationsApr 25, 2025 am 12:25 AM

    Les différences de performances entre C # et C se reflètent principalement dans la vitesse d'exécution et la gestion des ressources: 1) C fonctionne généralement mieux dans les calculs numériques et les opérations de chaîne car il est plus proche du matériel et n'a pas de frais généraux supplémentaires tels que la collecte des ordures; 2) C # est plus concis dans la programmation multi-thread, mais ses performances sont légèrement inférieures à C; 3) Quelle langue choisir doit être déterminée en fonction des exigences du projet et de la pile de technologie d'équipe.

    C: Est-ce que je meure ou est simplement en évolution?C: Est-ce que je meure ou est simplement en évolution?Apr 24, 2025 am 12:13 AM

    C isnotdying; il se révolte.1) C reste réévèreurtoitSversatity et effecciation en termes

    C dans le monde moderne: applications et industriesC dans le monde moderne: applications et industriesApr 23, 2025 am 12:10 AM

    C est largement utilisé et important dans le monde moderne. 1) Dans le développement du jeu, C est largement utilisé pour ses performances élevées et son polymorphisme, telles que UnrealEngine et Unity. 2) Dans les systèmes de négociation financière, la faible latence et le débit élevé de C en font le premier choix, adapté au trading à haute fréquence et à l'analyse des données en temps réel.

    Cibliothèques C XML: Comparaison et options contrastéesCibliothèques C XML: Comparaison et options contrastéesApr 22, 2025 am 12:05 AM

    Il existe quatre bibliothèques XML couramment utilisées dans C: TinyXML-2, PUGIXML, XERCES-C et RapidXML. 1.Tinyxml-2 convient aux environnements avec des ressources limitées, des fonctions légères mais limitées. 2. PUGIXML est rapide et prend en charge la requête XPath, adaptée aux structures XML complexes. 3.xerces-C est puissant, prend en charge la résolution DOM et SAX et convient au traitement complexe. 4. RapidXML se concentre sur les performances et les analyses extrêmement rapidement, mais ne prend pas en charge les requêtes XPath.

    C et XML: Explorer la relation et le soutienC et XML: Explorer la relation et le soutienApr 21, 2025 am 12:02 AM

    C interagit avec XML via des bibliothèques tierces (telles que TinyXML, PUGIXML, XERCES-C). 1) Utilisez la bibliothèque pour analyser les fichiers XML et les convertir en structures de données propices à C. 2) Lors de la génération de XML, convertissez la structure des données C au format XML. 3) Dans les applications pratiques, le XML est souvent utilisé pour les fichiers de configuration et l'échange de données afin d'améliorer l'efficacité du développement.

    See all articles

    Outils d'IA chauds

    Undresser.AI Undress

    Undresser.AI Undress

    Application basée sur l'IA pour créer des photos de nu réalistes

    AI Clothes Remover

    AI Clothes Remover

    Outil d'IA en ligne pour supprimer les vêtements des photos.

    Undress AI Tool

    Undress AI Tool

    Images de déshabillage gratuites

    Clothoff.io

    Clothoff.io

    Dissolvant de vêtements AI

    Video Face Swap

    Video Face Swap

    Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

    Outils chauds

    PhpStorm version Mac

    PhpStorm version Mac

    Le dernier (2018.2.1) outil de développement intégré PHP professionnel

    VSCode Windows 64 bits Télécharger

    VSCode Windows 64 bits Télécharger

    Un éditeur IDE gratuit et puissant lancé par Microsoft

    SublimeText3 version Mac

    SublimeText3 version Mac

    Logiciel d'édition de code au niveau de Dieu (SublimeText3)

    MantisBT

    MantisBT

    Mantis est un outil Web de suivi des défauts facile à déployer, conçu pour faciliter le suivi des défauts des produits. Cela nécessite PHP, MySQL et un serveur Web. Découvrez nos services de démonstration et d'hébergement.

    Dreamweaver CS6

    Dreamweaver CS6

    Outils de développement Web visuel