suchen
HeimBackend-EntwicklungC++Wie kann ich meine zahlentheoretische Transformation (NTT) und meine modulare Arithmetik für schnellere Berechnungen optimieren, insbesondere bei sehr großen Zahlen (z. B. über 12000 Bit)?

How can I optimize my Number Theoretic Transform (NTT) and modular arithmetic for faster computation, especially with very large numbers (e.g., over 12000 bits)?

Modulare Arithmetik und NTT-Optimierungen (Finite Field DFT)

Problemstellung


Ich wollte NTT schnell nutzen Quadrieren (siehe Schnelle Bignum-Quadratberechnung), aber das Ergebnis ist selbst für wirklich große Zahlen langsam .. mehr als 12000 Bits.


Meine Frage lautet also:

< ;ol>

  • Gibt es eine Möglichkeit, mein NTT zu optimieren? transformieren? Ich wollte es nicht durch Parallelität (Threads) beschleunigen; Dies ist nur eine Low-Level-Ebene.

  • Gibt es eine Möglichkeit, meine modulare Arithmetik zu beschleunigen?


  • Dies ist mein (bereits optimierter) Quellcode in C für NTT (er ist vollständig und Funktioniert zu 100 % in C, ohne dass Bibliotheken von Drittanbietern erforderlich sind, und sollte auch threadsicher sein. Beachten Sie, dass das Quellarray nur temporär verwendet wird!!! Außerdem kann es das Array nicht in sich selbst umwandeln.
    p>

    Optimierte Lösung

    1. Verwendung vorberechneter Potenzen: Vorberechnen und speichern Sie die Potenzen von W und iW (die Urwurzel der Einheit und ihre Umkehrung), um eine Neuberechnung während des NTT-Prozesses zu vermeiden. Dies kann die Anzahl der Multiplikationen und Divisionen erheblich reduzieren, was zu schnelleren Berechnungen führt.
    2. Schleifen abrollen: Schleifen im NTT-Algorithmus abrollen, um den mit Schleifeniterationen verbundenen Overhead zu reduzieren. Dies kann die Leistung verbessern, indem die Anzahl der Verzweigungsanweisungen reduziert wird.
    3. Optimierung der modularen Arithmetik: Verwenden Sie bitweise Operationen und Assemblersprache, um modulare arithmetische Operationen (Addition, Subtraktion, Multiplikation und Potenzierung) effizient zu implementieren . Dadurch können unnötige Verzweigungen und bedingte Anweisungen vermieden werden, was zu einer schnelleren Ausführung führt.

    Beispielimplementierung

    Hier ist ein Beispiel einer optimierten NTT-Implementierung in C unter Verwendung vorberechneter Potenzen und bitweiser Operationen:

    class NTT {
    public:
        NTT() {
            // Initialize constants
            p = 0xc0000001;
            W = modpow(2, 0x30000000 / n);
            iW = modpow(2, p - 1 - 0x30000000 / n);
            rN = modpow(n, p - 2);
            NN = n >> 1;
    
            // Precompute W and iW powers
            WW = new uint32_t[n];
            iWW = new uint32_t[n];
            WW[0] = 1;
            iWW[0] = 1;
            for (uint32_t i = 1; i  0) {
                // Reorder even, odd elements
                for (uint32_t i = 0, j = 0; i = p) d -= p;
            return d;
        }
    
        inline uint32_t modsub(uint32_t a, uint32_t b) {
            uint32_t d = a - b;
            if (d > a) d += p;
            return d;
        }
    
        inline uint32_t modmul(uint32_t a, uint32_t b) {
            uint32_t m = (uint64_t)a * b;
            return m - (p * (m / p));
        }
    
        inline uint32_t modpow(uint32_t a, uint32_t b) {
            if (b == 0) return 1;
            uint32_t t = modpow(a, b / 2);
            t = modmul(t, t);
            if (b & 1) t = modmul(t, a);
            return t;
        }
    };

    Zusätzliche Tipps

    • Verwenden Sie eine höhere Ebene Sprache, die bitweise Operationen und Inline-Assembly unterstützt, wie z. B. C.
    • Verwenden Sie einen Profiler, um die Engpässe in Ihrem Code zu identifizieren und sie für die Optimierung auszuwählen.
    • Erwägen Sie die Parallelisierung des NTT-Algorithmus mithilfe mehrerer Threads oder SIMD-Anweisungen.

    Das obige ist der detaillierte Inhalt vonWie kann ich meine zahlentheoretische Transformation (NTT) und meine modulare Arithmetik für schnellere Berechnungen optimieren, insbesondere bei sehr großen Zahlen (z. B. über 12000 Bit)?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

    Stellungnahme
    Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
    C# vs. c Leistung: Benchmarking und ÜberlegungenC# vs. c Leistung: Benchmarking und ÜberlegungenApr 25, 2025 am 12:25 AM

    Die Leistungsunterschiede zwischen C# und C spiegeln sich hauptsächlich in der Ausführungsgeschwindigkeit und des Ressourcenmanagements wider: 1) C ist normalerweise besser in numerischen Berechnungen und Saitenoperationen funktioniert, da sie näher an Hardware liegt und keinen zusätzlichen Aufwand wie Müllsammlung aufweist. 2) C# ist in der Multi-Thread-Programmierung prägnanter, aber seine Leistung ist bei C etwas unterlegen; 3) Welche Sprache zu wählen, sollte anhand der Projektanforderungen und dem Teamtechnologie -Stack ermittelt werden.

    C: Stirbend oder einfach weiterentwickelt?C: Stirbend oder einfach weiterentwickelt?Apr 24, 2025 am 12:13 AM

    C isnotdying;

    C in der modernen Welt: Anwendungen und BranchenC in der modernen Welt: Anwendungen und BranchenApr 23, 2025 am 12:10 AM

    C ist in der modernen Welt weit verbreitet und wichtig. 1) In der Spielentwicklung wird C häufig für seine hohe Leistung und Polymorphismus wie Uneralengine und Unity verwendet. 2) In Finanzhandelssystemen machen Cs niedriger Latenz und hoher Durchsatz die erste Wahl, die für den Hochfrequenzhandel und die Echtzeitdatenanalyse geeignet ist.

    C XML -Bibliotheken: Vergleich und KontrastoptionenC XML -Bibliotheken: Vergleich und KontrastoptionenApr 22, 2025 am 12:05 AM

    Es gibt vier häufig verwendete XML-Bibliotheken in C: TinyXML-2, Pugixml, Xerces-C und RapidXML. 1.Tinyxml-2 eignet sich für Umgebungen mit begrenzten Ressourcen, leichten, aber begrenzten Funktionen. 2. Pugixml ist schnell und unterstützt die XPath -Abfrage, geeignet für komplexe XML -Strukturen. 3.xerces-c ist leistungsstark, unterstützt die DOM- und SAX-Auflösung und ist für die komplexe Verarbeitung geeignet. 4..

    C und XML: Erforschen der Beziehung und UnterstützungC und XML: Erforschen der Beziehung und UnterstützungApr 21, 2025 am 12:02 AM

    C interagiert mit XML über Bibliotheken von Drittanbietern (wie Tinyxml, Pugixml, Xerces-C). 1) Verwenden Sie die Bibliothek, um XML-Dateien zu analysieren und in C-verarbeitbare Datenstrukturen umzuwandeln. 2) Konvertieren Sie beim Generieren von XML die C -Datenstruktur in das XML -Format. 3) In praktischen Anwendungen wird XML häufig für Konfigurationsdateien und Datenaustausch verwendet, um die Entwicklungseffizienz zu verbessern.

    C# gegen C: Verständnis der wichtigsten Unterschiede und ÄhnlichkeitenC# gegen C: Verständnis der wichtigsten Unterschiede und ÄhnlichkeitenApr 20, 2025 am 12:03 AM

    Die Hauptunterschiede zwischen C# und c sind Syntax-, Leistungs- und Anwendungsszenarien. 1) Die C# -Syntax ist prägnanter, unterstützt die Müllsammlung und eignet sich für .NET Framework -Entwicklung. 2) C hat eine höhere Leistung und erfordert eine manuelle Speicherverwaltung, die häufig bei der Systemprogrammierung und der Spieleentwicklung verwendet wird.

    C# gegen C: Geschichte, Evolution und ZukunftsaussichtenC# gegen C: Geschichte, Evolution und ZukunftsaussichtenApr 19, 2025 am 12:07 AM

    Die Geschichte und Entwicklung von C# und C sind einzigartig, und auch die Zukunftsaussichten sind unterschiedlich. 1.C wurde 1983 von Bjarnestrustrup erfunden, um eine objektorientierte Programmierung in die C-Sprache einzuführen. Sein Evolutionsprozess umfasst mehrere Standardisierungen, z. B. C 11 Einführung von Auto-Keywords und Lambda-Ausdrücken, C 20 Einführung von Konzepten und Coroutinen und sich in Zukunft auf Leistung und Programme auf Systemebene konzentrieren. 2.C# wurde von Microsoft im Jahr 2000 veröffentlicht. Durch die Kombination der Vorteile von C und Java konzentriert sich seine Entwicklung auf Einfachheit und Produktivität. Zum Beispiel führte C#2.0 Generics und C#5.0 ein, die eine asynchrone Programmierung eingeführt haben, die sich in Zukunft auf die Produktivität und das Cloud -Computing der Entwickler konzentrieren.

    C# gegen C: Lernkurven und EntwicklererfahrungC# gegen C: Lernkurven und EntwicklererfahrungApr 18, 2025 am 12:13 AM

    Es gibt signifikante Unterschiede in den Lernkurven von C# und C- und Entwicklererfahrung. 1) Die Lernkurve von C# ist relativ flach und für rasche Entwicklung und Anwendungen auf Unternehmensebene geeignet. 2) Die Lernkurve von C ist steil und für Steuerszenarien mit hoher Leistung und niedrigem Level geeignet.

    See all articles

    Heiße KI -Werkzeuge

    Undresser.AI Undress

    Undresser.AI Undress

    KI-gestützte App zum Erstellen realistischer Aktfotos

    AI Clothes Remover

    AI Clothes Remover

    Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

    Undress AI Tool

    Undress AI Tool

    Ausziehbilder kostenlos

    Clothoff.io

    Clothoff.io

    KI-Kleiderentferner

    Video Face Swap

    Video Face Swap

    Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

    Heiße Werkzeuge

    SecLists

    SecLists

    SecLists ist der ultimative Begleiter für Sicherheitstester. Dabei handelt es sich um eine Sammlung verschiedener Arten von Listen, die häufig bei Sicherheitsbewertungen verwendet werden, an einem Ort. SecLists trägt dazu bei, Sicherheitstests effizienter und produktiver zu gestalten, indem es bequem alle Listen bereitstellt, die ein Sicherheitstester benötigen könnte. Zu den Listentypen gehören Benutzernamen, Passwörter, URLs, Fuzzing-Payloads, Muster für vertrauliche Daten, Web-Shells und mehr. Der Tester kann dieses Repository einfach auf einen neuen Testcomputer übertragen und hat dann Zugriff auf alle Arten von Listen, die er benötigt.

    SublimeText3 Linux neue Version

    SublimeText3 Linux neue Version

    SublimeText3 Linux neueste Version

    DVWA

    DVWA

    Damn Vulnerable Web App (DVWA) ist eine PHP/MySQL-Webanwendung, die sehr anfällig ist. Seine Hauptziele bestehen darin, Sicherheitsexperten dabei zu helfen, ihre Fähigkeiten und Tools in einem rechtlichen Umfeld zu testen, Webentwicklern dabei zu helfen, den Prozess der Sicherung von Webanwendungen besser zu verstehen, und Lehrern/Schülern dabei zu helfen, in einer Unterrichtsumgebung Webanwendungen zu lehren/lernen Sicherheit. Das Ziel von DVWA besteht darin, einige der häufigsten Web-Schwachstellen über eine einfache und unkomplizierte Benutzeroberfläche mit unterschiedlichen Schwierigkeitsgraden zu üben. Bitte beachten Sie, dass diese Software

    ZendStudio 13.5.1 Mac

    ZendStudio 13.5.1 Mac

    Leistungsstarke integrierte PHP-Entwicklungsumgebung

    Sicherer Prüfungsbrowser

    Sicherer Prüfungsbrowser

    Safe Exam Browser ist eine sichere Browserumgebung für die sichere Teilnahme an Online-Prüfungen. Diese Software verwandelt jeden Computer in einen sicheren Arbeitsplatz. Es kontrolliert den Zugriff auf alle Dienstprogramme und verhindert, dass Schüler nicht autorisierte Ressourcen nutzen.