Heim >Technologie-Peripheriegeräte >KI >Duckdb -Tutorial: KI -Projekte erstellen

Duckdb -Tutorial: KI -Projekte erstellen

Jennifer Aniston
Jennifer AnistonOriginal
2025-03-05 11:12:14644Durchsuche

Duckdb: Eine Hochleistungsdatenbank für Data Science und AI

Duckdb, kürzlich als stabile Version veröffentlicht, gewinnt schnell an den Daten und KI -Gemeinschaften an die Antrieb. Die nahtlose Integration in verschiedene Frameworks macht es zu einem wertvollen Instrument für die moderne Datenanalyse. In diesem Tutorial werden die wichtigsten Funktionen von Duckdb untersucht und seine Anwendung in zwei Projekten demonstriert: Aufbau einer Abrufanwendung (Abruf-Augmented Generation) und die Verwendung als KI-angetanter Abfragemotor.

Duckdb ist ein modernes, in Memory Analytical Database Management System (DBMS), das eine hohe Leistung und Benutzerfreundlichkeit bietet. Es handelt sich um ein relationales DBMS, das SQL unterstützt und die Einfachheit von SQLite mit der analytischen Leistung kombiniert, die für komplexe Datenaufgaben erforderlich ist.

Schlüsselmerkmale:

  1. Einfachheit: serverlos, abhängig und eingebettbar, wodurch Installation und Bereitstellung unkompliziert werden. Für den Bau wird nur ein C 11 -Compiler benötigt.
  2. Reiche Funktionalität: umfassende SQL -Unterstützung und Deep Python/R -Integration, ideal für Datenwissenschaft und interaktive Analyse.
  3. hohe Leistung: Eine für die Analytik optimierte Spalten-Abfrage-Ausführungs-Engine, die parallele Verarbeitung und effiziente große Datensatzbehandlung ermöglicht.
  4. Open Source: lizenziert unter der zulässigen MIT -Lizenz.
  5. Portabilität: läuft auf verschiedenen Betriebssystemen (Linux, MacOS, Windows) und Architekturen (x86, ARM), einschließlich Webbrowsern über Duckdb-Wasm.
  6. Erweiterbarkeit: unterstützt Erweiterungen für benutzerdefinierte Datentypen, Funktionen, Dateiformate und SQL -Syntax.
  7. robuste Tests: streng durch kontinuierliche Integration in eine umfassende Testsuite getestet.

Erste Schritte mit Duckdb

Dieser Abschnitt deckt mit Einrichten von Duckdb, Laden von CSV -Daten, Durchführung von Analysen und Verständnis von Beziehungen und Abfragefunktionen.

.

Installieren Sie zunächst das Python -Paket:
pip install duckdb --upgrade

Erstellen einer Duckdb -Datenbank

connect Erstellen Sie eine persistente Datenbank mit der Funktion

:
import duckdb
con = duckdb.connect("datacamp.duckdb")

Dies erstellt eine Datenbankdatei lokal.

DuckDB Tutorial: Building AI Projects

laden wir eine CSV-Datei (z. B. "Bank-marketing.csv" aus Datalab) in eine "Bank" -Tabelle:
con.execute("""
    CREATE TABLE IF NOT EXISTS bank AS 
    SELECT * FROM read_csv('bank-marketing.csv')
""")
con.execute("SHOW ALL TABLES").fetchdf()

DuckDB Tutorial: Building AI Projects

Ein einfaches Beispiel für Abfragen:
con.execute("SELECT * FROM bank WHERE duration < 100").fetchdf()

DuckDB Tutorial: Building AI Projects

duckdb -Beziehungen und Abfragefunktionen

Duckdb -Beziehungen (Tabellen) können mit der relationalen API, die Python -Funktionen für die Datenanalyse verkettet, abgefragt werden. Zum Beispiel:
pip install duckdb --upgrade

DuckDB Tutorial: Building AI Projects

Die Funktion query führt SQL -Abfragen direkt aus:

import duckdb
con = duckdb.connect("datacamp.duckdb")

DuckDB Tutorial: Building AI Projects

Denken Sie daran, die Verbindung zu schließen: con.close()

(Die verbleibenden Abschnitte, die die Integration von Lag -Anwendungen und KI -Abfrage -Engine beschrieben haben

Das obige ist der detaillierte Inhalt vonDuckdb -Tutorial: KI -Projekte erstellen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn