Heim >Backend-Entwicklung >Python-Tutorial >Zusammenfassen von Text mithilfe des BART-Modells von Hugging Face

Zusammenfassen von Text mithilfe des BART-Modells von Hugging Face

DDD
DDDOriginal
2025-01-07 07:28:40838Durchsuche

Summarizing Text Using Hugging Face

In der heutigen schnelllebigen Welt ist es unerlässlich, lange Inhalte in prägnanten Zusammenfassungen zusammenzufassen, sei es zum schnellen Durchblättern von Artikeln oder zum Hervorheben wichtiger Punkte in Forschungsarbeiten. Hugging Face bietet ein leistungsstarkes Tool zur Textzusammenfassung: das BART-Modell. In diesem Artikel untersuchen wir, wie Sie die vortrainierten Modelle von Hugging Face, insbesondere das Modell facebook/bart-large-cnn, nutzen können, um lange Artikel und Texte zusammenzufassen.

Erste Schritte mit dem BART-Modell von Hugging Face

Hugging Face bietet eine Vielzahl von Modellen für NLP-Aufgaben wie Textklassifizierung, Übersetzung und Zusammenfassung. Eines der beliebtesten Modelle zur Zusammenfassung ist BART (Bidirektionale und Auto-Regressive Transformers), das darauf trainiert ist, kohärente Zusammenfassungen aus großen Dokumenten zu generieren.

Schritt 1: Installieren Sie die Hugging Face Transformers-Bibliothek

Um mit Hugging Face-Modellen zu beginnen, müssen Sie die Transformers-Bibliothek installieren. Sie können dies mit pip:
tun

pip install transformers

Schritt 2: Importieren der Zusammenfassungspipeline

Sobald die Bibliothek installiert ist, können Sie ganz einfach ein vorab trainiertes Modell zur Zusammenfassung laden. Die Pipeline-API von Hugging Face bietet eine High-Level-Schnittstelle für die Verwendung von Modellen wie facebook/bart-large-cnn, die für Zusammenfassungsaufgaben optimiert wurde.

from transformers import pipeline

# Load the summarization model
summarizer = pipeline("summarization", model="facebook/bart-large-cnn")

Schritt 3: Ausführen des Summarizers

Da Sie nun die Zusammenfassung bereit haben, können Sie einen beliebigen Langtext eingeben, um eine Zusammenfassung zu erstellen. Unten finden Sie ein Beispiel anhand eines Beispielartikels über Dame Maggie Smith, eine bekannte britische Schauspielerin.

ARTICLE = """ Dame Margaret Natalie Smith (28 December 1934 – 27 September 2024) was a British actress. Known for her wit in both comedic and dramatic roles, she had an extensive career on stage and screen for over seven decades and was one of Britain's most recognisable and prolific actresses. She received numerous accolades, including two Academy Awards, five BAFTA Awards, four Emmy Awards, three Golden Globe Awards and a Tony Award, as well as nominations for six Olivier Awards. Smith is one of the few performers to earn the Triple Crown of Acting.
Smith began her stage career as a student, performing at the Oxford Playhouse in 1952, and made her professional debut on Broadway in New Faces of '56. Over the following decades Smith established herself alongside Judi Dench as one of the most significant British theatre performers, working for the National Theatre and the Royal Shakespeare Company. On Broadway, she received the Tony Award for Best Actress in a Play for Lettice and Lovage (1990). She was Tony-nominated for Noël Coward's Private Lives (1975) and Tom Stoppard's Night and Day (1979).
Smith won Academy Awards for Best Actress for The Prime of Miss Jean Brodie (1969) and Best Supporting Actress for California Suite (1978). She was Oscar-nominated for Othello (1965), Travels with My Aunt (1972), A Room with a View (1985) and Gosford Park (2001). She portrayed Professor Minerva McGonagall in the Harry Potter film series (2001–2011). She also acted in Death on the Nile (1978), Hook (1991), Sister Act (1992), The Secret Garden (1993), The Best Exotic Marigold Hotel (2012), Quartet (2012) and The Lady in the Van (2015).
Smith received newfound attention and international fame for her role as Violet Crawley in the British period drama Downton Abbey (2010–2015). The role earned her three Primetime Emmy Awards; she had previously won one for the HBO film My House in Umbria (2003). Over the course of her career she was the recipient of numerous honorary awards, including the British Film Institute Fellowship in 1993, the BAFTA Fellowship in 1996 and the Society of London Theatre Special Award in 2010. Smith was made a dame by Queen Elizabeth II in 1990.
"""

# Generate the summary
summary = summarizer(ARTICLE, max_length=130, min_length=30, do_sample=False)

# Print the summary
print(summary)

Ausgabe:

[{'summary_text': 'Dame Margaret Natalie Smith (28 December 1934 – 27 September 2024) was a British actress. Known for her wit in both comedic and dramatic roles, she had an extensive career on stage and screen for over seven decades. She received numerous accolades, including two Academy Awards, five BAFTA Awards, four Emmy Awards, three Golden Globe Awards and a Tony Award.'}]

Wie Sie der Ausgabe entnehmen können, fasst die Zusammenfassung die Hauptpunkte des Artikels in einem kurzen, lesbaren Format zusammen und hebt wichtige Fakten wie ihre berufliche Laufbahn und ihre Auszeichnungen hervor.

Ein anderer Ansatz: Text aus einer Datei zusammenfassen

In einigen Anwendungsfällen möchten Sie möglicherweise den Text aus einer Datei statt aus einer fest codierten Zeichenfolge lesen. Unten finden Sie ein aktualisiertes Python-Skript, das einen Artikel aus einer Textdatei liest und eine Zusammenfassung generiert.

from transformers import pipeline

# Load the summarizer pipeline
summarizer = pipeline("summarization", model="facebook/bart-large-cnn")

# Function to read the article from a text file
def read_article_from_file(file_path):
    with open(file_path, 'r') as file:
        return file.read()

# Path to the text file containing the article
file_path = 'article.txt'  # Change this to your file path

# Read the article from the file
ARTICLE = read_article_from_file(file_path)

# Get the summary
summary = summarizer(ARTICLE, max_length=130, min_length=30, do_sample=False)

# Print the summary
print(summary)

Dateieingabe:

In diesem Fall müssten Sie den Artikel in einer Textdatei speichern (im Beispiel „article.txt“), und das Skript liest den Inhalt und fasst ihn zusammen.

Abschluss

Das

BART-Modell von Hugging Face ist ein großartiges Werkzeug für die automatische Textzusammenfassung. Unabhängig davon, ob Sie lange Artikel, Forschungsarbeiten oder große Textmengen verarbeiten, kann Ihnen das Modell dabei helfen, die Informationen in einer prägnanten Zusammenfassung zusammenzufassen.

In diesem Artikel wurde gezeigt, wie Sie das vorab trainierte Zusammenfassungsmodell von Hugging Face in Ihre Projekte integrieren können, sowohl mit hartcodiertem Text als auch mit Dateieingabe. Mit nur wenigen Codezeilen können Sie in Ihren Python-Projekten eine effiziente Zusammenfassungspipeline einrichten und ausführen.

Das obige ist der detaillierte Inhalt vonZusammenfassen von Text mithilfe des BART-Modells von Hugging Face. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn