Maison >développement back-end >Tutoriel Python >Erreur lors de la mise à jour de la liste lors d'une boucle en Python

Erreur lors de la mise à jour de la liste lors d'une boucle en Python

WBOY
WBOYavant
2024-02-22 13:07:03838parcourir

在 Python 中循环时更新列表时出错

Contenu de la question

Pourquoi la liste "spans" n'est-elle jamais mise à jour ? Je ne comprends pas pourquoi le code reste bloqué dans une boucle infinie.

pdf : https://www.sil.org/system/files/reapdata/62/99/18/62991811720566250411942290005522370655/40337_02.pdf

Exemple « Bloquer » : https://jumpshare.com/s/y393jobqjfiye51gkexn

import fitz

doc = fitz.open("cubeo/40337_02.pdf")
page = doc[3]

blocks = page.get_text("dict", flags = fitz.TEXTFLAGS_TEXT)["blocks"]
for block in blocks: 
    entries = []
    if len(block["lines"]) > 3: # ignora legendas e número de página
        for line in block["lines"]: 
            spans = []
            for span in line["spans"]:
                spans.append({"text": span["text"].replace("�", " "), "size": int(span["size"]), "font": span["font"]})

            # While there are spans left
            while True:
                # Delimits where an entry starts
                entry_first_position = None
                for i, span in enumerate(spans):
                    if span["font"] == "Sb&cuSILCharis-Bold":
                        entry_first_position = i
                        break
                if entry_first_position is not None:
                    # Delimits where an entry ends
                    entry_last_position = None
                    for i, span in enumerate(spans[entry_first_position:], start=entry_first_position):
                        if span["font"] == "Sb&cuSILCharis-Bold":
                            entry_last_position = i
                            break
                    if entry_last_position is not None:
                        # Whole entry is added as a list
                        append_list = spans[entry_first_position:entry_last_position]
                        entries.append(append_list)
                        spans = spans[:entry_first_position] + spans[entry_last_position:]
                    else:
                        break
                else:
                    break
             print(spans)

Ce que j'attends, c'est que print(spans) génère "[]". Cependant, le code n’atteint jamais ce point.


Bonne réponse


for i, span in enumerate(spans[entry_first_position:], start=entry_first_position):

n'est pas sauté span["font"] == "sb&cusilcharis-bold" 的第一个匹配项。所以 entry_last_position == entry_first_position , rien n'est supprimé et vous êtes coincé dans une boucle infinie. Changez-le en

for i, span in enumerate(spans[entry_first_position+1:], start=entry_first_position+1):

Il commence donc à regarder la position suivante dans la liste

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer
Article précédent:Programmes et sous-processus CArticle suivant:Programmes et sous-processus C