Heim >Backend-Entwicklung >Python-Tutorial >Python BOT extrahiert lange Spalten aus einer Excel-Tabelle und erstellt einen Datenrahmen, um einige Zahlen aus einer anderen Datei zu katalogisieren
Ich muss einen Python-Roboter erstellen, um Spalte C aus Excel-Datei 1, Blatt 1 zu extrahieren, sie in Datei 2 zu katalogisieren und von 0,00 bis 0,99, von 1,00 bis 1,99 usw. zu berechnen. Die Summe der Zahlen . 12. Alle Zahlen über 12 werden in der letzten Zeile codiert. Dann muss ich die Summe aller Zahlen berechnen.
Ich habe versucht, Code zu schreiben, aber er hat nichts in die Excel-Datei geschrieben.
Sie können die folgenden Methoden ausprobieren:
import pandas as pd datafile = "Excel File 1.xlsx" catalogfile = 'Excel File 2.xlsx' column = 'column C' ### Read specific column (column) from Excel Sheet df_read = pd.read_excel(datafile, index_col=None, na_values=['NA'], usecols=[column]) # print(df_read) ### Create the dataframe of values within specified ranges to write to Excel ### Group ranges 0.00 - 0.99 in increments of 1 and make a count of each up to a max (12) df_write = df_read.groupby(pd.cut(df_read[column], [float(i) - 0.01 for i in range(0, 13)])).count() ### Count values greater than 12 and add as row to the dataframe df_write.loc['12+'] = df_read[df_read > 12].count() ### Sum all values in the column and add as row to the dataframe df_write.loc[len(df_write.index) + 1] = df_read.sum() ### Rename Index Header df_write.index.name = 'Range Totals' ### Rename Column Header df_write.columns = ['Values Count'] ### Write dataframe to Excel ### Using default engine Xlsxwriter so new workbook is created (any existing workbook is overwritten) with pd.ExcelWriter(catalogfile) as writer: df_write.to_excel(writer, sheet_name='Sheet1', index=True) ### Xlsxwriter formatting workbook = writer.book cell_format = workbook.add_format() cell_format.set_bold(True) ws = writer.sheets['Sheet1'] ### Rename Row Header and add formula to count the totals for each range ### (should equal the total number of data rows read from Excel) ws.write(df_write.size, 0, 'Column Total', cell_format) ws.write_row(df_write.size + 1, 0, ['Total Rows', '=SUM(B2:B14)'], cell_format) ws.autofit()
Beispiel dafür, wie ein Excel-Arbeitsblatt für eine Spalte aussieht, die 100 Datenzeilen (d. h. ohne Hader) enthält, die aus einer Datendatei gelesen wurden.
Die Spalte „Range Total“ ist eine Indexspalte im Datenrahmen. Der Bereichstext wird durch den Datenrahmen bestimmt, deckt jedoch tatsächlich die Bereiche 0,00 – 0,99, 1,00 – 1,99, 2,00 – 2,99, 3,00 – 3,99 usw. ab.
Bei Bedarf können Sie beim Schreiben in Excel die Indexspalte aus dem Datenrahmen entfernen und mit xlsxwriter benutzerdefinierten Text in die Spalte schreiben oder eine Vorlage mit vorhandenen Überschriften verwenden (in diesem Fall benötigt Excelwriter zusätzliches Schema und OpenPyXL, da die Engine in eine vorhandene Arbeitsmappe schreibt). .
Das obige ist der detaillierte Inhalt vonPython BOT extrahiert lange Spalten aus einer Excel-Tabelle und erstellt einen Datenrahmen, um einige Zahlen aus einer anderen Datei zu katalogisieren. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!