Laksanakan kejuruteraan ciri automatik menggunakan Featuretools
Featuretools ialah perpustakaan Python untuk kejuruteraan ciri automatik. Ia bertujuan untuk memudahkan proses kejuruteraan ciri dan meningkatkan prestasi model pembelajaran mesin. Perpustakaan secara automatik boleh mengekstrak ciri berguna daripada data mentah, membantu pengguna menjimatkan masa dan usaha sambil meningkatkan ketepatan model.
Berikut ialah langkah tentang cara menggunakan Featuretools untuk mengautomasikan kejuruteraan ciri:
Langkah 1: Sediakan data
Sebelum menggunakan Featuretools, anda perlu menyediakan set data. Set data mestilah dalam format Pandas DataFrame, di mana setiap baris mewakili pemerhatian dan setiap lajur mewakili ciri. Bagi masalah klasifikasi dan regresi, set data mestilah mengandungi pembolehubah sasaran, manakala bagi masalah pengelompokan, set data tidak memerlukan pembolehubah sasaran. Oleh itu, apabila menggunakan Featuretools, pastikan set data memenuhi keperluan ini supaya kejuruteraan ciri dan penjanaan ciri dapat dilakukan dengan cekap.
Langkah 2: Tentukan entiti dan perhubungan
Apabila menggunakan Featuretools untuk kejuruteraan ciri, anda perlu mentakrifkan entiti dan perhubungan terlebih dahulu. Entiti ialah subset set data yang mengandungi set ciri yang berkaitan. Contohnya, pada tapak web e-dagang, pesanan, pengguna, produk, pembayaran, dll. boleh dianggap sebagai entiti yang berbeza. Perhubungan ialah sambungan antara entiti Contohnya, pesanan mungkin dikaitkan dengan pengguna dan pengguna boleh membeli berbilang produk. Dengan mentakrifkan entiti dan perhubungan dengan jelas, struktur set data boleh difahami dengan lebih baik, yang memudahkan penjanaan ciri dan analisis data.
Langkah 3: Buat set entiti
Menggunakan Featuretools, anda boleh mencipta set entiti dengan mentakrifkan entiti dan perhubungan. Set entiti ialah koleksi berbilang entiti. Dalam langkah ini, anda perlu menentukan nama, set data, indeks, jenis pembolehubah dan cap masa bagi setiap entiti. Contohnya, set entiti yang mengandungi pesanan dan entiti pengguna boleh dibuat menggunakan kod berikut:
import featuretools as ft # Create entity set es=ft.EntitySet(id='ecommerce') # Define entities orders=ft.Entity(id='orders',dataframe=orders_df,index='order_id',time_index='order_time') users=ft.Entity(id='users',dataframe=users_df,index='user_id') # Add entities to entity set es=es.entity_from_dataframe(entity_id='orders',dataframe=orders_df,index='order_id',time_index='order_time') es=es.entity_from_dataframe(entity_id='users',dataframe=users_df,index='user_id')
Di sini, kami menggunakan EntitySet untuk mencipta set entiti bernama "e-dagang" dan mentakrifkan dua entiti menggunakan Entiti, Pesanan dan Pengguna . Untuk entiti pesanan, kami menetapkan ID pesanan sebagai indeks dan masa pesanan sebagai cap waktu. Untuk entiti pengguna, kami hanya menentukan ID pengguna sebagai indeks.
Langkah 4: Tentukan perhubungan
Dalam langkah ini, anda perlu mentakrifkan perhubungan antara entiti. Menggunakan Featuretools, perhubungan boleh ditakrifkan melalui pembolehubah yang dikongsi, cap masa, dsb. antara entiti. Sebagai contoh, pada tapak web e-dagang, setiap pesanan dikaitkan dengan pengguna. Hubungan antara pesanan dan pengguna boleh ditakrifkan menggunakan kod berikut:
# Define relationships r_order_user = ft.Relationship(orders['user_id'], users['user_id']) es = es.add_relationship(r_order_user)
Di sini, kami telah mentakrifkan hubungan antara pesanan dan pengguna menggunakan Perhubungan dan menambahkannya pada set entiti menggunakan add_relationship.
Langkah 5: Jalankan algoritma sintesis ciri dalam
Selepas melengkapkan langkah di atas, anda boleh menggunakan algoritma sintesis ciri dalam Featuretools untuk menjana ciri secara automatik. Algoritma ini secara automatik mencipta ciri baharu seperti pengagregatan, transformasi dan gabungan. Anda boleh menggunakan kod berikut untuk menjalankan algoritma sintesis ciri mendalam:
# Run deep feature synthesis algorithm features, feature_names = ft.dfs(entityset=es, target_entity='orders', max_depth=2)
Di sini, kami menggunakan fungsi dfs untuk menjalankan algoritma sintesis ciri mendalam, menentukan entiti sasaran sebagai entiti pesanan dan menetapkan kedalaman maksimum kepada 2. Fungsi ini mengembalikan DataFrame yang mengandungi ciri baharu dan senarai nama ciri.
Langkah 6: Bina model
Selepas anda memperoleh ciri baharu, anda boleh menggunakannya untuk melatih model pembelajaran mesin. Ciri baharu boleh ditambah pada set data asal menggunakan kod berikut:
# Add new features to original dataset df=pd.merge(orders_df,features,left_on='order_id',right_on='order_id')
Di sini, kami menggunakan fungsi gabungan untuk menambah ciri baharu pada set data asal untuk latihan dan ujian. Ciri baharu kemudiannya boleh digunakan untuk melatih model pembelajaran mesin, contohnya:
# Split dataset into train and test sets X_train, X_test, y_train, y_test = train_test_split(df[feature_names], df['target'], test_size=0.2, random_state=42) # Train machine learning model model = RandomForestClassifier() model.fit(X_train, y_train) # Evaluate model performance y_pred = model.predict(X_test) accuracy_score(y_test, y_pred)
Di sini, kami menggunakan pengelas hutan rawak sebagai model pembelajaran mesin dan menggunakan set latihan untuk melatih model. Kami kemudian menggunakan set ujian untuk menilai prestasi model, menggunakan ketepatan sebagai metrik penilaian.
Ringkasan:
Langkah-langkah untuk menggunakan Featuretools untuk mengautomasikan kejuruteraan ciri termasuk menyediakan data, menentukan entiti dan perhubungan, mencipta set entiti, mentakrifkan perhubungan, menjalankan algoritma sintesis ciri yang mendalam dan membina model. Featuretools boleh mengekstrak ciri berguna secara automatik daripada data mentah, membantu pengguna menjimatkan banyak masa dan usaha serta meningkatkan prestasi model pembelajaran mesin.
Atas ialah kandungan terperinci Laksanakan kejuruteraan ciri automatik menggunakan Featuretools. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Memanfaatkan kuasa AI di peranti: Membina CLI Chatbot Peribadi Pada masa lalu, konsep pembantu AI peribadi kelihatan seperti fiksyen sains. Bayangkan Alex, seorang peminat teknologi, bermimpi seorang sahabat AI yang pintar, yang tidak bergantung

Pelancaran AI4MH mereka berlaku pada 15 April, 2025, dan Luminary Dr. Tom Insel, M.D., pakar psikiatri yang terkenal dan pakar neurosains, berkhidmat sebagai penceramah kick-off. Dr. Insel terkenal dengan kerja cemerlangnya dalam penyelidikan kesihatan mental dan techno

"Kami mahu memastikan bahawa WNBA kekal sebagai ruang di mana semua orang, pemain, peminat dan rakan kongsi korporat, berasa selamat, dihargai dan diberi kuasa," kata Engelbert, menangani apa yang telah menjadi salah satu cabaran sukan wanita yang paling merosakkan. Anno

Pengenalan Python cemerlang sebagai bahasa pengaturcaraan, terutamanya dalam sains data dan AI generatif. Manipulasi data yang cekap (penyimpanan, pengurusan, dan akses) adalah penting apabila berurusan dengan dataset yang besar. Kami pernah meliputi nombor dan st

Sebelum menyelam, kaveat penting: Prestasi AI adalah spesifik yang tidak ditentukan dan sangat digunakan. Dalam istilah yang lebih mudah, perbatuan anda mungkin berbeza -beza. Jangan ambil artikel ini (atau lain -lain) sebagai perkataan akhir -sebaliknya, uji model ini pada senario anda sendiri

Membina portfolio AI/ML yang menonjol: Panduan untuk Pemula dan Profesional Mewujudkan portfolio yang menarik adalah penting untuk mendapatkan peranan dalam kecerdasan buatan (AI) dan pembelajaran mesin (ML). Panduan ini memberi nasihat untuk membina portfolio

Hasilnya? Pembakaran, ketidakcekapan, dan jurang yang melebar antara pengesanan dan tindakan. Tak satu pun dari ini harus datang sebagai kejutan kepada sesiapa yang bekerja dalam keselamatan siber. Janji Agentic AI telah muncul sebagai titik perubahan yang berpotensi. Kelas baru ini

Impak segera berbanding perkongsian jangka panjang? Dua minggu yang lalu Openai melangkah ke hadapan dengan tawaran jangka pendek yang kuat, memberikan akses kepada pelajar A.S. dan Kanada.


Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

MinGW - GNU Minimalis untuk Windows
Projek ini dalam proses untuk dipindahkan ke osdn.net/projects/mingw, anda boleh terus mengikuti kami di sana. MinGW: Port Windows asli bagi GNU Compiler Collection (GCC), perpustakaan import yang boleh diedarkan secara bebas dan fail pengepala untuk membina aplikasi Windows asli termasuk sambungan kepada masa jalan MSVC untuk menyokong fungsi C99. Semua perisian MinGW boleh dijalankan pada platform Windows 64-bit.

Dreamweaver CS6
Alat pembangunan web visual

mPDF
mPDF ialah perpustakaan PHP yang boleh menjana fail PDF daripada HTML yang dikodkan UTF-8. Pengarang asal, Ian Back, menulis mPDF untuk mengeluarkan fail PDF "dengan cepat" dari tapak webnya dan mengendalikan bahasa yang berbeza. Ia lebih perlahan dan menghasilkan fail yang lebih besar apabila menggunakan fon Unicode daripada skrip asal seperti HTML2FPDF, tetapi menyokong gaya CSS dsb. dan mempunyai banyak peningkatan. Menyokong hampir semua bahasa, termasuk RTL (Arab dan Ibrani) dan CJK (Cina, Jepun dan Korea). Menyokong elemen peringkat blok bersarang (seperti P, DIV),

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa