cari
RumahPeranti teknologiAILaksanakan kejuruteraan ciri automatik menggunakan Featuretools

Laksanakan kejuruteraan ciri automatik menggunakan Featuretools

Featuretools ialah perpustakaan Python untuk kejuruteraan ciri automatik. Ia bertujuan untuk memudahkan proses kejuruteraan ciri dan meningkatkan prestasi model pembelajaran mesin. Perpustakaan secara automatik boleh mengekstrak ciri berguna daripada data mentah, membantu pengguna menjimatkan masa dan usaha sambil meningkatkan ketepatan model.

Berikut ialah langkah tentang cara menggunakan Featuretools untuk mengautomasikan kejuruteraan ciri:

Langkah 1: Sediakan data

Sebelum menggunakan Featuretools, anda perlu menyediakan set data. Set data mestilah dalam format Pandas DataFrame, di mana setiap baris mewakili pemerhatian dan setiap lajur mewakili ciri. Bagi masalah klasifikasi dan regresi, set data mestilah mengandungi pembolehubah sasaran, manakala bagi masalah pengelompokan, set data tidak memerlukan pembolehubah sasaran. Oleh itu, apabila menggunakan Featuretools, pastikan set data memenuhi keperluan ini supaya kejuruteraan ciri dan penjanaan ciri dapat dilakukan dengan cekap.

Langkah 2: Tentukan entiti dan perhubungan

Apabila menggunakan Featuretools untuk kejuruteraan ciri, anda perlu mentakrifkan entiti dan perhubungan terlebih dahulu. Entiti ialah subset set data yang mengandungi set ciri yang berkaitan. Contohnya, pada tapak web e-dagang, pesanan, pengguna, produk, pembayaran, dll. boleh dianggap sebagai entiti yang berbeza. Perhubungan ialah sambungan antara entiti Contohnya, pesanan mungkin dikaitkan dengan pengguna dan pengguna boleh membeli berbilang produk. Dengan mentakrifkan entiti dan perhubungan dengan jelas, struktur set data boleh difahami dengan lebih baik, yang memudahkan penjanaan ciri dan analisis data.

Langkah 3: Buat set entiti

Menggunakan Featuretools, anda boleh mencipta set entiti dengan mentakrifkan entiti dan perhubungan. Set entiti ialah koleksi berbilang entiti. Dalam langkah ini, anda perlu menentukan nama, set data, indeks, jenis pembolehubah dan cap masa bagi setiap entiti. Contohnya, set entiti yang mengandungi pesanan dan entiti pengguna boleh dibuat menggunakan kod berikut:

import featuretools as ft

# Create entity set
es=ft.EntitySet(id='ecommerce')

# Define entities
orders=ft.Entity(id='orders',dataframe=orders_df,index='order_id',time_index='order_time')
users=ft.Entity(id='users',dataframe=users_df,index='user_id')

# Add entities to entity set
es=es.entity_from_dataframe(entity_id='orders',dataframe=orders_df,index='order_id',time_index='order_time')
es=es.entity_from_dataframe(entity_id='users',dataframe=users_df,index='user_id')

Di sini, kami menggunakan EntitySet untuk mencipta set entiti bernama "e-dagang" dan mentakrifkan dua entiti menggunakan Entiti, Pesanan dan Pengguna . Untuk entiti pesanan, kami menetapkan ID pesanan sebagai indeks dan masa pesanan sebagai cap waktu. Untuk entiti pengguna, kami hanya menentukan ID pengguna sebagai indeks.

Langkah 4: Tentukan perhubungan

Dalam langkah ini, anda perlu mentakrifkan perhubungan antara entiti. Menggunakan Featuretools, perhubungan boleh ditakrifkan melalui pembolehubah yang dikongsi, cap masa, dsb. antara entiti. Sebagai contoh, pada tapak web e-dagang, setiap pesanan dikaitkan dengan pengguna. Hubungan antara pesanan dan pengguna boleh ditakrifkan menggunakan kod berikut:

# Define relationships
r_order_user = ft.Relationship(orders['user_id'], users['user_id'])
es = es.add_relationship(r_order_user)

Di sini, kami telah mentakrifkan hubungan antara pesanan dan pengguna menggunakan Perhubungan dan menambahkannya pada set entiti menggunakan add_relationship.

Langkah 5: Jalankan algoritma sintesis ciri dalam

Selepas melengkapkan langkah di atas, anda boleh menggunakan algoritma sintesis ciri dalam Featuretools untuk menjana ciri secara automatik. Algoritma ini secara automatik mencipta ciri baharu seperti pengagregatan, transformasi dan gabungan. Anda boleh menggunakan kod berikut untuk menjalankan algoritma sintesis ciri mendalam:

# Run deep feature synthesis algorithm
features, feature_names = ft.dfs(entityset=es, target_entity='orders', max_depth=2)

Di sini, kami menggunakan fungsi dfs untuk menjalankan algoritma sintesis ciri mendalam, menentukan entiti sasaran sebagai entiti pesanan dan menetapkan kedalaman maksimum kepada 2. Fungsi ini mengembalikan DataFrame yang mengandungi ciri baharu dan senarai nama ciri.

Langkah 6: Bina model

Selepas anda memperoleh ciri baharu, anda boleh menggunakannya untuk melatih model pembelajaran mesin. Ciri baharu boleh ditambah pada set data asal menggunakan kod berikut:

# Add new features to original dataset
df=pd.merge(orders_df,features,left_on='order_id',right_on='order_id')

Di sini, kami menggunakan fungsi gabungan untuk menambah ciri baharu pada set data asal untuk latihan dan ujian. Ciri baharu kemudiannya boleh digunakan untuk melatih model pembelajaran mesin, contohnya:

# Split dataset into train and test sets
X_train, X_test, y_train, y_test = train_test_split(df[feature_names], df['target'], test_size=0.2, random_state=42)

# Train machine learning model
model = RandomForestClassifier()
model.fit(X_train, y_train)

# Evaluate model performance
y_pred = model.predict(X_test)
accuracy_score(y_test, y_pred)

Di sini, kami menggunakan pengelas hutan rawak sebagai model pembelajaran mesin dan menggunakan set latihan untuk melatih model. Kami kemudian menggunakan set ujian untuk menilai prestasi model, menggunakan ketepatan sebagai metrik penilaian.

Ringkasan:

Langkah-langkah untuk menggunakan Featuretools untuk mengautomasikan kejuruteraan ciri termasuk menyediakan data, menentukan entiti dan perhubungan, mencipta set entiti, mentakrifkan perhubungan, menjalankan algoritma sintesis ciri yang mendalam dan membina model. Featuretools boleh mengekstrak ciri berguna secara automatik daripada data mentah, membantu pengguna menjimatkan banyak masa dan usaha serta meningkatkan prestasi model pembelajaran mesin.

Atas ialah kandungan terperinci Laksanakan kejuruteraan ciri automatik menggunakan Featuretools. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Artikel ini dikembalikan pada:网易伏羲. Jika ada pelanggaran, sila hubungi admin@php.cn Padam
Cara Membina Pembantu AI Peribadi Anda Dengan Huggingface SmollmCara Membina Pembantu AI Peribadi Anda Dengan Huggingface SmollmApr 18, 2025 am 11:52 AM

Memanfaatkan kuasa AI di peranti: Membina CLI Chatbot Peribadi Pada masa lalu, konsep pembantu AI peribadi kelihatan seperti fiksyen sains. Bayangkan Alex, seorang peminat teknologi, bermimpi seorang sahabat AI yang pintar, yang tidak bergantung

AI untuk Kesihatan Mental dianalisis dengan penuh perhatian melalui inisiatif baru yang menarik di Stanford UniversityAI untuk Kesihatan Mental dianalisis dengan penuh perhatian melalui inisiatif baru yang menarik di Stanford UniversityApr 18, 2025 am 11:49 AM

Pelancaran AI4MH mereka berlaku pada 15 April, 2025, dan Luminary Dr. Tom Insel, M.D., pakar psikiatri yang terkenal dan pakar neurosains, berkhidmat sebagai penceramah kick-off. Dr. Insel terkenal dengan kerja cemerlangnya dalam penyelidikan kesihatan mental dan techno

Kelas Draf WNBA 2025 memasuki liga yang semakin meningkat dan melawan gangguan dalam talianKelas Draf WNBA 2025 memasuki liga yang semakin meningkat dan melawan gangguan dalam talianApr 18, 2025 am 11:44 AM

"Kami mahu memastikan bahawa WNBA kekal sebagai ruang di mana semua orang, pemain, peminat dan rakan kongsi korporat, berasa selamat, dihargai dan diberi kuasa," kata Engelbert, menangani apa yang telah menjadi salah satu cabaran sukan wanita yang paling merosakkan. Anno

Panduan Komprehensif untuk Struktur Data Terbina Python - Analytics VidhyaPanduan Komprehensif untuk Struktur Data Terbina Python - Analytics VidhyaApr 18, 2025 am 11:43 AM

Pengenalan Python cemerlang sebagai bahasa pengaturcaraan, terutamanya dalam sains data dan AI generatif. Manipulasi data yang cekap (penyimpanan, pengurusan, dan akses) adalah penting apabila berurusan dengan dataset yang besar. Kami pernah meliputi nombor dan st

Tayangan pertama dari model baru Openai berbanding dengan alternatifTayangan pertama dari model baru Openai berbanding dengan alternatifApr 18, 2025 am 11:41 AM

Sebelum menyelam, kaveat penting: Prestasi AI adalah spesifik yang tidak ditentukan dan sangat digunakan. Dalam istilah yang lebih mudah, perbatuan anda mungkin berbeza -beza. Jangan ambil artikel ini (atau lain -lain) sebagai perkataan akhir -sebaliknya, uji model ini pada senario anda sendiri

AI Portfolio | Bagaimana untuk membina portfolio untuk kerjaya AI?AI Portfolio | Bagaimana untuk membina portfolio untuk kerjaya AI?Apr 18, 2025 am 11:40 AM

Membina portfolio AI/ML yang menonjol: Panduan untuk Pemula dan Profesional Mewujudkan portfolio yang menarik adalah penting untuk mendapatkan peranan dalam kecerdasan buatan (AI) dan pembelajaran mesin (ML). Panduan ini memberi nasihat untuk membina portfolio

AI AI apa yang boleh dimaksudkan untuk operasi keselamatanAI AI apa yang boleh dimaksudkan untuk operasi keselamatanApr 18, 2025 am 11:36 AM

Hasilnya? Pembakaran, ketidakcekapan, dan jurang yang melebar antara pengesanan dan tindakan. Tak satu pun dari ini harus datang sebagai kejutan kepada sesiapa yang bekerja dalam keselamatan siber. Janji Agentic AI telah muncul sebagai titik perubahan yang berpotensi. Kelas baru ini

Google Versus Openai: AI berjuang untuk pelajarGoogle Versus Openai: AI berjuang untuk pelajarApr 18, 2025 am 11:31 AM

Impak segera berbanding perkongsian jangka panjang? Dua minggu yang lalu Openai melangkah ke hadapan dengan tawaran jangka pendek yang kuat, memberikan akses kepada pelajar A.S. dan Kanada.

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Alat panas

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

MinGW - GNU Minimalis untuk Windows

MinGW - GNU Minimalis untuk Windows

Projek ini dalam proses untuk dipindahkan ke osdn.net/projects/mingw, anda boleh terus mengikuti kami di sana. MinGW: Port Windows asli bagi GNU Compiler Collection (GCC), perpustakaan import yang boleh diedarkan secara bebas dan fail pengepala untuk membina aplikasi Windows asli termasuk sambungan kepada masa jalan MSVC untuk menyokong fungsi C99. Semua perisian MinGW boleh dijalankan pada platform Windows 64-bit.

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

mPDF

mPDF

mPDF ialah perpustakaan PHP yang boleh menjana fail PDF daripada HTML yang dikodkan UTF-8. Pengarang asal, Ian Back, menulis mPDF untuk mengeluarkan fail PDF "dengan cepat" dari tapak webnya dan mengendalikan bahasa yang berbeza. Ia lebih perlahan dan menghasilkan fail yang lebih besar apabila menggunakan fon Unicode daripada skrip asal seperti HTML2FPDF, tetapi menyokong gaya CSS dsb. dan mempunyai banyak peningkatan. Menyokong hampir semua bahasa, termasuk RTL (Arab dan Ibrani) dan CJK (Cina, Jepun dan Korea). Menyokong elemen peringkat blok bersarang (seperti P, DIV),

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa