Rumah  >  Artikel  >  AI dan Sains Data: Dua Sisi Syiling Yang Sama

AI dan Sains Data: Dua Sisi Syiling Yang Sama

WBOY
WBOYasal
2024-08-28 21:00:31979semak imbas

AI dan Sains Data ialah topik trend dan transformatif yang terkenal dalam bidang Sains Komputer dan Kejuruteraan. Permintaan pakar AI dan Sains Data terus berkembang dalam penjagaan kesihatan, kewangan, pemasaran, pendidikan dan bidang antara disiplin yang lain.

AI dan Sains Data: Dua Sisi Syiling Yang Sama

Kecerdasan Buatan (AI) dan Sains Data ialah dua bidang yang berkembang pesat yang mengubah pelbagai industri. Kedua-dua bidang melibatkan kerja dengan jumlah data yang besar, tetapi matlamat dan pendekatannya berbeza. Dalam artikel ini, kami akan meneroka asas AI dan Sains Data, menyerlahkan persamaan, perbezaan dan perkaitan mereka dari perspektif kepakaran dan profil pekerjaan.

Istilah "AI" telah dicipta pada tahun 1956, dan ia merangkumi pelbagai teknik yang bertujuan untuk mensimulasikan kecerdasan manusia dalam mesin. Membina sistem AI memerlukan mengenal pasti, memperoleh, menyimpan dan memproses sejumlah besar pengetahuan. Sebaliknya, istilah "Sains Data" muncul pada akhir abad ke-20 dan melibatkan membina model dan teknik untuk mengekstrak maklumat berharga daripada set data yang besar. Saintis Data memanfaatkan analisis statistik, ujian hipotesis dan pengenalpastian corak untuk memahami sains di sebalik sistem yang kompleks sebelum menggunakan alatan statistik dan pembelajaran mesin.

Ahli perangkawan telah lama menggunakan algoritma pembelajaran mesin seperti regresi, pengelasan dan pengelompokan untuk analisis ramalan dalam bidang seperti cuaca, pasaran, kesihatan dan perniagaan. Walau bagaimanapun, data terhad dan kuasa pengkomputeran yang tersedia pada masa itu mengehadkan skop analisis ini. Dalam beberapa tahun kebelakangan ini, lonjakan dalam data digital dan keupayaan pengkomputeran berprestasi tinggi (cth., CPU berbilang teras, GPU dan RAM yang besar) telah membolehkan saintis data membina sistem ramalan dan penentu yang lebih pantas, lebih dipercayai dan lebih tepat menggunakan mesin canggih. model pembelajaran.

Ketersediaan data digital, kuasa pengkomputeran yang tinggi dan prestasi model pembelajaran mesin yang mengagumkan pada data besar telah memberi inspirasi kepada pembangun AI untuk mencipta model pembelajaran yang mana mereka tidak perlu mengenal pasti corak, membentuk peraturan atau mengendalikan kesamaran dan kesamaran secara eksplisit. pengetahuan kontekstual. Sebaliknya, sistem belajar sendiri melalui model pembelajaran mesin yang dilatih pada set data yang besar. Analogi pembelajaran kendiri ini sering dibandingkan dengan cara kanak-kanak kecil belajar dengan memerhati dan mendengar corak yang berulang.

Sebaliknya, Saintis Data merumuskan hipotesis, mengumpul, menyusun dan menstruktur data untuk analisis, serta membangunkan algoritma dan model untuk menjawab pertanyaan daripada pengurusan atasan dan membantu organisasi membuat keputusan termaklum. Kedua-dua pembangun sistem AI dan Saintis Data menyumbang kepada membina sistem pintar atau mengekstrak maklumat yang dibenamkan dalam set data yang besar, merapatkan jurang antara kedua-dua medan.

Dari perspektif saya, alatan dan teknik yang digunakan dalam Sains Data menyokong pembangunan sistem AI, manakala sistem AI ini, seterusnya, membantu Sains Data dalam membuat keputusan. Walau bagaimanapun, penglibatan manusia kekal penting dalam kedua-dua bidang kerana kebolehan pemikiran kritis, inovasi dan semangat kami untuk mencapai matlamat yang diingini.

Permintaan untuk profesional AI dan Sains Data yang mahir jelas dalam pasaran kerja. Semua syarikat utama, seperti Microsoft, Google, Amazon, Apple, Nvidia, Uber, dan Cruise, serta syarikat baharu seperti Numerator, Databricks, Unified, Teradata, Algoritmia, dll., mempunyai pasukan Sains Data yang besar atau kecil bergantung pada saiz organisasi. Kebanyakan syarikat besar juga mempunyai pekerjaan AI, termasuk Pengurus Produk AI, Etika AI, Jurutera Robotik, Perunding AI, dan sebagainya. Dalam banyak syarikat, pasukan ini bekerjasama rapat untuk membina sistem yang lengkap.

Sebagai contoh, syarikat yang membangunkan kereta tanpa pemandu menggaji sekumpulan pakar AI yang mereka bentuk dan melaksanakan sistem kecerdasan buatan yang membolehkan kereta itu melihat, memahami dan menavigasi persekitaran mereka secara bebas. Selain itu, mereka mempunyai pasukan Saintis Data yang memperhalusi dan menganalisis data yang dikumpul daripada penderia menggunakan model pembelajaran mesin, memastikan keselamatan dan kebolehpercayaan keseluruhan sistem.

Sepanjang kerjaya saya, saya berpeluang mengusahakan beberapa projek AI, termasuk sistem terjemahan mesin. Pada tahun 1994 di IIT Kanpur, kami mengusahakan projek yang dipanggil sistem AnglaBharti, yang bertujuan untuk menterjemah daripada bahasa Inggeris ke Hindi. Sistem Berasaskan Peraturan ini melibatkan penciptaan kamus bahasa Inggeris-Hindi dari awal, membentuk peraturan untuk menghuraikan ayat bahasa Inggeris kepada frasa (cth., frasa nama, frasa kerja, frasa prap), menukar struktur yang dihuraikan mengikut bahasa Hindi, dan kemudian menjana versi bahasa Hindi bagi ayat tersebut.

これらすべてのモジュールを開発するために、ヒンディー語と英語の専門家、データ入力オペレーター、AI 専門家、AI 言語の知識を持つプログラマー、上級学者、AI 研究者で構成されるチームがありました。当初の目標は、英語からヒンディー語への一般的な翻訳システムを開発することでしたが、最終的には医療分野で実行可能なシステムしか作成できませんでした。

しかし、2010 年以降、研究者は言語の複雑さや翻訳プロセスを詳細に理解する必要がなく、LLM を使用して高品質の翻訳システムを開発できるようになりました。

AI は学習に重点を置き、データ サイエンスは既存のデータから知識を抽出することを目的としているため、AI とデータ サイエンスは 2 つの異なる部門であると結論付けることができますが、これらは同じコインの裏表であるように見えます。

Atas ialah kandungan terperinci AI dan Sains Data: Dua Sisi Syiling Yang Sama. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn