Pengarang |. Wan Chen, Li Yuan
Editor |
Pada 28 Jun waktu tempatan, Databricks, platform data Amerika yang terkenal, mengadakan persidangan tahunannya sendiri - Sidang Kemuncak Kepintaran Data dan Buatan. Pada mesyuarat itu, Databricks mengumumkan satu siri produk baharu yang penting seperti LakehouseIQ, Lakehouse AI, Databricks Marketplace dan Lakehouse Apps.Sama ada nama sidang kemuncak atau penamaan produk baharu, dapat dilihat bahawa platform data yang terkenal ini mengambil kesempatan daripada model bahasa besar untuk mempercepatkan transformasi kepada AI.
"Apa yang ingin dicapai oleh Databricks ialah "keterangkuman data" dan keterangkuman AI. Yang pertama membenarkan data menjangkau setiap pekerja, dan yang terakhir membenarkan AI memasuki setiap produk. Ali Ghodsi, Ketua Pegawai Eksekutif Databricks, mengumumkan misi pasukan itu dalam ucapannya.
Sejurus sebelum persidangan bermula, Databricks baru sahaja mengumumkan pengambilalihan MosaicML, kuasa baharu dalam bidang AI, dengan harga AS$1.3 bilion, menetapkan rekod pemerolehan semasa dalam bidang AI, yang menunjukkan kekuatan dan keazaman syarikat dalam transformasi AI.
Pengasas dan Ketua Pegawai Eksekutif PingCAP, Liu Qi, yang menghadiri mesyuarat yang akan datang, memberitahu Geek Park bahawa platform Databricks baru sahaja melancarkan aplikasi AI peringkat perusahaan, dan sudah lebih daripada 1,500 syarikat sedang melatih model mengenainya, dan "jumlahnya melebihi jangkaan. " Pada masa yang sama, beliau percaya bahawa pengumpulan Databricks sebelum ini dalam data + AI membolehkan syarikat menambah produk baharu dengan cepat berdasarkan platform sebelumnya apabila AI menjadi popular, dan dengan cepat menyediakan perkhidmatan yang berkaitan dengan model besar.
"Perkara yang paling kritikal ialah kelajuan." Liu Qi berkata bahawa dalam era model besar, cara mengintegrasikan model besar dengan produk sedia ada dengan lebih pantas dan menyelesaikan masalah pengguna mungkin merupakan cabaran terbesar bagi semua syarikat data pada masa ini, dan ia juga merupakan cabaran terbesar.
Perkataan
- Melalui peningkatan antara muka interaktif, orang biasa yang bukan penganalisis data boleh terus menggunakan bahasa semula jadi untuk bertanya dan menganalisis data.
- Ia akan menjadi lebih mudah dan lebih mudah bagi perusahaan untuk menggunakan model besar ke pangkalan data awan, dan ia juga akan menjadi lebih mudah untuk terus menggunakan alatan model besar siap untuk menganalisis data.
- Dengan kemajuan AI, nilai data akan menjadi lebih tinggi dan lebih tinggi, dan potensi data akan dikeluarkan lagi.
- 01
Databricks mengeluarkan alat LakehouseIQ baharu pada persidangan itu, yang dianggap sebagai "artifak". LakehouseIQ menjalankan salah satu usaha terbaru Databricks - penyejagatan analisis data Iaitu, orang biasa yang tidak menguasai Python dan SQL dengan mudah boleh mengakses data syarikat dan menjalankan analisis data menggunakan bahasa semula jadi.
Untuk mencapai matlamat ini, LakehouseIQ direka bentuk sebagai koleksi fungsi yang boleh digunakan oleh pengguna akhir biasa dan pembangun, dengan fungsi berbeza direka untuk pengguna yang berbeza.
Untuk pembangun, LakehouseIQ dalam Notebooks telah dikeluarkan Dalam ciri ini, LakehouseIQ boleh menggunakan model bahasa yang besar untuk membantu pembangun melengkapkan, menjana dan mentafsir kod, serta melakukan pembaikan kod, penyahpepijatan dan penjanaan laporan.
Untuk bukan pengaturcara biasa, Databricks menyediakan antara muka yang boleh berinteraksi secara langsung dengan bahasa semula jadi Ia didorong oleh model bahasa yang besar dan boleh terus menggunakan bahasa semula jadi untuk mencari dan bertanya data. Pada masa yang sama, ciri ini disepadukan dengan Katalog Perpaduan, membenarkan syarikat mengawal akses kepada carian dan pertanyaan data, dan hanya mengembalikan data yang dibenarkan untuk dilihat oleh penyoal.
Sejak pelancaran model besar, menggunakan bahasa semula jadi untuk bertanya dan menganalisis data sebenarnya telah menjadi topik hangat ke arah analisis data, dan banyak syarikat telah membuat rancangan ke arah ini. Termasuk Snowflake saingan lama Databricks, ciri AI Dokumen yang baru diumumkan turut memfokuskan pada arah ini.
Walau bagaimanapun, Databricks mendakwa bahawa LakehouseIQ berfungsi dengan lebih baik. Ia menunjukkan bahawa model bahasa besar tujuan umum mempunyai had dalam memahami data pelanggan tertentu, istilah dalaman dan corak penggunaan. Teknologi Databricks memanfaatkan skema, dokumen, pertanyaan, populariti, urutan, buku nota dan papan pemuka risikan perniagaan pelanggan sendiri untuk mendapatkan kecerdasan dan menjawab lebih banyak pertanyaan.
Terdapat satu lagi perbezaan antara fungsi Databricks dan Snowflake Fungsi AI Document platform Snowflake terhad kepada pertanyaan data tidak berstruktur dalam dokumen, manakala LakehouseIQ sesuai untuk data dan kod Lakehouse berstruktur.
02
Daripada pembelajaran mesin kepada AI
Persamaan antara Databricks dan Snowflake pada pelancaran tidak berakhir di situ.
Dalam persidangan ini, Databricks mengeluarkan Databricks Marketplace dan Lakehouse AI, yang benar-benar konsisten dengan fokus persidangan dua hari Snowflake, kedua-duanya memfokuskan pada penggunaan model bahasa yang besar ke dalam persekitaran pangkalan data.
Dalam visi Databricks, Databricks bukan sahaja boleh membantu pelanggan dalam menggunakan model besar pada masa hadapan, tetapi juga menyediakan alatan model besar siap.
Databricks pernah mempunyai jenama Pembelajaran Mesin Databricks Pada sidang akhbar ini, Databricks mengubah kedudukan sepenuhnya jenamanya dan menaik tarafnya kepada Lakehouse AI, memfokuskan pada membantu pelanggan menggunakan model besar.
Databricks Marketplace kini tersedia di Databricks. Dalam Pasaran Databricks, pengguna boleh mengakses koleksi besar model bahasa sumber terbuka yang disaring, termasuk MPT-7B, Falcon-7B dan Stable Diffusion, dan juga boleh menemui dan mendapatkan set data dan aset data. Lakehouse AI juga menyediakan beberapa fungsi operasi model bahasa besar (LLMOps).
Rajah Seni Bina AI Lakehouse|Databricks
Snowflake juga sedang aktif menggunakan ini, dengan keupayaan serupa yang disediakan oleh Nvidia NeMo, Nvidia AI Enterprise, Dataiku dan John Snow Labs (kerjasama dengan Nvidia ialah salah satu acara utama persidangan Snowflake, lihat laporan Geek Park).
Snowflake dan Databricks mempunyai perbezaan dalam membantu pelanggan menggunakan model besar. Snowflake telah memilih untuk terlibat secara aktif dengan rakan kongsi, manakala Databricks telah berusaha untuk menambah fungsi sebagai ciri asli platform terasnya.
Dari segi penyediaan alatan siap, Databricks mengumumkan bahawa Databricks Marketplace juga akan menyediakan Aplikasi Lakehouse pada masa hadapan. Lakehouse Apps akan dijalankan terus pada contoh Databricks pelanggan, di mana mereka boleh menyepadukan dengan data pelanggan, menggunakan dan melanjutkan perkhidmatan Databricks, dan membolehkan pengguna berinteraksi melalui pengalaman log masuk tunggal. Data tidak perlu meninggalkan contoh pelanggan, dan tiada pergerakan data dan isu keselamatan/akses.
Ini benar-benar konsisten dengan produk Snowflake dari segi penamaan dan fungsi. Snowflake Marketplace dan Aplikasi Asli Snowflake yang serupa sudah pun dalam talian dan merupakan salah satu sorotan pelancarannya. Bloomberg mengumumkan APP Data License Plus (DL+) yang disediakan oleh Bloomberg pada persidangan Snowflake, yang membolehkan pelanggan mengkonfigurasi persekitaran sedia untuk digunakan dalam awan dalam beberapa minit, dengan data langganan Bloomberg yang dimodelkan sepenuhnya dan kandungan ESG daripada berbilang vendor.
03
Platform data membawa perubahan baharu
Pada ucaptama pembukaan, Databricks mengumumkan beberapa: Dalam 30 hari yang lalu, lebih 1,500 pelanggan telah melatih model Transformer pada platform Databricks.
Apabila bercakap tentang nombor yang mengagumkan ini, PingCAP Liu Qi percaya bahawa ini menunjukkan bahawa perusahaan menggunakan AI lebih cepat daripada yang dijangkakan “Tidak perlu melatih model untuk menggunakan model, jadi jika terdapat 1,500 Home terlatih, aplikasi itu mesti. menjadi lebih besar daripada (nombor) ini.”
Sudut pandangan lain ialah ini menunjukkan bahawa susun atur strategik Databricks dalam bidang AI adalah agak menyeluruh. Ia kini lebih daripada sekadar gudang data atau tasik data. Kini ia turut menyediakan: latihan AI, servis AI, pengurusan model, dsb. "
Ali Ghodsi menggunakan revolusi pengkomputeran dan Internet untuk membandingkan transformasi model besar dalam pembelajaran mesin|Databricks
Dalam erti kata lain, model asas boleh dilatih pada platform Databricks, dan model tahap terendah boleh dilatih dengan hanya melaraskan parameter. Untuk perkhidmatan AI yang diperlukan di atas model ini, Databricks juga telah menyediakan infrastruktur yang sepadan - hari ini ia mengeluarkan carian vektor dan kedai ciri.
Databricks dinaik taraf sepenuhnya kepada model besar.
Pada masa lalu, Databricks telah mengumpulkan banyak pengalaman dalam AI, seperti menggunakan model kecil untuk meningkatkan kecekapan dan mengurangkan kependaman dalam membina indeks, menanya data dan meramalkan beban kerja. Walau bagaimanapun, keupayaan untuk membuat model besar pada kadar yang begitu pantas masih mengejutkan ramai orang.
Sebelum susun atur AI dipaparkan sepenuhnya pada sidang kemuncak hari ini, Databricks memperoleh Okera (tadbir urus data AI), melancarkan model besar sumber terbukanya sendiri Dolly 2.0, dan memperoleh MosaicML untuk AS$1.3 bilion Satu siri tindakan telah diselesaikan sekali gus.
Dalam hal ini, Howie, seorang guru dari Silicon Valley, percaya bahawa ia dapat dilihat dengan jelas daripada dua persidangan Databricks dan Snowflake: pengasas kedua-dua syarikat percaya bahawa tindakan yang telah mereka ambil berdasarkan pangkalan data dan tasik data akan dihadapi masalah asas pada masa hadapan. Cara mereka melakukannya setahun yang lalu tidak akan berkesan dalam beberapa tahun akan datang.
Sejajar dengan itu, keupayaan untuk menyiapkan model besar dengan cepat juga bermakna pasaran tambahan yang dibawa oleh model besar boleh diperolehi.
Liu Qi percaya bahawa kemunculan model besar telah mencetuskan banyak keperluan baru yang tidak wujud sebelum model besar. Tanpa sokongan data, model tidak akan dapat berfungsi, terutamanya dari segi pembezaan. Jika semua orang adalah model besar, maka mungkin tidak ada perbezaan antara anda dan orang lain. "
Tetapi berbanding model besar, penonton di sidang kemuncak nampaknya lebih memberi perhatian kepada model kecil kerana beberapa kelebihan model kecil: kelajuan, kos dan keselamatan. Liu Qi berkata berdasarkan data uniknya sendiri, dia boleh membuat model yang berbeza Model itu mestilah cukup kecil untuk memenuhi tiga keperluan ini: cukup murah, cukup pantas dan cukup selamat.
Perlu diingat bahawa kedua-dua Databricks dan Snowflake baru-baru ini mengumumkan data hasil mereka, dan pertumbuhan hasil tahunan platform adalah lebih daripada 60%. Kadar pertumbuhan ini dicerminkan dalam tumpuan yang semakin meningkat pada data dengan latar belakang kelembapan dalam perbelanjaan perisian di seluruh pasaran. Dengan kemunculan model berskala besar, nilai data telah diserlahkan pada Sidang Kemuncak Databricks ini dengan tema data ditambah AI.
Dengan pengenalan model berskala besar, penjanaan data automatik menjadi mungkin, dan jumlah data dijangka meningkat secara eksponen. Cara mengakses data dengan mudah, cara menyokong format data yang berbeza, dan cara melombong nilai di sebalik data akan menjadi keperluan yang semakin kerap.
Sebaliknya, banyak syarikat hari ini masih meneroka dan menunggu untuk menyepadukan model besar ke dalam perisian perusahaan Namun, mengambil kira keselamatan, privasi dan kos, hanya sedikit yang berani menggunakannya secara langsung. Sebaik sahaja model besar digunakan terus ke data perusahaan tanpa memindahkan data, ambang untuk menggunakan model besar akan terus diturunkan dan jumlah serta kelajuan penggunaan data akan dikeluarkan lagi.
Atas ialah kandungan terperinci Gergasi data AS$38 bilion mahu melancarkan revolusi 'AI' dalam perusahaan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Dalam buku seminal John Rawls pada tahun 1971 The Theory of Justice, beliau mencadangkan percubaan pemikiran yang harus kita ambil sebagai inti reka bentuk AI hari ini dan menggunakan keputusan: tudung kejahilan. Falsafah ini menyediakan alat yang mudah untuk memahami ekuiti dan juga menyediakan pelan tindakan untuk pemimpin untuk menggunakan pemahaman ini untuk mereka bentuk dan melaksanakan AI dengan cara yang saksama. Bayangkan anda membuat peraturan untuk masyarakat baru. Tetapi ada premis: anda tidak tahu terlebih dahulu apa peranan yang akan anda mainkan dalam masyarakat ini. Anda mungkin menjadi kaya atau miskin, sihat atau kurang upaya, milik majoriti atau minoriti marginal. Beroperasi di bawah "VEIL OF KETIGA" ini menghalang pembuat peraturan daripada membuat keputusan yang memberi manfaat kepada diri mereka sendiri. Sebaliknya, orang akan lebih bermotivasi untuk merumuskan orang ramai

Banyak syarikat yang mengkhususkan diri dalam Automasi Proses Robot (RPA), menawarkan bot untuk mengautomasikan tugas berulang -UIPATH, Automasi di mana sahaja, Prism Blue, dan lain -lain. Sementara itu, proses perlombongan, orkestrasi, dan pemprosesan dokumen pintar Special

Masa depan AI bergerak melampaui ramalan kata mudah dan simulasi perbualan; Ejen AI muncul, mampu tindakan bebas dan penyelesaian tugas. Peralihan ini sudah jelas dalam alat seperti Claude Anthropic. Ejen AI: Penyelidikan a

Kemajuan teknologi yang pesat memerlukan perspektif yang berpandangan ke hadapan pada masa depan kerja. Apa yang berlaku apabila AI melampaui peningkatan produktiviti semata -mata dan mula membentuk struktur masyarakat kita? Buku yang akan datang Topher McDougal, Gaia Wakes:

Klasifikasi produk, sering melibatkan kod kompleks seperti "HS 8471.30" dari sistem seperti sistem harmoni (HS), adalah penting untuk perdagangan antarabangsa dan jualan domestik. Kod ini memastikan permohonan cukai yang betul, memberi kesan kepada setiap inv

Masa Depan Penggunaan Tenaga di Pusat Data dan Pelaburan Teknologi Iklim Artikel ini menerangkan lonjakan penggunaan tenaga di pusat data yang didorong oleh AI dan kesannya terhadap perubahan iklim, dan menganalisis penyelesaian inovatif dan cadangan dasar untuk menangani cabaran ini. Cabaran Permintaan Tenaga: Pusat data besar-besaran dan ultra-besar menggunakan kuasa besar, setanding dengan jumlah beratus-ratus ribu keluarga Amerika Utara yang biasa, dan pusat-pusat skala ultra-besar AI yang muncul menggunakan puluhan kali lebih banyak kuasa daripada ini. Dalam lapan bulan pertama 2024, Microsoft, Meta, Google dan Amazon telah melabur kira -kira AS $ 125 bilion dalam pembinaan dan operasi pusat data AI (JP Morgan, 2024) (Jadual 1). Permintaan tenaga yang semakin meningkat adalah satu cabaran dan peluang. Menurut Canary Media, elektrik yang menjulang

AI Generatif merevolusi pengeluaran filem dan televisyen. Model Ray 2 Luma, serta Runway's Gen-4, Openai's Sora, Veo Google dan model-model baru yang lain, meningkatkan kualiti video yang dihasilkan pada kelajuan yang belum pernah terjadi sebelumnya. Model-model ini dengan mudah boleh mewujudkan kesan khas yang kompleks dan adegan yang realistik, walaupun klip video pendek dan kesan gerakan yang diperolehi oleh kamera telah dicapai. Walaupun manipulasi dan konsistensi alat -alat ini masih perlu diperbaiki, kelajuan kemajuan adalah menakjubkan. Video generatif menjadi medium bebas. Sesetengah model baik pada pengeluaran animasi, sementara yang lain baik pada imej aksi langsung. Perlu diingat bahawa Firefly Adobe dan Moonvalley's Ma

Pengalaman Pengguna CHATGPT Menolak: Adakah Degradasi Model atau Harapan Pengguna? Baru -baru ini, sebilangan besar pengguna berbayar ChatGPT telah mengadu tentang kemerosotan prestasi mereka, yang telah menarik perhatian yang meluas. Pengguna melaporkan tindak balas yang lebih perlahan terhadap model, jawapan yang lebih pendek, kekurangan bantuan, dan lebih banyak halusinasi. Sesetengah pengguna menyatakan rasa tidak puas hati di media sosial, menunjukkan bahawa ChatGPT telah menjadi "terlalu menyanjung" dan cenderung untuk mengesahkan pandangan pengguna dan bukannya memberikan maklum balas kritikal. Ini bukan sahaja memberi kesan kepada pengalaman pengguna, tetapi juga membawa kerugian sebenar kepada pelanggan korporat, seperti mengurangkan produktiviti dan pembaziran sumber pengkomputeran. Bukti kemerosotan prestasi Ramai pengguna telah melaporkan kemerosotan yang ketara dalam prestasi CHATGPT, terutamanya dalam model yang lebih lama seperti GPT-4 (yang tidak lama lagi akan dihentikan dari perkhidmatan pada akhir bulan ini). ini


Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Penyesuai Pelayan SAP NetWeaver untuk Eclipse
Integrasikan Eclipse dengan pelayan aplikasi SAP NetWeaver.

Muat turun versi mac editor Atom
Editor sumber terbuka yang paling popular

SecLists
SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

EditPlus versi Cina retak
Saiz kecil, penyerlahan sintaks, tidak menyokong fungsi gesaan kod
