最近在GitHub 上看到的這個 MindsDB[1] 專案讓我眼前一亮,它可以在資料庫中執行機器學習相關的操作,也就是說,僅用SQL 就可以建置、訓練、最佳化和部署機器學習模型,要獲得預測,只需查詢資料和ML 模型就可以。
MindsDB 透過採用 AI 表的概念將機器學習引入資料庫。 AI 表是作為虛擬表儲存在資料庫中的機器學習模型。它們有助於根據數據進行預測。你可以在資料庫中執行時間序列、迴歸和分類預測,並透過使用簡單的 SQL 語句查詢 AI 表幾乎立即獲得輸出。
接下來,我們來看一個官方提供的簡單範例。
1、申請一個免費的 MindsDB 雲端帳號,這樣就可以立刻體驗到了。如果你喜歡本地部署,可以安裝他們的 Docker 版本。
2、從 SQL 用戶端連線到 MindsDB。
3、使用 CREATE DATABASE 連接到資料庫。 MindsDB 有一個範例資料庫,可以立即使用。請使用CREATE DATABASE 語句,如下所示:
CREATE DATABASE example_data WITH ENGINE = "postgres", PARAMETERS = { "user": "demo_user", "password": "demo_password", "host": "3.220.66.106", "port": "5432", "database": "demo" };
執行之後可以得到下面的結果:
Query OK, 0 rows affected (3.22 sec)
4、可以使用標準SQL 來預覽數據,如下圖所示:
5、使用CREATE PREDICTOR 建立預測器:
CREATE PREDICTOR mindsdb.home_rentals_predictor FROM example_data (SELECT * FROM demo_data.home_rentals) PREDICT rental_price;
執行後:
Query OK, 0 rows affected (9.79 sec)
6、檢查預測器的狀態:
SELECT status FROM mindsdb.predictors WHERE name='home_rentals_predictor';
會得到正在訓練或完成的狀態:
+----------+ | status | +----------+ | training | +----------+
或
+----------+ | status | +----------+ | complete | +----------+
7、執行預測
SELECT 語句允許你基於特徵進行預測,其中特徵是用於進行預測的輸入變數或輸入列。現在來預測一棟兩間浴室的 1000 平方英尺房屋的租金是多少。
SELECT rental_price FROM mindsdb.home_rentals_predictor WHERE number_of_bathrooms=2 AND sqft=1000;
得到結果如下:
+--------------+ | rental_price | +--------------+ | 1130 | +--------------+
到了這一步,你已經成功地使用 SQL 訓練了一個預測模型並獲得了預測的資料!
特性
1、自動資料預處理、特徵工程與編碼
2、分類、迴歸、時間序列任務
3、無「傳統部署」即可將模型投入生產
4、取得每個預測的模型準確度評分和信賴區間
5、可以將ML 模型與現有資料Join
6、異常檢測
7、模型可解釋性分析
8、支援GPU 訓練
支援與下列資料庫整合:
#最後的話
只用SQL 就可以使用機器學習真的很方便,MindsDB 的技術細節可以存取官方文件[2],如果有幫助請點在看分享給更多的朋友。
參考資料:
[1]MindsDB: https://github.com/mindsdb/mindsdb
[2]文件: docs.mindsdb.com
以上是光是 SQL 就可以搞機器學習的詳細內容。更多資訊請關注PHP中文網其他相關文章!

使用Gemma範圍探索語言模型的內部工作 了解AI語言模型的複雜性是一個重大挑戰。 Google發布的Gemma Scope是一種綜合工具包,為研究人員提供了一種強大的探索方式

解鎖業務成功:成為商業智能分析師的指南 想像一下,將原始數據轉換為驅動組織增長的可行見解。 這是商業智能(BI)分析師的力量 - 在GU中的關鍵作用

SQL的Alter表語句:動態地將列添加到數據庫 在數據管理中,SQL的適應性至關重要。 需要即時調整數據庫結構嗎? Alter表語句是您的解決方案。本指南的詳細信息添加了Colu

介紹 想像一個繁華的辦公室,兩名專業人員在一個關鍵項目中合作。 業務分析師專注於公司的目標,確定改進領域,並確保與市場趨勢保持戰略一致。 simu

Excel 數據計數與分析:COUNT 和 COUNTA 函數詳解 精確的數據計數和分析在 Excel 中至關重要,尤其是在處理大型數據集時。 Excel 提供了多種函數來實現此目的,其中 COUNT 和 COUNTA 函數是用於在不同條件下統計單元格數量的關鍵工具。雖然這兩個函數都用於計數單元格,但它們的設計目標卻針對不同的數據類型。讓我們深入了解 COUNT 和 COUNTA 函數的具體細節,突出它們獨特的特性和區別,並學習如何在數據分析中應用它們。 要點概述 理解 COUNT 和 COU

Google Chrome的AI Revolution:個性化和高效的瀏覽體驗 人工智能(AI)正在迅速改變我們的日常生活,而Google Chrome正在領導網絡瀏覽領域的負責人。 本文探討了興奮

重新構想影響:四倍的底線 長期以來,對話一直以狹義的AI影響來控制,主要集中在利潤的最低點上。但是,更全面的方法認識到BU的相互聯繫

事情正穩步發展。投資投入量子服務提供商和初創企業表明,行業了解其意義。而且,越來越多的現實用例正在出現以證明其價值超出


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

ZendStudio 13.5.1 Mac
強大的PHP整合開發環境

Dreamweaver Mac版
視覺化網頁開發工具

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。