机器学习的主要趋势涉及将数据传输到模型的培训环境中。 但是,如果我们扭转了这个过程怎么办?鉴于现代数据库比机器学习模型大得多,将模型移至数据集更有效吗?
这是PostgreSML背后的基本概念 - 数据仍在其位置,您将代码带到数据库中。这种机器学习的倒置方法提供了许多实践优势,这些优势挑战了“数据库”的常规概念。 > postgresml:概述及其优点>
Postgresml是一个建立在广泛使用的PostgreSQL数据库基于的综合机器学习平台。它介绍了一种名为“ database”机器学习的新颖方法,使您能够在SQL中执行各种ML任务,而无需为每个步骤提供单独的工具。
尽管具有相对新颖性,但PostgreSML提供了几个关键好处:
在PostgreSQL数据库中直接在PostgreSQL数据库中直接运行ML模型。这消除了对数据库和外部ML框架之间恒定数据传输的需求,从而提高了效率并降低了延迟。
- > sql API:
- > >>预训练的模型: >与拥抱面无缝集成,提供访问众多预训练的模型,例如Llama,Falcon,Bert和Mistral。
- 自定义和灵活性:
支持Scikit-Learn,XGBoost,LGBM,Pytorch和Tensorflow的广泛算法,可直接在数据库中进行多种监督的学习任务。 >生态系统集成: - >
-
本教程将使用典型的机器学习工作流程演示这些功能:
- 数据预处理 模型培训
超参数微调
- 所有这些步骤将在Postgres数据库中执行。让我们开始!
- > postgresml
- 的完整监督学习工作流程
入门:Postgresml免费tier
- 选择提供慷慨资源的自由层:
注册后,您将访问Postgresml控制台以管理项目和资源。
> “管理”部分允许您根据计算需求扩展环境。
> > PostgreSML需要PostgreSQL。 可用于各种平台的安装指南:
- linux
- 对于WSL2,以下命令足够:
- >
sudo apt update sudo apt install postgresql postgresql-contrib sudo passwd postgres # Set a new Postgres password # Close and reopen your terminal
为了获得比终端更具用户友好的体验,请考虑VSCODE扩展。>
psql --version
使用PostgreSML控制台中的连接详细信息:
:
或者,使用文档中所述的VSCODE扩展名。连接
启用PGML扩展名:
psql
psql -h "host" -U "username" -p 6432 -d "database_name"
验证安装:3。数据加载
CREATE EXTENSION IF NOT EXISTS pgml;
>我们将使用Kaggle的Diamonds数据集。将其作为CSV下载或使用此python片段:SELECT pgml.version();
创建表:填充表:
import seaborn as sns diamonds = sns.load_dataset("diamonds") diamonds.to_csv("diamonds.csv", index=False)
验证数据:
CREATE TABLE IF NOT EXISTS diamonds ( index SERIAL PRIMARY KEY, carat FLOAT, cut VARCHAR(255), color VARCHAR(255), clarity VARCHAR(255), depth FLOAT, table_ FLOAT, price INT, x FLOAT, y FLOAT, z FLOAT );
INSERT INTO diamonds (carat, cut, color, clarity, depth, table_, price, x, y, z) FROM '~/full/path/to/diamonds.csv' DELIMITER ',' CSV HEADER;
4。模型培训
SELECT * FROM diamonds LIMIT 10;
基本培训训练XGBoost回归剂:
>预处理
SELECT pgml.train( project_name => 'Diamond prices prediction', task => 'regression', relation_name => 'diamonds', y_column_name => 'price', algorithm => 'xgboost' );
训练具有预处理的随机森林模型:SELECT pgml.train( project_name => 'Diamond cut quality prediction', task => 'classification', relation_name => 'diamonds', y_column_name => 'cut', algorithm => 'xgboost', test_size => 0.1 );
指定超参数> sudo apt update sudo apt install postgresql postgresql-contrib sudo passwd postgres # Set a new Postgres password # Close and reopen your terminal
>超参数调整
执行网格搜索:
psql --version
5。模型评估
使用
>pgml.predict
进行预测:psql -h "host" -U "username" -p 6432 -d "database_name"
使用特定模型,指定其ID:
> CREATE EXTENSION IF NOT EXISTS pgml;
检索模型ID:SELECT pgml.version();
6。模型部署Postgresml
自动部署表现最佳的模型。 对于更精细的控制,请使用:
pgml.deploy
>import seaborn as sns diamonds = sns.load_dataset("diamonds") diamonds.to_csv("diamonds.csv", index=False)
>部署策略包括,
进一步探索postgresmlbest_score
和most_recent
。rollback
>
postgresml超出了监督学习的范围。首页具有用于实验的SQL编辑器。 建立面向消费者的ML服务可能涉及: 创建一个用户界面(例如,使用简化或taipy)。
开发后端(python,node.js)。> - 使用 或
- 的库进行数据库交互。 >
- >后端中的预处理数据。
psycopg2
在用户交互时,pg-promise
触发 -
pgml.predict
结论
>
以上是PostgreSML教程:使用SQL进行机器学习的详细内容。更多信息请关注PHP中文网其他相关文章!

拥抱Face的OlympicCoder-7B:强大的开源代码推理模型 开发以代码为中心的语言模型的竞赛正在加剧,拥抱面孔与强大的竞争者一起参加了比赛:OlympicCoder-7B,一种产品

你们当中有多少人希望AI可以做更多的事情,而不仅仅是回答问题?我知道我有,最近,我对它的变化感到惊讶。 AI聊天机器人不仅要聊天,还关心创建,研究

随着智能AI开始融入企业软件平台和应用程序的各个层面(我们必须强调的是,既有强大的核心工具,也有一些不太可靠的模拟工具),我们需要一套新的基础设施能力来管理这些智能体。 总部位于德国柏林的流程编排公司Camunda认为,它可以帮助智能AI发挥其应有的作用,并与新的数字工作场所中的准确业务目标和规则保持一致。该公司目前提供智能编排功能,旨在帮助组织建模、部署和管理AI智能体。 从实际的软件工程角度来看,这意味着什么? 确定性与非确定性流程的融合 该公司表示,关键在于允许用户(通常是数据科学家、软件

参加Google Cloud Next '25,我渴望看到Google如何区分其AI产品。 有关代理空间(此处讨论)和客户体验套件(此处讨论)的最新公告很有希望,强调了商业价值

为您的检索增强发电(RAG)系统选择最佳的多语言嵌入模型 在当今的相互联系的世界中,建立有效的多语言AI系统至关重要。 强大的多语言嵌入模型对于RE至关重要

特斯拉的Austin Robotaxi发射:仔细观察Musk的主张 埃隆·马斯克(Elon Musk)最近宣布,特斯拉即将在德克萨斯州奥斯汀推出的Robotaxi发射,最初出于安全原因部署了一支小型10-20辆汽车,并有快速扩张的计划。 h

人工智能的应用方式可能出乎意料。最初,我们很多人可能认为它主要用于代劳创意和技术任务,例如编写代码和创作内容。 然而,哈佛商业评论最近报道的一项调查表明情况并非如此。大多数用户寻求人工智能的并非是代劳工作,而是支持、组织,甚至是友谊! 报告称,人工智能应用案例的首位是治疗和陪伴。这表明其全天候可用性以及提供匿名、诚实建议和反馈的能力非常有价值。 另一方面,营销任务(例如撰写博客、创建社交媒体帖子或广告文案)在流行用途列表中的排名要低得多。 这是为什么呢?让我们看看研究结果及其对我们人类如何继续将


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

螳螂BT
Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

SecLists
SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

mPDF
mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

SublimeText3汉化版
中文版,非常好用

MinGW - 适用于 Windows 的极简 GNU
这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。