搜索
首页科技周边人工智能PostgreSML教程:使用SQL进行机器学习

机器学习的主要趋势涉及将数据传输到模型的培训环境中。 但是,如果我们扭转了这个过程怎么办?鉴于现代数据库比机器学习模型大得多,将模型移至数据集更有效吗?

这是PostgreSML背后的基本概念 - 数据仍在其位置,您将代码带到数据库中。这种机器学习的倒置方法提供了许多实践优势,这些优势挑战了“数据库”的常规概念。

> postgresml:概述及其优点

> Postgresml是一个建立在广泛使用的PostgreSQL数据库基于的综合机器学习平台。它介绍了一种名为“ database”机器学习的新颖方法,使您能够在SQL中执行各种ML任务,而无需为每个步骤提供单独的工具。>

尽管具有相对新颖性,但PostgreSML提供了几个关键好处:>

PostgresML Tutorial: Doing Machine Learning With SQL

> in-database ml:

在PostgreSQL数据库中直接在PostgreSQL数据库中直接运行ML模型。这消除了对数据库和外部ML框架之间恒定数据传输的需求,从而提高了效率并降低了延迟。

    > sql API:利用SQL进行培训,微调和部署机器学习模型。这简化了数据分析师和科学家对多个ML框架不熟悉的工作流程。
  • > >>预训练的模型:
  • >与拥抱面无缝集成,提供访问众多预训练的模型,例如Llama,Falcon,Bert和Mistral。
  • 自定义和灵活性:支持Scikit-Learn,XGBoost,LGBM,Pytorch和Tensorflow的广泛算法,可直接在数据库中进行多种监督的学习任务。
  • >生态系统集成:与任何支持Postgres的环境一起使用多种编程语言的SDK(JavaScript,Python和Rust特别支持)。
  • >
  • 本教程将使用典型的机器学习工作流程演示这些功能:
  • 数据加载
  • 数据预处理
  • 模型培训

超参数微调PostgresML Tutorial: Doing Machine Learning With SQL

生产部署

    所有这些步骤将在Postgres数据库中执行。让我们开始!
  1. > postgresml
  2. 的完整监督学习工作流程

    入门:Postgresml免费tier

    1. >创建一个免费帐户,请> https://www.php.cn/link/3349958A3E3E56580D4E415DA345703886 >

    PostgresML Tutorial: Doing Machine Learning With SQL

      选择提供慷慨资源的自由层:

    PostgresML Tutorial: Doing Machine Learning With SQL 注册后,您将访问Postgresml控制台以管理项目和资源。>

    “管理”部分允许您根据计算需求扩展环境。> PostgresML Tutorial: Doing Machine Learning With SQL

    1。安装和设置Postgres

    PostgresML Tutorial: Doing Machine Learning With SQL > PostgreSML需要PostgreSQL。 可用于各种平台的安装指南:

    > Windows

    mac os
    • linux
    • 对于WSL2,以下命令足够:
    • >
    验证安装:

    sudo apt update
    sudo apt install postgresql postgresql-contrib
    sudo passwd postgres  # Set a new Postgres password
    # Close and reopen your terminal
    为了获得比终端更具用户友好的体验,请考虑VSCODE扩展。

    >

    psql --version

    2。数据库连接

    PostgresML Tutorial: Doing Machine Learning With SQL 使用PostgreSML控制台中的连接详细信息:

    >使用

    PostgresML Tutorial: Doing Machine Learning With SQL 连接

    或者,使用文档中所述的VSCODE扩展名。

    启用PGML扩展名:psql

    psql -h "host" -U "username" -p 6432 -d "database_name"
    验证安装:

    3。数据加载

    CREATE EXTENSION IF NOT EXISTS pgml;
    >我们将使用Kaggle的Diamonds数据集。将其作为CSV下载或使用此python片段:

    SELECT pgml.version();
    创建表:

    填充表:

    import seaborn as sns
    diamonds = sns.load_dataset("diamonds")
    diamonds.to_csv("diamonds.csv", index=False)

    验证数据:

    CREATE TABLE IF NOT EXISTS diamonds (
       index SERIAL PRIMARY KEY,
       carat FLOAT,
       cut VARCHAR(255),
       color VARCHAR(255),
       clarity VARCHAR(255),
       depth FLOAT,
       table_ FLOAT,
       price INT,
       x FLOAT,
       y FLOAT,
       z FLOAT
    );

    INSERT INTO diamonds
       (carat, cut, color, clarity, depth, table_, price, x, y, z)
       FROM '~/full/path/to/diamonds.csv'
       DELIMITER ','
       CSV HEADER;

    4。模型培训

    SELECT * FROM diamonds LIMIT 10;
    基本培训

    PostgresML Tutorial: Doing Machine Learning With SQL 训练XGBoost回归剂:

    训练多级分类器:

    >预处理

    SELECT pgml.train(
     project_name => 'Diamond prices prediction',
     task => 'regression',
     relation_name => 'diamonds',
     y_column_name => 'price',
     algorithm => 'xgboost'
    );
    训练具有预处理的随机森林模型:

    PostgreSML提供各种预处理选项(编码,插图,缩放)。
    SELECT pgml.train(
     project_name => 'Diamond cut quality prediction',
     task => 'classification',
     relation_name => 'diamonds',
     y_column_name => 'cut',
     algorithm => 'xgboost',
     test_size => 0.1
    );
    指定超参数

    >使用自定义超参数训练XGBoost回归剂:>
    sudo apt update
    sudo apt install postgresql postgresql-contrib
    sudo passwd postgres  # Set a new Postgres password
    # Close and reopen your terminal

    >超参数调整

    执行网格搜索:

    psql --version

    5。模型评估

    使用pgml.predict进行预测:

    >
    psql -h "host" -U "username" -p 6432 -d "database_name"

    使用特定模型,指定其ID:>

    CREATE EXTENSION IF NOT EXISTS pgml;
    检索模型ID:

    SELECT pgml.version();
    6。模型部署

    Postgresml

    自动部署表现最佳的模型。 对于更精细的控制,请使用

    pgml.deploy>

    import seaborn as sns
    diamonds = sns.load_dataset("diamonds")
    diamonds.to_csv("diamonds.csv", index=False)
    >部署策略包括

    best_scoremost_recentrollback

    进一步探索postgresml

    > postgresml超出了监督学习的范围。首页具有用于实验的SQL编辑器。 建立面向消费者的ML服务可能涉及:

    创建一个用户界面(例如,使用简化或taipy)。>

    开发后端(python,node.js)。
    1. 使用
    2. 的库进行数据库交互。
    3. >
    4. >后端中的预处理数据。psycopg2 在用户交互时,pg-promise触发
    5. pgml.predict结论
    PostgreSML提供了一种新颖的机器学习方法。 为了进一步了解您的理解,请探索GostgreSML文档,并考虑Datacamp的SQL课程和AI基础知识等资源。

    >

以上是PostgreSML教程:使用SQL进行机器学习的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
拥抱面部是否7B型号奥林匹克赛车击败克劳德3.7?拥抱面部是否7B型号奥林匹克赛车击败克劳德3.7?Apr 23, 2025 am 11:49 AM

拥抱Face的OlympicCoder-7B:强大的开源代码推理模型 开发以代码为中心的语言模型的竞赛正在加剧,拥抱面孔与强大的竞争者一起参加了比赛:OlympicCoder-7B,一种产品

4个新的双子座功能您可以错过4个新的双子座功能您可以错过Apr 23, 2025 am 11:48 AM

你们当中有多少人希望AI可以做更多的事情,而不仅仅是回答问题?我知道我有,最近,我对它的变化感到惊讶。 AI聊天机器人不仅要聊天,还关心创建,研究

Camunda为经纪人AI编排编写了新的分数Camunda为经纪人AI编排编写了新的分数Apr 23, 2025 am 11:46 AM

随着智能AI开始融入企业软件平台和应用程序的各个层面(我们必须强调的是,既有强大的核心工具,也有一些不太可靠的模拟工具),我们需要一套新的基础设施能力来管理这些智能体。 总部位于德国柏林的流程编排公司Camunda认为,它可以帮助智能AI发挥其应有的作用,并与新的数字工作场所中的准确业务目标和规则保持一致。该公司目前提供智能编排功能,旨在帮助组织建模、部署和管理AI智能体。 从实际的软件工程角度来看,这意味着什么? 确定性与非确定性流程的融合 该公司表示,关键在于允许用户(通常是数据科学家、软件

策划的企业AI体验是否有价值?策划的企业AI体验是否有价值?Apr 23, 2025 am 11:45 AM

参加Google Cloud Next '25,我渴望看到Google如何区分其AI产品。 有关代理空间(此处讨论)和客户体验套件(此处讨论)的最新公告很有希望,强调了商业价值

如何为抹布找到最佳的多语言嵌入模型?如何为抹布找到最佳的多语言嵌入模型?Apr 23, 2025 am 11:44 AM

为您的检索增强发电(RAG)系统选择最佳的多语言嵌入模型 在当今的相互联系的世界中,建立有效的多语言AI系统至关重要。 强大的多语言嵌入模型对于RE至关重要

麝香:奥斯汀的机器人需要每10,000英里进行干预麝香:奥斯汀的机器人需要每10,000英里进行干预Apr 23, 2025 am 11:42 AM

特斯拉的Austin Robotaxi发射:仔细观察Musk的主张 埃隆·马斯克(Elon Musk)最近宣布,特斯拉即将在德克萨斯州奥斯汀推出的Robotaxi发射,最初出于安全原因部署了一支小型10-20辆汽车,并有快速扩张的计划。 h

AI震惊的枢轴:从工作工具到数字治疗师和生活教练AI震惊的枢轴:从工作工具到数字治疗师和生活教练Apr 23, 2025 am 11:41 AM

人工智能的应用方式可能出乎意料。最初,我们很多人可能认为它主要用于代劳创意和技术任务,例如编写代码和创作内容。 然而,哈佛商业评论最近报道的一项调查表明情况并非如此。大多数用户寻求人工智能的并非是代劳工作,而是支持、组织,甚至是友谊! 报告称,人工智能应用案例的首位是治疗和陪伴。这表明其全天候可用性以及提供匿名、诚实建议和反馈的能力非常有价值。 另一方面,营销任务(例如撰写博客、创建社交媒体帖子或广告文案)在流行用途列表中的排名要低得多。 这是为什么呢?让我们看看研究结果及其对我们人类如何继续将

公司竞争AI代理的采用公司竞争AI代理的采用Apr 23, 2025 am 11:40 AM

AI代理商的兴起正在改变业务格局。 与云革命相比,预计AI代理的影响呈指数增长,有望彻底改变知识工作。 模拟人类决策的能力

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

螳螂BT

螳螂BT

Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

SecLists

SecLists

SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

MinGW - 适用于 Windows 的极简 GNU

MinGW - 适用于 Windows 的极简 GNU

这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。