随着企业要应对越来越多的数据(包括组织内部生成的和从外部来源收集的数据),找到有效的方法来分析和“操作”这些数据以获得竞争优势,变得越来越具有挑战性。
这也推动了数据科学和机器学习领域对新工具和新技术的需求。根据《财富商业洞察》报告显示,全球机器学习市场规模在2021年就达到了154.4亿美元,今年将达到211.7亿美元,预计到2029年将增长到至2099.1亿美元,复合年增长率为38.8%。
与此同时,根据Allied Market Research的报告显示,2020年数据科学平台的全球市场规模为47亿美元,预计到2030年将达到797亿美元,复合年增长率为33.6%。
“数据科学”和“机器学习”有时会让人感觉有些混淆,甚至是可以互换使用。实际上这是两个不同的概念,但两者又是相关的,因为数据科学实践是机器学习项目的关键。
根据Master’s in Data Science网站的定义,数据科学是一个使用科学方法从数据中提取意义和见解的研究领域,包括制定数据分析策略、准备分析数据、开发数据可视化和构建数据模型。
根据《财富商业洞察》报告,机器学习则是范畴更广的人工智能领域下的一个子部分,是指使用数据分析来教计算机如何学习(也就是模仿人类的学习方式)使用基于算法和数据的模型。
对数据科学和机器学习工具的需求,催生了一批在数据科学或者是机器学习领域开发前沿技术的初创公司,下面来看看其中这10家:
- Aporia
- Baseten
- Deci
- Galileo
- Neuton
- Pinecone
- Predibase
- Snorkel AI
- Vectice
- Verta
Aporia
Aporia开发了一个全栈的、高度可定制的机器学习可观察性平台,数据科学和机器学习可以使用该平台来监控、调试、解释和改进机器学习模型和数据。
Aporia成立于2020年,在获得了500万美元种子资金的10个月之后,于2022年3月的A轮融资中又获得了2500万美元资金。
Aporia将利用这笔融资在2023年初之前将员工规模扩大两倍,同时扩展在美国的业务,并扩大其技术覆盖的用例范围。
Baseten
Baseten是在今年4月正式发布的,提供的产品可以加快从机器学习模型开发到生产级应用的过程。
据Baseten称,该技术自2021年夏季以来一直处于内测阶段,可以自动执行将机器学习模型投入生产所需的许多技能,帮助数据科学和机器学习团队将机器学习整合到业务流程中,无需后端、前端或者是MLOps知识。
Baseten公司是由首席执行官Tuhin Srivastava、首席技术官Amir Haghighat和首席科学家Philip Howes于2019年创立,他们之前都曾在电子商务平台开发商Gumroad公司就职。今年4月,Baseten在A轮融资中获得了1200万美元,此前早些时候在种子轮融资中获得了800万美元。
Deci
Deci开发了一个深度学习开发平台,用于构建下一代人工智能和深度学习应用。Deci的技术旨在帮助解决“人工智能效率差距”,也就是计算机硬件无法满足那些规模和复杂性不断增长的机器学习模型的需求。
Deci的平台在开发生命周期早期就考虑到了生产方面的问题,从而帮助数据科学家消除这一差距,减少在生产中部署模型时解决问题的时间和成本。据Deci称,该平台结合了Deci专有的AutoNAC(自动神经架构构建)技术,提供了“更高效的开发范式”,帮助AI开发人员利用硬件感知的“神经架构搜索”来构建深度学习模型,以满足特定的生产需求目标。
Deci成立于2019年,在今年7月由Insight Partners领投的B轮融资中获得了了2500万美元,就在7个月前,Deci刚刚在A轮融资中获得了2100万美元。
Galileo
Galileo针对非结构化数据开发了一个机器学习数据智能平台,让数据科学家可以在整个机器学习生命周期中检查、发现和修复关键的机器学习错误。
今年11月初,Galileo公司推出了该平台的免费版本Galileo Community Edition,让从事自然语言处理的数据科学家们能够使用更高质量的训练数据更快速地构建模型。
Galileo在今年5月获得于510万美元种子资金的时候走出隐身模式,紧接着在11月1日,在由Battery Ventures领投的A轮融资中获得了1800万美元。Galileo公司联合创始人包括首席执行官Vikram Chatterji,他曾是谷歌的云AI项目管理负责人;Atindriyo Sanyal,曾是苹果公司和Uber公司的软件工程师;以及Yash Sheth,曾是谷歌语音识别系统的软件工程师。
Neuton
Neuton成立于2021年,开发的自动化无代码“tinyML”平台和其他工具用于开发微型机器学习模型,这些模型可以嵌入微控制器中,使边缘设备变得智能。
Neuton的技术正在被广泛应用,包括压缩机水泵的预测性维护、防止电网过载、房间占用检测、手持设备上的手写识别、变速箱故障预测和水污染监测设备。
Pinecone
Pinecone开发的矢量数据库和搜索技术主要为人工智能和机器学习应用提供支持。2021年10月,Pinecone公司推出了Pinecone 2.0,将该软件从研究实验室带到生产应用中。
Pinecone成立于2019年,去年正式发布,并在2021年1月的种子轮融资中获得1000万美元,今年3月的A轮融资中获得了2800万美元。
今年10月,Pinecone推出了结合语义和关键字搜索功能的新“矢量搜索”解决方案,对自己的机器学习搜索基础设施产品组合进行了扩展。
Gartner曾在2021年将Pinecone评为人工智能和机器学习数据领域中的“酷厂商”。
Predibase
今年5月,Predibase凭借低代码机器学习平台走出隐身模式,该平台可以让数据科学家和非专家快速开发具有“同类最佳”机器学习基础设施的机器学习模型。该软件目前在许多财富500强公司那里进行测试使用。
Predibase提供将其技术作为对传统AutoML的替代方法,开发机器学习模式解决现实中的问题。该平台使用声明式机器学习,Predibase称它让用户可以把机器学习模型指定为“配置”或者简单文件,告诉系统用户想要什么,并让系统找出满足该需求的最佳方法。
Predibase公司是由首席执行官Piero Molino、首席技术官Travis Addair、首席产品官Devvret Rishi以及斯坦福大学副教授Chris Re共同创立的,其中Molino和Addair都曾经在Uber公司工作。在Uber的时候,他们二人开发了用于深度学习模型的Ludwig开源框架,以及用于扩展和分发深度学习模型训练到海量数据的Horovod开源框架(Predibase就是建立在Ludwig和Horovod之上的。)
今年5月,Predibase在由Greylock领投的种子轮和A轮融资中获得了1650万美元。
Snorkel AI
Snorkel成立于2019 年,起源于斯坦福大学人工智能实验室,该公司的五位创始人都曾在那里研究解决机器学习开发缺乏标记训练数据问题的方法。
Snorkel开发了以Snorkel Flow以数据为中心的系统,并在今年3月全面投入市场,该系统通过使用程序化标签(这是数据准备和机器学习模型开发和培训的关键步骤)来加速人工智能和机器学习的开发。
2021年8月,Snorkel公司的估值达到10亿美元,当时这家初创公司在C轮融资中获得了8500万美元,使用这笔资金发展其工程和销售团队并加速平台开发。
Vectice
Vectice开发了一种自动化的数据科学知识捕获和共享解决方案。Vectice的技术可以自动捕获数据科学团队为项目创建的资产,包括数据集、代码、模型、笔记本、运行和插图,并在整个项目生命周期(从业务需求到生产部署)中生成文档。
据称,Vectice的软件旨在帮助企业管理透明度、治理以及与AI和机器学习项目保持一致,并提供一致的项目结果。
Vectice是由首席执行官Cyril Brignone和首席技术官Gregory Haardt于2020年创立的,在今年1月的A轮融资中获得了1260万美元,总融资额达到1560万美元。
Verta
Verta开发了人工智能/机器学习模型管理和操作软件,让数据科学和机器学习团队使用这些软件在整个人工智能和机器学习模型生命周期中部署、操作、管理和监控固有的复杂模型。
今年8月,Verta公司增强了其MLOps平台的企业功能,包括增加原生集成生态系统、围绕企业安全、隐私和访问控制以及模型风险管理的附加功能。
Verta成立于2018年,于2020年正式发布,今年被Gartner评为核心AI技术领域的“酷厂商”。
以上是年终盘点:2022年最炙手可热的十家数据科学和机器学习初创公司的详细内容。更多信息请关注PHP中文网其他相关文章!

科学家已经广泛研究了人类和更简单的神经网络(如秀丽隐杆线虫中的神经网络),以了解其功能。 但是,出现了一个关键问题:我们如何使自己的神经网络与新颖的AI一起有效地工作

Google的双子座高级:新的订阅层即将到来 目前,访问Gemini Advanced需要$ 19.99/月Google One AI高级计划。 但是,Android Authority报告暗示了即将发生的变化。 最新的Google P中的代码

尽管围绕高级AI功能炒作,但企业AI部署中潜伏的巨大挑战:数据处理瓶颈。首席执行官庆祝AI的进步时,工程师努力应对缓慢的查询时间,管道超载,一个

处理文档不再只是在您的AI项目中打开文件,而是将混乱变成清晰度。诸如PDF,PowerPoints和Word之类的文档以各种形状和大小淹没了我们的工作流程。检索结构化

利用Google的代理开发套件(ADK)的力量创建具有现实世界功能的智能代理!该教程通过使用ADK来构建对话代理,并支持Gemini和GPT等各种语言模型。 w

摘要: 小型语言模型 (SLM) 专为效率而设计。在资源匮乏、实时性和隐私敏感的环境中,它们比大型语言模型 (LLM) 更胜一筹。 最适合专注型任务,尤其是在领域特异性、控制性和可解释性比通用知识或创造力更重要的情况下。 SLM 并非 LLMs 的替代品,但在精度、速度和成本效益至关重要时,它们是理想之选。 技术帮助我们用更少的资源取得更多成就。它一直是推动者,而非驱动者。从蒸汽机时代到互联网泡沫时期,技术的威力在于它帮助我们解决问题的程度。人工智能 (AI) 以及最近的生成式 AI 也不例

利用Google双子座的力量用于计算机视觉:综合指南 领先的AI聊天机器人Google Gemini扩展了其功能,超越了对话,以涵盖强大的计算机视觉功能。 本指南详细说明了如何利用

2025年的AI景观正在充满活力,而Google的Gemini 2.0 Flash和Openai的O4-Mini的到来。 这些尖端的车型分开了几周,具有可比的高级功能和令人印象深刻的基准分数。这个深入的比较


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

VSCode Windows 64位 下载
微软推出的免费、功能强大的一款IDE编辑器

SublimeText3 Linux新版
SublimeText3 Linux最新版

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

mPDF
mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),