search
HomeDatabaseMysql TutorialOxdata研发H2O,打造大数据新蓝图

当你打开该网页时,相信你的第一反应肯定是怀疑的,一个小小的程序员怎么可能成为数据库专家,但是内心也有一点期盼的成分存在,就像买彩票一样,明知道中500万的概率几乎为零,可是还是会去买。前DataStax工程师,Platfora的联合创始人,SriSatish Ambati描

当你打开该网页时,相信你的第一反应肯定是怀疑的,一个小小的程序员怎么可能成为数据库专家,但是内心也有一点期盼的成分存在,就像买彩票一样,明知道中500万的概率几乎为零,可是还是会去买。前DataStax工程师,Platfora的联合创始人,SriSatish Ambati描绘了一幅宏伟的蓝图,让大数据从晦涩难懂的“黑魔法”变成像小孩子的“过家家”游戏那样简单,无论成功与否, Ambati勇气可嘉,态度值得所有的程序员学习。乔布斯不正是把一个个不可能变成了现实吗?

Oxdata研发H2O,打造大数据新蓝图

不过令人遗憾的是,0xdata的数据库产品还在襁褓之中,但是0xdata对做大规模先进的统计分析问题的能力有强大的自信:建立在HDFS上的规模化处理,使用广为人知的R编程语言,把一切都隐藏在一个简单的界面之下。

大数据的趋势正在悄然发生改变,把大数据从晦涩难懂的“黑魔法”变成”小儿科“,似乎已经不再是一个难以企及的梦想!0xdata正是推动这项技术发展的最新公司之一。自启动以来,“hexadata”就凝聚了前DataStax工程师,Platfora的联合创始人,SriSatish Ambati的心血结晶,现在它试图融入Hadoop、R语言和谷歌的BigQuery,准备打造“终极版”的统计分析工具。

Oxdata的旗舰产品,被称之为“H2O”,不错,就是“水”的意思,它的核心是一个统计分析引擎,它使用Hadoop的分布式文件系统(HDFS)作为其存储平台,但是它们的最终目标是像谷歌的BigQuery一样简单。H2O的用户交互是通过一个简单的网络搜索和标准R统计分析语法。另外,用户还可以在Microsoft Excel或RStudio的集成开发环境中使用REST API调用H2O。

Ambati表示,规模化的基础数据和运行高级分析的复杂性都是需要被隐藏的细节。这和Platfora有相同的理论基础,但是该公司的联合创始人Ambati和前任DataStax的同事Ben Werther却与Platfora的做法截然不同。Platfora试图通过建立基于Hadoop的下一代用户体验来破坏现有的数据仓库市场,然而0xdata只是试图改变传统的统计软件的用户交互方式而已。

数据分析产品的负责人Ambati很经典的一句话:“谁都没有吹牛的权利。但是如果不这样做,未来将寸步难行。”让人不禁想到这两天京东与苏宁的家电大战,只能硬着头皮前进,不能后退,因为后退即是灭亡!

Oxdata把数据处理的速度当做一个重点处理——如何快速处理数据,如何让用户迅速得到响应。谷歌搜索让我们有了可以陆续追问的思想,Ambati认为,数据分析也应该有同样的经历。这就是为什么H2O在分析过程中的每一步都提供了近似的结果,而不是等待整个工作运行以后得出计算精确的结果,用户可以得到一个总体的解决思路,即使完全超出预期范围,无论是清理工作还是重新开始新工作都会变得更快。

想要在公众面前得到一个机会,实现H2O“壮志雄心”的诺言,还有很长的一段路要走。但是Ambati表示,虽然产品仅仅是经历了短短4个月的开发,还没有一套的完整的算法,但是相信几个月以后就能初见分晓。他团队的八位工程师,已经建立了很多很酷的东西,只是现在还需要一个完善的过程,最终才能把代码变成实际的产品。尽管困难是如此之大,他们毅然决定继续数据的系统化处理,就是从那一刻起,Ambati和他的团队也发现了很多的乐趣,“我们与基础架构生死相随,不离不弃”Ambati调侃道,“而且我们一大帮人花了很多的时间来学习数学,日子就像回到计算机科学专业学生的那个时代”。(编译/王鹏,审校/包研)

How 0xdata wants to help everyone become data scientists 

后记:Oxdata的H2O目前虽然还是“镜花水月,空中楼阁”,但是Ambati和他的团队的精神确实让人肃然起敬,中国有句老话“有志者,事竟成”,相信只要努力肯定会有收获。当1985年Microsoft的Windows视窗操作系统发布,就立即取代了以往的命令、代码系统(Microsoft Disk Operating Systerm,简称MS-DOS),立即成就了Microsoft这个庞然大物,让比尔·盖茨荣登世界首富的宝座,就是因为Windows简单简洁,操作方便,给用户带来了更好的操作体验,现在电脑已经走进千家万户,从几岁的孩子到五六十的老人,都能很快上手进行网上冲浪,这不正是Windows的魅力所在吗?乔布斯的Ipad风靡全球也正是因为这些原因,因为它让3岁的孩子都能很快成为“水果忍者”。Ambati的团队也做着同样的事情,他们也想让“触不可及”的大数据处理变得的简单如操作Windows一样,让每个人都能迅速成为数据库领域的“专家”,这不正是酝酿着一场新的数据革命吗?我们也期待H2O的发布,能给大数据带来一场新的变革!

Statement
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn
解读CRISP-ML(Q):机器学习生命周期流程解读CRISP-ML(Q):机器学习生命周期流程Apr 08, 2023 pm 01:21 PM

译者 | 布加迪审校 | 孙淑娟目前,没有用于构建和管理机器学习(ML)应用程序的标准实践。机器学习项目组织得不好,缺乏可重复性,而且从长远来看容易彻底失败。因此,我们需要一套流程来帮助自己在整个机器学习生命周期中保持质量、可持续性、稳健性和成本管理。图1. 机器学习开发生命周期流程使用质量保证方法开发机器学习应用程序的跨行业标准流程(CRISP-ML(Q))是CRISP-DM的升级版,以确保机器学习产品的质量。CRISP-ML(Q)有六个单独的阶段:1. 业务和数据理解2. 数据准备3. 模型

人工智能的环境成本和承诺人工智能的环境成本和承诺Apr 08, 2023 pm 04:31 PM

人工智能(AI)在流行文化和政治分析中经常以两种极端的形式出现。它要么代表着人类智慧与科技实力相结合的未来主义乌托邦的关键,要么是迈向反乌托邦式机器崛起的第一步。学者、企业家、甚至活动家在应用人工智能应对气候变化时都采用了同样的二元思维。科技行业对人工智能在创建一个新的技术乌托邦中所扮演的角色的单一关注,掩盖了人工智能可能加剧环境退化的方式,通常是直接伤害边缘人群的方式。为了在应对气候变化的过程中充分利用人工智能技术,同时承认其大量消耗能源,引领人工智能潮流的科技公司需要探索人工智能对环境影响的

找不到中文语音预训练模型?中文版 Wav2vec 2.0和HuBERT来了找不到中文语音预训练模型?中文版 Wav2vec 2.0和HuBERT来了Apr 08, 2023 pm 06:21 PM

Wav2vec 2.0 [1],HuBERT [2] 和 WavLM [3] 等语音预训练模型,通过在多达上万小时的无标注语音数据(如 Libri-light )上的自监督学习,显著提升了自动语音识别(Automatic Speech Recognition, ASR),语音合成(Text-to-speech, TTS)和语音转换(Voice Conversation,VC)等语音下游任务的性能。然而这些模型都没有公开的中文版本,不便于应用在中文语音研究场景。 WenetSpeech [4] 是

顶刊发表!山东大学李贻斌教授团队研发出简捷高机动轮腿复合式机器人顶刊发表!山东大学李贻斌教授团队研发出简捷高机动轮腿复合式机器人Jun 08, 2023 am 10:15 AM

人类自古以来就梦想着能够研发出可适应多种野外地形的移动机构。轮式移动平台具有较好的运动平稳性和移动效率,但难以在崎岖地形中行进;腿足式机器人具有较好的地形适应能力和移动灵活性,但其运动稳定性和能效有待提高。为融合轮式移动和腿足移动的优势,轮腿复合式移动机构应用而生。常见的轮腿复合机构主要包括异形轮(如RHex)、辐条轮(如Whegs)、变形轮(如OmniWheg)、轮腿串联(如Wheeled-ANYmal)等,如图X所示。图1常见轮腿复合式机器人近日,山东大学李贻斌教授团队联合日本立命馆大学马书

条形统计图用什么呈现数据条形统计图用什么呈现数据Jan 20, 2021 pm 03:31 PM

条形统计图用“直条”呈现数据。条形统计图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按一定的顺序排列起来;从条形统计图中很容易看出各种数量的多少。条形统计图分为:单式条形统计图和复式条形统计图,前者只表示1个项目的数据,后者可以同时表示多个项目的数据。

自动驾驶车道线检测分类的虚拟-真实域适应方法自动驾驶车道线检测分类的虚拟-真实域适应方法Apr 08, 2023 pm 02:31 PM

arXiv论文“Sim-to-Real Domain Adaptation for Lane Detection and Classification in Autonomous Driving“,2022年5月,加拿大滑铁卢大学的工作。虽然自主驾驶的监督检测和分类框架需要大型标注数据集,但光照真实模拟环境生成的合成数据推动的无监督域适应(UDA,Unsupervised Domain Adaptation)方法则是低成本、耗时更少的解决方案。本文提出对抗性鉴别和生成(adversarial d

苹果研发(北京)有限公司专利揭示革命性电子设备:可卷曲显示器现身苹果研发(北京)有限公司专利揭示革命性电子设备:可卷曲显示器现身Jul 17, 2023 pm 01:13 PM

7月14日消息,苹果研发(北京)有限公司最新公布的专利显示,他们正在研发一款具备可卷曲显示器的电子设备。这项专利描述了一种电子设备,其主要特点是采用了可卷曲的显示器和透明保护层。显示器具备像素阵列用于生产图像,而透明保护层与像素阵列重叠。这款显示器可以在展开状态下保持平面,也可以卷起来以存储。透明保护层可能包含玻璃层,玻璃层在可卷曲部分可以局部变薄,以促进显示器的卷曲。此外,当显示器在卷曲操作期间弯曲时,面向外的玻璃表面中的压缩应力可以有效防止对显示器的损坏。根据工商信息,苹果研发(北京)有限公

数据通信中的信道传输速率单位是bps,它表示什么数据通信中的信道传输速率单位是bps,它表示什么Jan 18, 2021 pm 02:58 PM

数据通信中的信道传输速率单位是bps,它表示“位/秒”或“比特/秒”,即数据传输速率在数值上等于每秒钟传输构成数据代码的二进制比特数,也称“比特率”。比特率表示单位时间内传送比特的数目,用于衡量数字信息的传送速度;根据每帧图像存储时所占的比特数和传输比特率,可以计算数字图像信息传输的速度。

See all articles

Hot AI Tools

Undresser.AI Undress

Undresser.AI Undress

AI-powered app for creating realistic nude photos

AI Clothes Remover

AI Clothes Remover

Online AI tool for removing clothes from photos.

Undress AI Tool

Undress AI Tool

Undress images for free

Clothoff.io

Clothoff.io

AI clothes remover

AI Hentai Generator

AI Hentai Generator

Generate AI Hentai for free.

Hot Article

R.E.P.O. Energy Crystals Explained and What They Do (Yellow Crystal)
2 weeks agoBy尊渡假赌尊渡假赌尊渡假赌
Repo: How To Revive Teammates
4 weeks agoBy尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Adventure: How To Get Giant Seeds
4 weeks agoBy尊渡假赌尊渡假赌尊渡假赌

Hot Tools

VSCode Windows 64-bit Download

VSCode Windows 64-bit Download

A free and powerful IDE editor launched by Microsoft

SublimeText3 Linux new version

SublimeText3 Linux new version

SublimeText3 Linux latest version

Notepad++7.3.1

Notepad++7.3.1

Easy-to-use and free code editor

EditPlus Chinese cracked version

EditPlus Chinese cracked version

Small size, syntax highlighting, does not support code prompt function

Zend Studio 13.0.1

Zend Studio 13.0.1

Powerful PHP integrated development environment