Apache Hadoop是一套用于在由通用硬件构建的大型集群上运行应用程序的框架。它实现了Map/Reduce编程范型,计算任务会被分割成小块(多次)运行在不同的节点上。
除此之外,它还提供了一款分布式文件系统(HDFS),数据被存储在计算节点上以提供极高的跨数据中心聚合带宽。
框架作用
Apache Hadoop大数据归属的新选择
物理DAS仍然是Apache Hadoop最好的存储介质,因为相关的高水平的专业和业务的公司的都是经过研究和实践来确定存储介质。但这样基于HDFS的Apache Hadoop数据储存却有很大的问题。
首先,默认方案是所有Apache Hadoop资料进行复制,移动,然后备份。HDFS是基于Apache Hadoop大数据块的I/O优化,省去了Apache Hadoop数据交互的时间。以后的使用通常意味着Apache Hadoop数据复制出来。尽管有本地快照,但他们并不完全一致或时间点不完全可恢复。
对于这些和其他原因,企业存储厂商聪明的将HDFS做改变,一些技术狂人类型的大数据专家使Apache Hadoop计算利用外部存储。但对许多企业来说,Apache Hadoop提供了一个很好的妥协:无需高维护存储或存储新的维护方式的适应,但这有一定的成本。
许多Apache Hadoop供应商,提供对Apache Hadoop集群远程HDFS的接口,是生意量比较大的Apache Hadoop企业首选。因为他们将是在isilon里,进行任何其他Apache Hadoop数据处理大数据的保护,其中包括Apache Hadoop安全和其他问题。另一个好处是,在外部存储的数据通常可以访问其他Apache Hadoop协议的储存,支持工作流和限制数据的传输和企业内需要的数据副本。Apache Hadoop也基于这样的原理处理大数据,一个大的数据参考架构,结合一个组合的存储解决方案,直接进入Apache Hadoop集群。
另外值得一提的是,虚拟化Apache Hadoop大数据分析。理论上,所有计算和存储节点可以都可以进行虚拟化。VMware和RedHat/OpenStack有Hadoop的虚拟化解决方案。然而,几乎所有的Apache Hadoop主机节点不能解决企业的存储问题。它模拟Apache Hadoop计算方面使企业把现有的数据集——SAN/NAS——加速和转储到它Apache Hadoop的HDFS的覆盖之下。在这种方式中,Apache Hadoop大数据分析可以做到一个数据中心的数据没有任何变动,从而使用新的Apache Hadoop存储架构和新的数据流或数据管理的所有变化。
大多数Apache Hadoop分布都是从近Apache Hadoop的开源HDFS(目前软件定义的存储大数据)开始,区别是Apache Hadoop采取了不同的方法。这基本上就是企业Apache Hadoop所需存储,从而建立自己的兼容存储层在Apache Hadoop HDFS上。MAPR版本是完全有能力处理I/O快照复制的支持,Apache Hadoop同时和原生支持的其他协议兼容,如NFS。Apache Hadoop也非常有效,并有助于主要提供企业业务智能应用程序,运行决策支持解决方案依赖于大数据的历史和实时信息。类似的想法,IBM已经出炉的高性能计算系统存储API为Apache Hadoop发行版作为一种替代HDFS
另一个Apache Hadoop有趣的解决方案可以帮助解决数据的问题。一个是dataguise,数据安全启动,能切实有效地保护Apache Hadoop的大数据集的一些独特的IP,Apache Hadoop可以在一个大的数据聚类自动识别和全局覆盖或加密敏感资料。水平线数据科学是这个领域的新兴技术,如果你连线登陆你的数据文件到Apache Hadoop,无论数据在哪里,即使是HDFS,Apache Hadoop都将自动储存。Apache Hadoop 大数据提供的产出物有助于快速建立商业应用,利用数据的来源和位置来统计商业所需的资料。
如果你一直持有Apache Hadoop的管理或企业数据中心存储的兴趣,这是一个好时机去update自己对Apache Hadoop大数据的了解,如果你想跟得上Apache Hadoop大数据的脚步,就不应该拒绝Apache Hadoop新技术的应用。
更多Apache相关技术文章,请访问Apache使用教程栏目进行学习!
以上是apache hadoop是什么的详细内容。更多信息请关注PHP中文网其他相关文章!

Apache在现代Web环境中仍然受欢迎的原因是其强大功能和灵活性。1)模块化设计允许定制功能,如安全认证和负载均衡。2)支持多操作系统,增强普及性。3)高效处理并发请求,适合各种应用场景。

Apache从开源项目发展为行业标准的原因包括:1)社区驱动,吸引全球开发者参与;2)标准化与兼容性,遵循互联网标准;3)商业支持与生态系统,获得企业级市场支持。

Apache对Webhosting的影响主要体现在其开源特性、强大功能和灵活性。1)开源特性降低了Webhosting的门槛。2)强大功能和灵活性使其成为大型网站和企业的首选。3)虚拟主机功能节省了成本。尽管在高并发情况下性能可能下降,但通过不断优化,Apache仍保持竞争力。

Apache起源于1995年,由一群开发者创建,旨在改进NCSAHTTPd服务器,成为全球最广泛使用的Web服务器。1.起源于1995年,旨在改进NCSAHTTPd服务器。2.定义了Web服务器标准,推动了开源运动的发展。3.孕育了Tomcat、Kafka等重要子项目。4.面临云计算和容器技术的挑战,未来将注重与云原生技术整合。

Apache通过提供稳定的Web服务器基础设施、推动开源文化和孵化重要项目,塑造了互联网。1)Apache提供了稳定的Web服务器基础设施,促进了Web技术的创新。2)Apache推动了开源文化的发展,ASF孵化了Hadoop、Kafka等重要项目。3)尽管面临性能挑战,Apache的未来依然充满希望,ASF不断推出新技术。

ApacheHTTPServer自1995年由志愿者创建以来,对Web服务器领域产生了深远影响。1.它源于对NCSAHTTPd不满,提供更稳定、可靠的服务。2.Apache软件基金会的成立标志其转变为生态系统。3.其模块化设计和安全性提升了Web服务器的灵活性和安全性。4.尽管市场份额下降,Apache仍与现代Web技术紧密联系。5.通过配置优化和缓存,Apache提升了性能。6.错误日志和调试模式帮助解决常见问题。

ApacheHTTPServer通过模块化设计、虚拟主机功能和性能优化,继续高效地服务于现代互联网环境中的Web内容。1)模块化设计允许添加如URL重写等功能,提升网站SEO性能。2)虚拟主机功能在一个服务器上托管多个网站,节省成本并简化管理。3)通过多线程处理和缓存优化,Apache能处理大量并发连接,提高响应速度和用户体验。

Apache在Web开发中的作用包括静态网站托管、动态内容服务、反向代理与负载均衡。1.静态网站托管:Apache配置简单,适合托管静态网站。2.动态内容服务:通过与PHP等结合,提供动态内容。3.反向代理与负载均衡:作为反向代理,分发请求到多个后端服务器,实现负载均衡。


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

Dreamweaver CS6
视觉化网页开发工具

PhpStorm Mac 版本
最新(2018.2.1 )专业的PHP集成开发工具

SecLists
SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

MinGW - 适用于 Windows 的极简 GNU
这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。