腾讯TDW：大型Hadoop集群应用-Mysql Tutorial-php.cn

Home

Database

Mysql Tutorial

腾讯TDW：大型Hadoop集群应用

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 04:38 PM

hadoopLargeapplicationTencentcluster

PS：TDW是腾讯最大的离线数据处理平台。本文主要从需求、挑战、方案和未来计划等方面，介绍了TDW在建设单个大规模集群中采取的JobTracker分散化和NameNode高可用两个优化方案。 TDW（Tencent distributed Data Warehouse，腾讯分布式数据仓库）基于开源软件H

PS：TDW是腾讯最大的离线数据处理平台。本文主要从需求、挑战、方案和未来计划等方面，介绍了TDW在建设单个大规模集群中采取的JobTracker分散化和NameNode高可用两个优化方案。 TDW（Tencent distributed Data Warehouse，腾讯分布式数据仓库）基于开源软件Hadoop和Hive进行构建，打破了传统数据仓库不能线性扩展、可控性差的局限，并且根据腾讯数据量大、计算复杂等特定情况进行了大量优化和改造。 TDW服务覆盖了腾讯绝大部分业务产品，单集群规模达到4400台，CPU总核数达到10万左右，存储容量达到100PB；每日作业数100多万，每日计算量4PB，作业并发数2000左右；实际存储数据量80PB，文件数和块数达到6亿多；存储利用率83%左右，CPU利用率85%左右。经过四年多的持续投入和建设，TDW已经成为腾讯最大的离线数据处理平台。 TDW的功能模块主要包括：Hive、MapReduce、HDFS、TDBank、Lhotse等，如图1所示。TDW Core主要包括存储引擎HDFS、计算引擎MapReduce、查询引擎Hive，分别提供底层的存储、计算、查询服务，并且根据公司业务产品的应用情况进行了很多深度订制。TDBank负责数据采集，旨在统一数据接入入口，提供多样的数据接入方式。Lhotse任务调度系统是整个数据仓库的总管，提供一站式任务调度与管理。图1 TDW的功能模块建设单个大规模集群的原因随着业务的快速增长，TDW的节点数也在增加，对单个大规模Hadoop集群的需求也越来越强烈。TDW需要做单个大规模集群，主要是从数据共享、计算资源共享、减轻运营负担和成本等三个方面考虑。 1. 数据共享。TDW之前在多个IDC部署数十个集群，主要是根据业务分别部署，这样当一个业务需要其他业务的数据，或者需要公共数据时，就需要跨集群或者跨IDC访问数据，这样会占用IDC之间的网络带宽。为了减少跨IDC的数据传输，有时会将公共数据冗余分布到多个IDC的集群，这样又会带来存储空间浪费。 2. 计算资源共享。当一个集群的计算资源由于某些原因变得紧张时，例如需要数据补录时，这个集群的计算资源就捉襟见肘，而同时，另一个集群的计算资源可能空闲，但这两者之间没有做到互通有无。 3. 减轻运营负担和成本。十几个集群同时需要稳定运营，而且当一个集群的问题解决时，也需要解决其他集群已经出现的或者潜在的问题。一个Hadoop版本要在十几个集群逐一变更，监控系统也要在十几个集群上部署。这些都给运营带来了很大负担。此外，分散的多个小集群，资源利用率不高，机器成本较大。建设单个大规模集群的方案及优化面临的挑战 TDW从单集群400台规模建设成单集群4000台规模，面临的最大挑战是Hadoop架构的单点问题：计算引擎单点JobTracker负载重，使得调度效率低、集群扩展性不好；存储引擎单点NameNode没有容灾，使得重启耗时长、不支持灰度变更、具有丢失数据的风险。TDW单点瓶颈导致平台的高可用性、高效性、高扩展性三方面都有所欠缺，将无法支撑4000台规模。为了解决单点瓶颈，TDW主要进行了JobTracker分散化和NameNode高可用两方面的实施。 JobTracker分散化 1.单点JobTracker的瓶颈 TDW以前的计算引擎是传统的两层架构，单点JobTracker负责整个集群的资源管理、任务调度和任务管理，TaskTracker负责任务执行。JobTracker的三个功能模块耦合在一起，而且全部由一个Master节点负责执行，当集群并发任务数较少时，这种架构可以正常运行，但当集群并发任务数达到2000、节点数达到4000时，任务调度就会出现瓶颈，节点心跳处理迟缓，集群扩展也会遇到瓶颈。 2.JobTracker分散化方案 TDW借鉴YARN和Facebook版corona设计方案，进行了计算引擎的三层架构优化（如图2所示）：将资源管理、任务调度和任务管理三个功能模块解耦；JobTracker只负责任务管理功能，而且一个JobTracker只管理一个Job；将比较轻量的资源管理功能模块剥离出来交给新的称为ClusterManager的Master负责执行；任务调度也剥离出来，交给具有资源信息的ClusterManager负责执行；对性能要求较高的任务调度模块采用更加精细的调度方式。图2 JobTracker分散化架构新架构下三个角色分别是：ClusterManager负责整个集群的资源管理和任务调度，JobTracker负责单个Job的管理，TaskTracker负责任务的执行。（1）两路心跳。之前的架构下，TaskTracker向JobTracker上报心跳，JobTracker串行地处理这些心跳，心跳处理中进行节点管理、任务管理、任务调度等，心跳繁重，影响任务调度和集群扩展性。新架构下，心跳被拆分成两路心跳，分别上报任务和资源信息。 JobTracker获知任务信息通过任务上报心跳的方式。任务上报心跳是通过任务所在的TaskTracker启动一个新的独立线程向对应的JobTracker上报心跳这条途径，在同一个TaskTracker上，不同Job的任务使用不同的线程向不同的JobTracker上报心跳，途径分散，提升了心跳上报效率。 TaskTracker通过上报心跳的方式将资源信息汇报给ClusterManager。ClusterManager从TaskTracker的心跳中获取节点的资源信息：CPU数量、内存空间大小、磁盘空间大小等的总值和剩余值，根据这些信息判断节点是否还能执行更多的任务。同时，ClusterManager通过TaskTracker与其之间维系的心跳来管理节点的生死存亡。以前繁重的一路心跳被拆分成了两路轻量的心跳，心跳间隔由40s优化成1s，集群的可扩展性得到了提升。（2）资源概念。之前架构只有slot概念，一般根据核数来设置slot数量，对内存、磁盘空间等没有控制。新架构弱化了slot概念，加强了资源的概念。每个资源请求包括具体的物理资源需求描述，包括内存、磁盘和CPU等。向ClusterManager进行资源申请的有三种来源类型：Map、Reduce、JobTracker，每种来源需要的具体资源量不同。在CPU资源上，调度器仍然保留slot概念，并且针对三种来源保证各自固定的资源帽。例如，对于24核的节点，配置13个核给Map用、6个核给Reduce用、1个核给JobTracker用，则认为该节点上有1个JobTracker slot、13个Map slot、6个Reduce slot。某个Map请求的资源需要2个核，则认为需要两个Map slot，当一个节点的Map slot用完之后，即使有剩余的CPU，也不会继续分配Map予其执行了。内存空间、磁盘空间等资源没有slot概念，剩余空间大小满足需求即认为可以分配。在查找满足资源请求的节点时，会比较节点的这些剩余资源是否满足请求，而且还会优先选择负载低于集群平均值的节点。（3）独立并发式的下推调度。之前架构下，调度器采用的是基于心跳模型的拉取调度：任务调度依赖于心跳，Map、Reduce的调度耦合在一起，而且对请求优先级采取全排序方式，时间复杂度为nlog(n)，任务调度效率低下。新架构采用独立并发式的下推调度。Map、Reduce、JobTracker三种资源请求使用三个线程进行独立调度，对请求优先级采取堆排序的方式，时间复杂度为log(n)。当有资源满足请求时，ClusterManager直接将资源下推到请求者，而不再被动地等待TaskTracker通过心跳的方式获取分配的资源。例如，一个Job有10个Map，每个Map需要1个核、2GB内存空间、10GB磁盘空间，如果有足够的资源，Map调度线程查找到了满足这10个Map的节点列表，ClusterManager会把节点列表下推到JobTracker；如果Map调度线程第一次只查找到了满足5个Map的节点列表，ClusterManager会把这个列表下推到JobTracker，随后Map调度线程查找到了剩下5个Map的节点列表，ClusterManager再把这个列表下推到JobTracker。以前基于心跳模型的拉取调度被优化成独立并发式的下推调度之后，平均调度处理时间由80ms优化至1ms，集群的调度效率得到了提升。 3. Job提交过程新架构下，一次Job提交过程，需要Client和ClusterManager、TaskTracker均进行交互（如图3所示）：JobClient先向ClusterManager申请启动JobTracker所需要的资源；申请到之后，JobClient在指定的TaskTracker上启动JobTracker进程，将Job提交给JobTracker；JobTracker再向ClusterManager申请Map和Reduce资源；申请到之后，JobTracker将任务启动命令提交给指定的TaskTracker。图3 Job提交过程 4. 存在的问题及应对措施 JobTracker分散化方案给计算引擎带来高效性和高扩展性，但没有带来高可用性，单一故障点的问题在此方案中仍然存在，此时的单一故障点问题有别于以前，如下所述。（1）ClusterManager如果发生故障，不会造成Job状态丢失而且在短时间内即可恢复。它只存储资源情况，不存储状态，ClusterManager在很短的时间内可以重启完成。重启之后，TaskTracker重新向ClusterManager汇报资源，ClusterManager从重启至完全获得集群的资源情况整个阶段可以在10秒内完成。（2）JobTracker如果发生故障，只会影响单个Job，对其他Job不会造成影响。 [...]

原文地址：腾讯TDW：大型Hadoop集群应用, 感谢原作者分享。

Statement

The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn

腾讯dns地址是多少Feb 22, 2023 am 10:43 AM

腾讯dns地址是“119.29.29.29”；类似于其他公共DNS，如Google的“8.8.8.8”和114dns的“114.114.114.114”，可以为全网用户提供域名的公共递归解析服务。

qq是腾讯的吗Oct 09, 2022 am 11:34 AM

qq是腾讯的。QQ是1999年2月由腾讯公司推出的一款基于互联网的即时通信网络工具，其标志是一只戴着红色围巾的小企鹅；QQ支持在线聊天、视频通话、点对点断点续传文件、共享文件、网络硬盘、自定义面板、QQ邮箱等多种功能，并可与多种通讯终端相连。

腾讯宣布调整微信支付和视频号组织架构，加大对“直播带货”的投资Jan 12, 2024 pm 04:30 PM

根据科创板日报的报道，微信视频号正在加大对直播带货的资源投入，为此已经对微信支付和视频号两个团队的组织架构进行了调整据知情人士透露，腾讯的目的是为了实现微信支付和视频号的互通，希望两个团队能够合作共同努力。据称，这次调整计划于今年双11之前后开始，旨在将更多资源投入到“直播带货”领域根据本站查询结果显示，腾讯是一家著名的互联网公司，自成立以来已经多次进行组织架构调整，目前包括六大事业群和S线企业发展事业群（CDG）云与智慧产业事业群（CSIG）互动娱乐事业群（IEG）平台与内容事业群（PCG）技

提升用户体验：腾讯QQ NT桌面版内存优化再升级Aug 11, 2023 pm 04:57 PM

腾讯QQ桌面客户端近期进行了一系列重大改革，针对用户反馈的高内存占用、超大安装包和启动缓慢等问题，QQ技术团队在内存方面进行了专项优化，取得了一定进展据了解，新版QQ在内存方面面临几个主要挑战。首先，产品形态相对复杂，由一个大面板和多个独立功能窗口构成，窗口与渲染进程一一对应，窗口进程数量对Electron的内存占用产生影响。如果不能对这个复杂的大面板进行精细控制，很容易导致内存持续增加。其次，用户习惯长时间挂机，相对于Web页面，QQ用户可能会挂机一个月以上，因此需要控制内存使用，避免内存持续

腾讯获得杭州亚运会转播权，电竞项目将于9月24日开始Sep 16, 2023 am 09:05 AM

本站9月15日消息，今天是杭州第19届亚运会倒计时第8天，腾讯集团宣布与中央广播电视总台达成合作，成为杭州亚运会持权转播商。腾讯集团宣布，杭州亚运会将于2023年9月23日至10月8日举行。届时，用户可以通过腾讯视频、腾讯体育、腾讯新闻、腾讯网、微信、微视、王者营地、和平营地、掌上英雄联盟、虎牙直播等平台观看亚运会的所有比赛转播和回放值得一提的是，腾讯旗下4大竞技项目将作为正式竞赛项目登上本次亚运会舞台。据本站此前报道，杭州亚运会的电竞赛事赛程已经出炉，电子竞技将作为智力项目于9月24日开赛，连

一文带你了解腾讯自主研发的通用大语言模型——混元大模型Sep 12, 2023 pm 08:21 PM

2023年9月7日上午，在腾讯全球数字生态大会上，腾讯集团高级执行副总裁、腾讯云与智慧产业事业群CEO汤道生宣布，腾讯将进入“全面拥抱大模型”时代，并同时宣布，腾讯自主研发的通用大语言模型——混元，正式向产业亮相。根据腾讯官方表示，混元大模型的中文能力已经超过GPT3.5发布后混元大模型将作为腾讯云MaaS服务的底座，用户可以通过腾讯云官网进行体验，并且支持直接调用API接口，也可可以将混元作为基底模型，并在公有云上根据企业的实际需求进行自定义调整。一、混元大模型简介二、计费方面腾讯混元大模型将

微信和腾讯地图升级“小修小补引路行动”，全国首张“一刻钟便民生活圈地图”上线Nov 17, 2023 pm 02:45 PM

本站11月16日消息，微信和腾讯地图在今年发起了“小修小补引路行动”，展现出200多座城市的超50万家修补小店。在商务部指导下，“小修小补引路行动”全面升级，在微信搜一搜“小修小补”“修鞋”“修自行车”“裁缝”“修表”“修电器”“修锁”“配钥匙”“管道疏通”“修手机”等关键词，不仅可以直达小修小补便民主题地图，附近小店的信息都会直接标记出来，大大增加了小店的曝光率。“小修小补便民地图”小程序列出了每家小店的营业时间、具体地址以及联系电话等重要信息，方便用户更快找到小店。本站注意到，此前腾讯利用A

腾讯混元大模型正式亮相，我们抢先试了试它的生产力Sep 08, 2023 pm 07:57 PM

国内首批大型模型备案上周获批，开始向全社会开放服务，标志着大型模型进入了规模应用的新阶段。在之前发布应用的公司中，一些科技巨头似乎还没有行动在2023年9月7日，腾讯在腾讯全球数字生态大会上正式公开了混元大模型，并向外界开放了腾讯云作为一个超千亿参数的大模型，混元使用的预训练语料超过两万亿token，凭借多项独有的技术能力获得了强大的中文创作能力、复杂语境下的逻辑推理能力，以及可靠的任务执行能力。腾讯集团副总裁蒋杰表示：「腾讯混元大模型是从第一个token开始从零训练的，我们掌握了从模型算法到机

See all articles

Hot AI Tools

Undresser.AI Undress

AI-powered app for creating realistic nude photos

AI Clothes Remover

Online AI tool for removing clothes from photos.

Undress AI Tool

Undress images for free

Clothoff.io

AI clothes remover

AI Hentai Generator

Generate AI Hentai for free.

Hot Article

Repo: How To Revive Teammates

1 months agoBy尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Energy Crystals Explained and What They Do (Yellow Crystal)

2 weeks agoBy尊渡假赌尊渡假赌尊渡假赌

Hello Kitty Island Adventure: How To Get Giant Seeds

1 months agoBy尊渡假赌尊渡假赌尊渡假赌

How Long Does It Take To Beat Split Fiction?

4 weeks agoByDDD

R.E.P.O. Save File Location: Where Is It & How to Protect It?

4 weeks agoByDDD

Hot Tools

Dreamweaver Mac version

Visual web development tools

VSCode Windows 64-bit Download

A free and powerful IDE editor launched by Microsoft

MinGW - Minimalist GNU for Windows

This project is in the process of being migrated to osdn.net/projects/mingw, you can continue to follow us there. MinGW: A native Windows port of the GNU Compiler Collection (GCC), freely distributable import libraries and header files for building native Windows applications; includes extensions to the MSVC runtime to support C99 functionality. All MinGW software can run on 64-bit Windows platforms.