検索
ホームページデータベースmysql チュートリアルHadoop 新特性、改进、优化和Bug分析系列1:YARN-378

Hadoop 新特性、改进、优化和Bug分析系列1:YARN-378

Jun 07, 2016 pm 04:30 PM
bughadoop最適化分析する改善する新機能特性シリーズ

作者: Dong | 新浪微博: 西成懂 | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明 网址:http://dongxicheng.org/mapreduce-nextgen/hadoop-jira-yarn-378/ 本博客的文章集合:http://dongxicheng.org/recommend/ 重大消息:我的Hadoop新


重大消息:我的Hadoop新书《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》已经开始在各大网站销售了,购书链接地址: 当当购书网址,京东购书网址,卓越购书网址。新书官方宣传主页: http://hadoop123.com/。

Hadoop jira链接:https://issues.apache.org/jira/browse/YARN-378
所属范围(新特性、改进、优化或Bug):改进
修复版本:2.1.0-beta及以上版本
所属分支(Common、HDFS、YARN或MapReduce):YARN
涉及模块:client, resourcemanager
英文标题:“ApplicationMaster retry times should be set by Client”

1. ?背景介绍

在Hadoop分支YARN中,当用户提交应用程序后(提交到ResourceManager上),ResourceManager首先要做的是为该应用程序申请资源以启动它的ApplicationMaster,而ApplicationMaster启动后,它(ApplicationMaster)负责应用程序内部任务的分解,监控、容错等。对于每个应用程序,由于只有一个ApplicationMaster,因此ApplicationMaster存在单点故障问题,一旦ApplicationMaster死掉,则整个应用程序可能会运行失败。当ResourceManager探测到ApplicationMaster运行失败(通过心跳超时机制)后,它会尝试在另外一个节点上重新启动该ApplicationMaster,通常而言,ApplicationMaster重启后,会恢复之前的运行状态(前提是ApplicationMaster上次死掉之前会记录一些日志在HDFS上),当然,这是ApplicationMaster自己的事情,ResourceManager无权干涉,ResourceManager要做的只是发现ApplicationMaster死亡后,重新为它申请资源在另外一个节点上启动。而本文介绍的这个特性则是如何指定每个应用程序ApplicationMaster的重试次数。

在2.1.0-beta版本之前,所有应用程序的ApplicationMaster重试次数是均是由ResourceManager决定的,管理员可通过配置参数yarn.resourcemanager.am.max-retries配置每个ApplicationMaster的重试次数,这个配置参数值适用于所有的应用程序,不可单独对单个应用程序定制化,而这个改进正是为了解决这个问题。

2. 解决思路

首先需要明确的是,这个改进的目的是,让用户可以为自己的应用程序定制ApplicationMaster的重试次数。

其次,这个重试次数将被两个组件用到,分别是ResourceManager和ApplicationMaster,其中ResourceManager用于决定,是否对失败的ApplicationMaster进行重试;ApplicationMaster用于决定,是否需要恢复上次运行时的状态(从第二次开始恢复),以从断点开始计算。

通常而言,有点经验的人,可能认为可以这样解决问题:将用户设置的值放到Configuration中,通过job.xml传递到ResourceManager和ApplicationMaster上,这样改动是最小的。但是很遗憾,客户端传递的job.xml只有ApplicationMaster会读取,而ResourceManager不会。

YARN 2.1.0-beta版本的解决方案如下:

(1) 客户端设置重试次数后,该值将被写入ProtocolBuffer对象ApplicationSubmissionContextProto中的新增字段maxAppAttempts中(在hadoop-yarn-project/hadoop-yarn/hadoop-yarn-api/src/main/proto/yarn_protos.proto中定义);

(2) 客户端提交应用程序后,maxAppAttempts值会通过RPC函数传递给ResourceManager;

(3)ResourceManager判断maxAppAttempts是否为0,如果为0,则改为ResourceManager内部已经设置好全局值,由属性arn.resourcemanager.am.max-attempts指定,默认为1;

(4)ResourceManager为ApplicationMaster申请资源后,与对应的节点通信启动ApplicationMaster,启动之前,会将maxAppAttempts值通过环境变量“MAX_APP_ATTEMPTS”传递给它

(5) ApplicationMaster在main函数中读取环境变量MAX_APP_ATTEMPTS,然后开始执行。

这样,各个应用程序可根据实际需要单独向用户提供可配置AM尝试次数的参数,比如MapReduce的参数是mapreduce.am.max-attempts,用户设置了该参数后,参数值会经过以上5个步骤进行传递。

3. ?我们学到了什么

(1)善用环境变量传递信息,环境变量可由父进程传递给子进程;

(2)在YARN中,代码改动通常是链式的,也就是说,需要依次改动几个组件,比如该例子中,需要一次改动client、ResourceManager和ApplicationMaster的代码,改动代码之前,要规划好修改方案和估算好代码的改动幅度;

(3)当需要添加一种新的ApplicationMaster相关的可配置参数时,可仿照这个jira实现完成,比如,假设让ApplicationMaster支持多种容错机制(现在不支持),其中一种是ApplicationMaster死掉后,尽量尝试在原节点重启(通常,ApplicationMaster中运行的是服务时,需要这么做),而这样改动之后,需要用户指定应用程序采用的容错机制类别。

原创文章,转载请注明: 转载自董的博客

本文链接地址: http://dongxicheng.org/mapreduce-nextgen/hadoop-jira-yarn-378/

作者:Dong,作者介绍:http://dongxicheng.org/about/

本博客的文章集合:http://dongxicheng.org/recommend/


Copyright © 2013
This feed is for personal, non-commercial use only.
The use of this feed on other websites breaches copyright. If this content is not in your news reader, it makes the page you are viewing an infringement of the copyright. (Digital Fingerprint:
)
声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
MySQLの場所:データベースとプログラミングMySQLの場所:データベースとプログラミングApr 13, 2025 am 12:18 AM

データベースとプログラミングにおけるMySQLの位置は非常に重要です。これは、さまざまなアプリケーションシナリオで広く使用されているオープンソースのリレーショナルデータベース管理システムです。 1)MySQLは、効率的なデータストレージ、組織、および検索機能を提供し、Web、モバイル、およびエンタープライズレベルのシステムをサポートします。 2)クライアントサーバーアーキテクチャを使用し、複数のストレージエンジンとインデックスの最適化をサポートします。 3)基本的な使用には、テーブルの作成とデータの挿入が含まれ、高度な使用法にはマルチテーブル結合と複雑なクエリが含まれます。 4)SQL構文エラーやパフォーマンスの問題などのよくある質問は、説明コマンドとスロークエリログを介してデバッグできます。 5)パフォーマンス最適化方法には、インデックスの合理的な使用、最適化されたクエリ、およびキャッシュの使用が含まれます。ベストプラクティスには、トランザクションと準備された星の使用が含まれます

MySQL:中小企業から大企業までMySQL:中小企業から大企業までApr 13, 2025 am 12:17 AM

MySQLは、中小企業に適しています。 1)中小企業は、顧客情報の保存など、基本的なデータ管理にMySQLを使用できます。 2)大企業はMySQLを使用して、大規模なデータと複雑なビジネスロジックを処理して、クエリのパフォーマンスとトランザクション処理を最適化できます。

Phantomの読み取りとは何ですか?Innodbはどのようにそれらを防ぐ(次のキーロック)?Phantomの読み取りとは何ですか?Innodbはどのようにそれらを防ぐ(次のキーロック)?Apr 13, 2025 am 12:16 AM

INNODBは、次のキーロックメカニズムを通じてファントムの読み取りを効果的に防止します。 1)Next-KeyLockingは、Row LockとGap Lockを組み合わせてレコードとギャップをロックして、新しいレコードが挿入されないようにします。 2)実際のアプリケーションでは、クエリを最適化して分離レベルを調整することにより、ロック競争を削減し、並行性パフォーマンスを改善できます。

mysql:プログラミング言語ではありませんが...mysql:プログラミング言語ではありませんが...Apr 13, 2025 am 12:03 AM

MySQLはプログラミング言語ではありませんが、そのクエリ言語SQLにはプログラミング言語の特性があります。1。SQLは条件付き判断、ループ、可変操作をサポートします。 2。ストアドプロシージャ、トリガー、機能を通じて、ユーザーはデータベースで複雑な論理操作を実行できます。

MySQL:世界で最も人気のあるデータベースの紹介MySQL:世界で最も人気のあるデータベースの紹介Apr 12, 2025 am 12:18 AM

MySQLはオープンソースのリレーショナルデータベース管理システムであり、主にデータを迅速かつ確実に保存および取得するために使用されます。その実用的な原則には、クライアントリクエスト、クエリ解像度、クエリの実行、返品結果が含まれます。使用法の例には、テーブルの作成、データの挿入とクエリ、および参加操作などの高度な機能が含まれます。一般的なエラーには、SQL構文、データ型、およびアクセス許可、および最適化の提案には、インデックスの使用、最適化されたクエリ、およびテーブルの分割が含まれます。

MySQLの重要性:データストレージと管理MySQLの重要性:データストレージと管理Apr 12, 2025 am 12:18 AM

MySQLは、データストレージ、管理、クエリ、セキュリティに適したオープンソースのリレーショナルデータベース管理システムです。 1.さまざまなオペレーティングシステムをサポートし、Webアプリケーションやその他のフィールドで広く使用されています。 2。クライアントサーバーアーキテクチャとさまざまなストレージエンジンを通じて、MySQLはデータを効率的に処理します。 3.基本的な使用には、データベースとテーブルの作成、挿入、クエリ、データの更新が含まれます。 4.高度な使用には、複雑なクエリとストアドプロシージャが含まれます。 5.一般的なエラーは、説明ステートメントを介してデバッグできます。 6.パフォーマンスの最適化には、インデックスの合理的な使用と最適化されたクエリステートメントが含まれます。

なぜMySQLを使用するのですか?利点と利点なぜMySQLを使用するのですか?利点と利点Apr 12, 2025 am 12:17 AM

MySQLは、そのパフォーマンス、信頼性、使いやすさ、コミュニティサポートに選択されています。 1.MYSQLは、複数のデータ型と高度なクエリ操作をサポートし、効率的なデータストレージおよび検索機能を提供します。 2.クライアントサーバーアーキテクチャと複数のストレージエンジンを採用して、トランザクションとクエリの最適化をサポートします。 3.使いやすく、さまざまなオペレーティングシステムとプログラミング言語をサポートしています。 4.強力なコミュニティサポートを提供し、豊富なリソースとソリューションを提供します。

InnoDBロックメカニズム(共有ロック、排他的ロック、意図ロック、レコードロック、ギャップロック、次のキーロック)を説明します。InnoDBロックメカニズム(共有ロック、排他的ロック、意図ロック、レコードロック、ギャップロック、次のキーロック)を説明します。Apr 12, 2025 am 12:16 AM

INNODBのロックメカニズムには、共有ロック、排他的ロック、意図ロック、レコードロック、ギャップロック、次のキーロックが含まれます。 1.共有ロックにより、トランザクションは他のトランザクションが読み取らないようにデータを読み取ることができます。 2.排他的ロックは、他のトランザクションがデータの読み取りと変更を防ぎます。 3.意図ロックは、ロック効率を最適化します。 4。ロックロックインデックスのレコードを記録します。 5。ギャップロックロックインデックス記録ギャップ。 6.次のキーロックは、データの一貫性を確保するためのレコードロックとギャップロックの組み合わせです。

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

MantisBT

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

PhpStorm Mac バージョン

PhpStorm Mac バージョン

最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい