導讀 | 管理和維護RHCS集群是一個非常複雜和繁瑣的工作,要維護好一個RHCS集群,必須熟悉RHCS的基本運作原理,在集群管理方面,RHCS提供了兩種方式:即Luci圖形介面方式和命令列方式,這兒重點講述在命令列下如何管理RHCS叢集。 |
RHCS集群的核心流程有cman和rgmanager。要啟動集群,依序啟動cman,然後再啟動rgmanager,操作如下:
在主機web1上啟動叢集服務:
[root@web1 ~]# service cman start Starting cluster: Loading modules... done Mounting configs... done Starting ccsd... done Starting cman... done Starting qdiskd...done Starting daemons...done Starting fencing... done [ OK ]
等cman在其它節點成功啟動後,開始啟動rgmanager服務,具體操作如下:
[root@web1 ~]# service rgmanager start Starting Cluster Service Manager: [ OK ]關閉RHCS集群
與啟動叢集伺服器剛好相反,關閉RHCS叢集的命令如下:
[root@web1 ~]# service rgmanager stop [root@web1 ~]# service cman stop
有時在關閉cman服務時,可能會提示失敗,此時可以檢查本機的共享儲存GFS2檔案系統是否已經卸載,也可以檢查其它節點的rgmanager服務是否全部已經正常關閉。
管理應用程式服務叢集系統啟動後,預設會自動啟動應用程式服務,但是,如果某個應用程式服務沒有自動啟動,就需要手動來啟動。管理應用程式服務的命令是clusvcadm,透過這些指令可以啟動、關閉、重新啟動、切換叢集服務中德爾應用服務。
啟動某個應用程式#可以透過以下方式啟動某個節點上的應用程式服務,以啟動wrbserver為例:
[root@web1 ~]#clusvcadm -e webserver -m web1 Member web1 trying to enable service:webserver...Success service:webserver is now running on web1關閉某個應用程式
#可以透過以下方式關閉某個節點上的應用程式服務,以啟動mysqlserver為例:
[root@mysql1 ~]#clusvcadm -s mysqlserver -m web1 Member mysql1 stopping service:mysqlserver...Success重啟某個應用程式
#可以透過以下方式重啟某個節點上的應用程式服務,以啟動wrbserver為例:
[root@web2 ~]#clusvcadm -R wrbserver -m web1 Member web1 trying to restart service:wrbserver...Success
這個指令是在web2節點上執行的,也能將web1節點上的wrbserver進行重啟,由此可知,clusvcadm指令可以在叢集任意節點上執行都是可以的。
切換某個應用程式#可以透過以下方式切換某個節點上的應用程式服務,以在節點web1的服務切換到節點web2上為例:
[root@web1 ~]# clusvcadm -r wrbserver -m web2 Trying to relocate service:webserver to web2...Success service:webserver is now running on web2監控RHCS集群狀態
透過對RHCS的監控,有助於了解集群每個節點的健康狀態,發現問題並及時解決問題。 RHCS叢集提供了豐富的狀態檢視指令,這裡主要介紹cman_tool、clustat、ccs_tool的使用方法。
cman_tool指令cman_tool參數比較多,但使用方法比較簡單,這兒介紹兩個參數的使用方法:
[root@web1 ~]# cman_tool nodes -a Node Sts Inc Joined Name 0 M 0 2010-08-23 01:24:00 /dev/sdb7 1 M 2492 2010-08-23 01:22:43 web2 Addresses: 192.168.12.240 2 M 2492 2010-08-23 01:22:43 Mysql1 Addresses: 192.168.12.231 3 M 2492 2010-08-23 01:22:43 Mysql2 Addresses: 192.168.12.232 4 M 2488 2010-08-23 01:22:43 web1 Addresses: 192.168.12.230
此指令顯示了節點名稱,以及對應的節點IP位址和加入叢集的時間。
如果要了解更多叢集節點信息,可以透過以下命令:
[root@web1 ~]# cman_tool status Version: 6.2.0 Config Version: 35 #集群配置文件版本号 Cluster Name: mycluster #集群名称 Cluster Id: 56756 Cluster Member: Yes Cluster Generation: 2764 Membership state: Cluster-Member Nodes: 4 #集群节点数 Expected votes: 6 #期望的投票数 Quorum device votes: 2 #表决磁盘投票值 Total votes: 6 #集群中所有投票值大小 Quorum: 4 #集群法定投票值,低于这个值,集群将停止服务 Active subsystems: 9 Flags: Dirty Ports Bound: 0 177 Node name: web1 Node ID: 4 #本节点在集群中的ID号 Multicast addresses: 239.192.221.146 #集群广播地址 Node addresses: 192.168.12.230 #本节点对应的IP地址clustat指令
#clustat指令使用非常簡單,詳細的使用方法可以透過「clustat -h」來取得幫助訊息,這裡僅列舉幾個例子。
[root@web1 ~]#clustat -i 3 Cluster Status for mycluster @ Mon Aug 23 18:54:15 2010 Member Status: Quorate Member Name ID Status ------ ---- ---- ------ web2 1 Online, rgmanager Mysql1 2 Online, rgmanager Mysql2 3 Online, rgmanager web1 4 Online, Local, rgmanager /dev/sdb7 0 Online, Quorum Disk Service Name Owner (Last) State ------- ---- ----- ------ -------- service:mysqlserver Mysql1 started service:webserver web1 started
對輸出內容意義如下:
clustat的「-i」參數可以即時的顯示叢集系統中每個節點以及服務的運作狀態,「-i 3」表示每三秒刷新一次叢集狀態。
在這個輸出中,可以看到每個節點都處於“Online”狀態,表明每個節點都運行正常,如果某個節點退出了集群,對應的狀態應該是“Offline”,同時還可以看到,集群的兩個服務也處於「started」狀態,分別運行在Mysql1節點和web1節點。
另外,透過「ID」一列可以知道叢集節點的對應關係,例如,web2在此叢集中對應的就是「Node 1」節點,同理,web1對應的是「Node 4」節點。了解叢集節點順序有助於對叢集日誌的解讀。
ccs_tool主要用來管理叢集設定檔cluster.conf,透過ccs_tool可以在叢集中增加/刪除節點、增加/刪除fence設備、更新叢集設定檔等操作。
以下是ccs_tool的幾個應用實例:
當在一個節點修改完設定檔後,可以執行「ccs_tool update」指令將設定檔在所有節點進行更新,例如:
[root@web1 cluster]# ccs_tool update /etc/cluster/cluster.conf Proposed updated config file does not have greater version number. Current config_version :: 35 Proposed config_version:: 35 Failed to update config file.
ccs_tool是根据cluster.conf中的“config_version”值来决定是否进行更新的,因此在修改完cluster.conf文件后,一定要将cluster.conf的config_version值进行更新,这样执行ccs_tool时才能更新配置文件。
[root@web1 cluster]# ccs_tool update /etc/cluster/cluster.conf Config file updated from version 35 to 36 Update complete.
本文原创地址:https://www.linuxprobe.com/management-maintenance-rhcs.html作者:冯琪,审核员:苏西云
本文原创地址:https://www.linuxprobe.com/management-maintenance-rhcs.html编辑:public,审核员:暂无
以上是RHCS集群的管理與維護的詳細內容。更多資訊請關注PHP中文網其他相關文章!