AI编程助手
AI免费问答

Data Guard环境做到Client的自动切换

  2016-06-07 17:36   1130浏览 原创

使用Data guard作为HA方案,要解决的一个问题在于:后台数据库发生了主备切换,client连接如何做到自动切到新的primary数据库上?

使用data guard作为ha方案,要解决的一个问题在于:后台数据库发生了主备切换,client连接如何做到自动切到新的primary数据库上?
 
如果做通用的方案,需要客户端自己提供自动重连的能力,这点大多数java的occi的连接池都有实现。
 
但这些已有实现大多是对同一连接配置发起重连,所以需要考虑为application提供透明的连接方式,而不让应用看到具体data guard的多个ip和service name,这就需要做些额外的配置工作。
 
    一种方式通过vip,真实转发的ip只挂靠在有效数据库的ip上。这种方式切换发生后,application在断连的旧connection上发起dml会获得ora-3113 "end of file on communication channel"的错误,此时application可以尝试重连机制和新的primary建立连接。
 
在f5上可以通过设置心跳sql和期望的返回结果内容,以类似ping方式获取远端数据库是否可用,来决定ip是否应该转发到该物理ip上。
 
    另一种方式是通过设置tns和数据库的service name来访问,通过合理设置,甚至可以做到在发生切换时的select操作仅仅被阻塞一会,而不会感觉到数据库已经完成了主备切换。
 
设置步骤如下:
 
 1.客户端的tnsnames.ora中tns配置成
 
myapp =
  (description =
  (address_list =
  (address = (protocol = tcp)(host = hosta)(port = 1521))
  (address = (protocol = tcp)(host = hostb)(port = 1521))
  )
  (connect_data =
  (service_name = myapp)
  )
  )
 
 
 
2.在primary数据库运行
 
 begin
  dbms_service.create_service("myapp","myapp");
 end;
 /
 begin
  dbms_service.start_service("myapp");
 end;
 /
 
 3.在primary数据库创建触发器:
 
create trigger myapptrigg after startup on database
 declare
  v_role varchar(30);
 begin
  select database_role into v_role from v$database;
  if v_role = "primary" then
  dbms_service.start_service("myapp");
  else
  dbms_service.stop_service("myapp");
  end if;
 end;
 /
 
解释下:这个方案的思路就是将两边的数据库的service name都设置成"myapp",当发生切换时,由触发器在数据库startup的时候把primary的实例以"myapp"的名字显示,而把standby的"myapp"服务名给停掉,这样任何时刻只有主节点显示名字为"myapp"的服务。
 
注意这里的plsql都是运行在primary,无需在standby上做任何设置,因为data guard会自动将变化同步到standby数据库。
 
通过在primary数据库运行下面程序,可以让客户端在做select的时候甚至意识不到数据库的切换:
 
begin
  dbms_service.modify_service
  ("myapp",
  failover_method => "basic",
  failover_type => "select",
  failover_retries => 200,
  failover_delay => 1);
 end;
 /
 
注意如果在切换时有comit的提交事务发生,还是会出现失误提交失败,要求回滚的情况。
 
 
 
下面tns是另一种配置方式(类似rac的failover配置思想),,使用这种方式,不需要在oracle server中运行任何plsql脚本,在description_list中的两个数据库甚至根本不需要处于data guard中,可以是任意两个数据库。driver会按顺序遍历list中的数据库,一直到能连接上为止。
 
myapp =
 (description_list=
  (load_balance=off)
  (failover=on)
  (description =(connect_timeout=5)(transport_connect_timeout=3)(retry_count=10)
    (address_list =
      (address = (protocol = tcp)(host = localhost)(port = 1521))
    )
    (connect_data =
      (service_name = myapp1)
    )
  )
  (description =(connect_timeout=5)(transport_connect_timeout=3)(retry_count=10)
    (address_list =
      (address = (protocol = tcp)(host = otherip)(port = 1521))
    )
    (connect_data =
      (service_name = myapp2)
    )
  )
 )
 
 
 
这种方式需要注意的地方:
 
1.jdbc必须走oci的方式,如果为jdbc:thin+tns方式,则会出现
 
exception in thread "main" java.lang.arrayindexoutofboundsexception: 545
  at oracle.net.nl.nvtokens.parsetokens(unknown source)
  at oracle.net.nl.nvfactory.createnvpair(unknown source)
 
其原因在于jdbc的driver本身无法识别这种格式的tns内容。
 
此时即使以jdbc:thin+tns的方式访问其他正常的tns也会一样抛出这个错误,因为这导致了jdbc根本无法正确解析整个tnsnames.ora文件。
 
而jdbc:oci实际上负责解析tnsnames.ora和处理通信的是依赖oci.lib,因此就不存在这个问题。
 
2.这种配置适用于任何依赖oci通信的客户端,包括oci,occi,一些基于它们的wrap库,以及pl/sql developer此类的工具软件。
 
3.注意如果连接的数据库组属于manually switch的模式,而不是fail down导致的切换,比如tns中的a数据库是mount状态,b是primary,而tns的列表顺序是先a后b,则会出现尽管客户端连a时,抛出ora-0133错误,但是不会按顺序去尝试连接b。
 
原因是在处理这个链接时,oci客户端会尝试通过listener和service建立连接。
 
如果listener是关闭的,或者客户端能连上listener但是找不到对应service,则都会尝试连接处于第二个的b,但是如果通过listener找到了对端的service,只是无法建立连接(如数据库处于mount状态),则此时不会尝试连接b,而直接会以抛出
 
ora-0133:oracle initialization or shutdown in progress
 
终止连接尝试。
 
所以在使用这种tns的时候要确保通过tns列表能访问到的所有数据库都不会一直处于mount状态,否则连接它会打断对后面正常open数据库的连接尝试。
 
这也是为何手动切换的dataguard数据库,客户端不能依赖这种tns配置方法做自动切换,因为手动切换的dataguard数据库状态肯定是一个open一个mount,如果mount处于tns的列表靠前的位置,在连接它失败后会抛出ora-0133异常阻止客户端尝试连接正常open的那个数据库。

推荐阅读:

RMAN 配置归档日志删除策略

Oracle基础教程之通过RMAN复制数据库

RMAN备份策略制定参考内容

RMAN备份学习笔记

Oracle数据库备份加密 RMAN加密

linux

声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。