本文为您介绍如何使用数据传输迁移 OceanBase 数据库 Oracle 租户的数据至 Oracle 数据库。
如果数据迁移项目长期处于非活跃状态(项目状态为 失败 、 已暂停 或 已完成 ),受增量日志保留时长等影响,项目可能无法恢复。数据传输将主动释放处于非活跃状态超过 7 天的数据迁移项目,以回收相关资源,建议您为项目配置告警并及时处理项目相关异常。
背景信息
在数据传输控制台创建从 OceanBase 数据库 Oracle 租户迁移数据至 Oracle 数据库的数据迁移项目,您可以通过结构迁移、全量迁移和增量同步,无缝迁移源端数据库中的存量业务数据和增量数据至 Oracle 数据库。
数据传输支持将多个 OceanBase 数据库 Oracle 租户的表数据汇聚至 Oracle 数据库的同一张表中,其中无需结构迁移,只需要进行全量迁移和增量同步。该汇聚同步功能的使用限制如下:
-
对于全量迁移和增量同步,源端有的列,目标端必须有。如果不满足该要求,数据传输会报错。
-
主键列在源端表中必须存在。
-
目标表中的列,可以存在源端不存在的列。
前提条件
-
数据传输已具备云资源访问权限。详情请参见 数据传输迁移角色授权 。
-
已在目标端 Oracle 数据库创建对应的 Schema。
-
已为源端 OceanBase 数据库 Oracle 租户和目标端 Oracle 数据库创建专用于数据迁移项目的数据库用户,并为其赋予了相关权限。详情请参见 创建数据库用户 。
-
如果您需要迁移无主键表,执行数据迁移项目前,请在相应租户中创建
__OCEANBASE_INNER_DRC_USER
用户并赋予其权限。详情请参见 创建 __OCEANBASE_INNER_DRC_USER 用户 。
使用限制
-
源端数据库的操作限制
请勿在结构迁移和全量迁移阶段执行库或表结构变更的 DDL 操作,否则可能造成数据迁移项目中断。
-
数据传输支持的 Oracle 数据库版本为 10G/11G/12C/18C/19C,12C 及之后版本包含数据库容器(Container Database,CDB)和可插拔数据库(Pluggable Database,PDB)。
-
数据传输不支持表中全部列均为 LOB 类型(BLOB/CLOB/NCLOB)的增量数据迁移。
-
数据传输不支持迁移 OceanBase 数据库 Oracle 租户的非模板化二级分区表至 Oracle 数据库。
-
数据传输暂不支持基于表达式的索引。
-
数据传输仅支持有主键表的多表汇聚。
-
数据传输仅支持迁移库名、表名和列名为 ASCII 码且不包含特殊字符(包括换行、空格,以及 .|"'`()=;/&\)的对象。
-
目标端是数据库的情况下,数据传输不支持目标端存在触发器(Trigger)。如果存在,可能导致数据迁移失败。
-
数据源标识和用户账号等,在数据传输系统内是全局唯一的。
-
Oracle 数据库 11G 及之前版本不支持创建超过 30 个字节的数据库对象。请注意迁移 OceanBase 数据库 Oracle 租户的数据至 Oracle 数据库时,不能在源端创建大于本限制的数据库对象。
注意事项
-
OceanBase 数据库 Oracle 租户至 Oracle 数据库的反向增量场景下,请注意以下问题:
-
当需要进行 Oracle 数据库的增量同步时,Oracle 数据库单个归档文件的大小建议小于 2GB。
-
Oracle 数据库的归档文件保存 2 天以上,否则由于某个时间段归档量陡增等情况,准备恢复时没有了归档文件,将无法恢复。
-
Oracle 数据库的增量日志解析最大支持 5T/天。
-
OceanBase 数据库 Oracle 租户至 Oracle 数据库 12C 及之后版本的反向增量步骤,数据传输不支持迁移超过 30 个字节的数据库对象(包括 Schema、表和列等)。如果您需要迁移超过 30 个字节的数据库对象,请联系技术支持人员。
-
数据传输不支持 Oracle 数据库执行某些
UPDATE
命令。以下示例为一个不支持的UPDATE
命令。UPDATE TABLE_NAME SET KEY=KEY+1;
上述示例中,
TABLE_NAME
是表名,KEY
是定义为主键的 NUMERIC 类型的列。 -
对于无主键且包含 LOB 类型字段的表,反向增量会出现数据质量问题。
-
-
对于 OceanBase 数据库 V4.x,强烈建议您开启归档日志。开启归档日志后,如果 Clog 被回收,数据传输仍然可以通过消费归档日志来实现增量同步能力。
-
如果源端字符集为 UTF-8,建议目标端使用兼容源端的字符集(例如,UTF-8、UTF-16 等),避免产生因字符集不兼容导致目标端出现乱码等问题。
-
节点之间的时钟不同步,或者电脑终端和服务器之间的时钟不同步,均可能导致延迟时间(增量同步/反向增量)不准确。
例如,如果时钟早于标准时间,可能导致延迟时间为负数。如果时钟晚于标准时间,可能导致延迟。
-
支持 Oracle 字符集和 OceanBase 数据库 Oracle 租户不同场景下,字段长度根据数据迁移项目的具体情况选择策略。
-
迁移无主键表时,通过在目标端新增隐藏列进行迁移。但是如果目标端是 Oracle 数据库 12C 之前的版本,则通过在目标端增加非隐藏列的方式进行迁移。
-
如果源端表包含字段名
OMS_PK_INCRMT
,则增量同步任务中断且无法恢复。 -
在未开启同步 DDL 的情况下,如果您变更目标端的唯一索引,需要重新启动数据迁移项目,否则可能存在数据不一致的问题。
-
如果数据迁移项目未启用正向切换,请删除目标端数据库对应的唯一索引和伪列。如果不删除唯一索引和伪列,会导致无法写入数据,以及往下游导入数据时,会重新生成伪列,导致与源端数据库的伪列发生冲突。
如果数据迁移项目已启用正向切换,数据传输会根据数据迁移项目的类型,自动删除隐藏列和唯一索引。详情请参见 数据迁移服务隐藏列机制说明 。
-
库表汇聚场景下:
-
建议您使用导入对象或匹配规则的方式映射源端和目标端的关系。
-
建议您自行在目标端创建表结构。如果使用数据传输创建,请在结构迁移步骤跳过部分失败对象。
-
-
请检查 OceanBase 数据库 Oracle 租户回收站内的对象。当对象大于 100 时,容易造成内部表查询超时,请进行回收站的对象清理工作。
-
检查回收站是否打开。
SELECT Value FROM V$parameter WHERE Name = 'recyclebin';
-
检查回收站内对象的数量。
SELECT count(*) FROM RECYCLEBIN;
-
-
如果您在迁移过程中,跳过 "源端-主库-数据库 ROW_MOVEMENT 检查" 预检查项,同步
ROW_MOVEMENT
为enable
的表,会出现数据不一致的情况。 -
在源端为 OceanBase 数据库并开启同步 DDL 的数据迁移项目中,如果源端库表发生重命名(RENAME)操作,建议您重新启动项目,以避免增量同步丢失数据。
-
如果创建数据迁移项目时,您仅配置了 增量同步 ,数据传输要求源端数据库的本地增量日志保存 48 小时以上。
如果在创建数据迁移项目时,您配置了 全量迁移 + 增量同步 ,数据传输要求源端数据库的本地增量日志至少保留 7 天以上。否则数据传输可能因无法获取增量日志而导致数据迁移项目失败,甚至导致源端和目标端数据不一致。
支持的源端和目标端实例类型
下表中,OceanBase 数据库 Oracle 租户简称为 OB_Oracle。
源端 |
目标端 |
OB_Oracle(OceanBase 集群实例) |
Oracle(VPC 内自建数据库) |
OB_Oracle(OceanBase 集群实例) |
Oracle(公网 IP 自建数据库) |
数据类型映射
OceanBase 数据库 Oracle 租户 |
Oracle 数据库 |
CHAR(n CHAR) |
CHAR(n CHAR) |
CHAR(n BYTE) |
CHAR(n BYTE) |
NCHAR(n) |
NCHAR(n) |
NCHAR(n BYTE) |
NCHAR(n) |
VARCHAR2(n) |
VARCHAR2(n) |
NVARCHAR2(n) |
NVARCHAR2(n) |
NVARCHAR2(n BYTE) |
NVARCHAR2(n) |
NUMBER(n) |
NUMBER(n) |
NUMBER(p, s) |
NUMBER(p,s) |
RAW |
RAW |
CLOB |
CLOB |
BLOB |
BLOB |
FLOAT(n) |
FLOAT (n) |
BINARY_FLOAT |
BINARY_FLOAT |
BINARY_DOUBLE |
BINARY_DOUBLE |
DATE |
DATE |
TIMESTAMP |
TIMESTAMP |
TIMESTAMP WITH TIME ZONE |
TIMESTAMP WITH TIME ZONE |
TIMESTAMP WITH LOCAL TIME ZONE |
TIMESTAMP WITH LOCAL TIME ZONE |
INTERVAL YEAR(p) TO MONTH |
INTERVAL YEAR(p) TO MONTH |
INTERVAL DAY(p) TO SECOND |
INTERVAL DAY(p) TO SECOND |
ROWID |
ROWID |
UROWID |
UROWID |
创建数据迁移项目
-
登录 OceanBase 管理控制台 ,购买数据迁移项目。
详情请参见 购买数据迁移项目 。
-
在 数据传输 > 数据迁移 页面,单击新购买的数据迁移项目后的 配置 。
如果您需要引用已有的项目配置信息,可以单击 引用配置 。详情请参见 引用和清空数据迁移项目配置 。
-
在 选择源和目标 页面,配置各项参数。
参数
描述
迁移项目名称
建议使用中文、数字和字母的组合。名称中不能包含空格,长度不能超过 64 个字符。
标签(可选)
单击文本框,在下拉列表中选择目标标签。您也可以单击 管理标签 ,进行新建、修改和删除。详情请参见 通过标签管理数据迁移项目 。
源端
如果您已新建 OceanBase 数据库 Oracle 租户数据源,请从下拉列表中进行选择。如果未新建,请单击下拉列表中的 新建数据源 ,在右侧对话框进行新建。参数详情请参见 新建 OceanBase 数据源 。
重要源端仅支持 OceanBase 数据库 Oracle 租户的 实例类型 为 OceanBase 集群实例 。
目标端
如果您已新建 Oracle 数据源,请从下拉列表中进行选择。如果未新建,请单击下拉列表中的 新建数据源 ,在右侧对话框进行新建。参数详情请参见 新建 Oracle 数据源 。
-
单击 下一步 。在 选择迁移类型 页面,选择当前数据迁移项目的迁移类型。
迁移类型 包括 结构迁移 、 全量迁移 、 增量同步 、 全量校验 和 反向增量 。
迁移类型
描述
结构迁移
结构迁移任务开始后,数据传输会迁移源库中的数据对象定义(表、索引、约束、注释和视图等)至目标端数据库中,并自动过滤临时表。
全量迁移
全量迁移任务开始后,数据传输会迁移源库表的存量数据至目标端数据库对应的表中。如果选择 全量迁移 ,建议您在迁移数据前,收集 OceanBase 数据库 Oracle 租户的统计信息。
增量同步
增量同步任务开始后,数据传输会同步源端数据库发生变化的数据(新增、修改或删除)至目标端数据库对应的表中。
增量同步 包括 DML 同步 和 DDL 同步 ,您可以根据需求进行自定义配置。详情请参见 自定义配置 DDL/DML 。 增量同步 的使用限制如下:
-
如果您选择了 DDL 同步 ,当源端数据库发生数据传输未支持的同步 DDL 操作时,会存在数据迁移中断的风险。
-
如果 DDL 操作为新增列,建议您设置该列的属性为 Null,否则会存在数据迁移中断的风险。
全量校验
在全量迁移完成、增量数据同步至目标端并与源端基本追平后,数据传输会自动发起一轮针对源端数据库配置的数据表和目标表的全量数据校验任务。
-
如果选择 全量校验 ,建议您在全量校验开始前,收集 OceanBase 数据库 Oracle 租户的统计信息,并使用
GATHER_SCHEMA_STATS
或GATHER_TABLE_STATS
语句收集 Oracle 数据库的统计信息。 -
如果您选择了 增量同步 ,且 DML 同步 选项中未选择所有的 DML,则数据传输不支持本场景下的全量数据校验。
反向增量
反向增量任务开始后,可以实时将业务切换后在目标端数据库产生的变更数据回流至源端数据库。
通常反向增量会复用增量同步的配置,您也可以根据实际需求进行自定义配置。
-
-
单击 下一步 。在 选择迁移对象 页面,选择当前数据迁移项目的迁移对象。
您可以通过 指定对象 和 匹配规则 两个入口选择迁移对象。
重要-
待迁移的表名和其中的列名不能包含中文字符。
-
当数据库的库名或表名存在“$$”字符时,会影响数据迁移项目的创建。
-
通过 指定对象 的方式选择迁移对象后,DDL 操作仅对已选择的对象生效,不支持创建新表。
-
选择 指定对象 ,在左侧选中需要迁移的对象,单击 > ,将其添加至右侧列表中。您可以选择一个或多个库的表、视图作为迁移对象。
数据传输支持通过文本导入对象,并支持对目标端对象进行重命名、设置行过滤、查看列信息,以及移除单个或全部迁移对象等操作。
说明通过 匹配规则 方式选择迁移对象时,重命名能力由匹配规则语法覆盖,操作处仅支持设置过滤条件。详情请参见 配置匹配规则 。
操作
步骤
导入对象
-
在选择区域的右侧列表中,单击右上角的 导入对象 。
-
在对话框中,单击 确定 。
重要导入会覆盖之前的操作选择,请谨慎操作。
-
在 导入迁移对象 对话框中,导入需要迁移的对象。
您可以通过导入 CSV 文件的方式进行库表重命名、设置行过滤条件等操作。详情请参见 下载和导入迁移对象配置 。
-
单击 检验合法性 。
完成迁移对象导入后,请先检验合法性。目前暂不支持列字段映射。
-
通过检验后,单击 确定 。
重命名
数据传输支持重命名迁移对象的名称,详情请参见 数据库库表重命名 。
设置
数据传输支持
WHERE
条件实现行过滤,详情请参见 SQL 条件过滤数据 。您还可以在 查看列 区域,查看迁移对象的列信息。
移除/全部移除
数据传输支持在数据映射时,对暂时选中到目标端的单个或多个对象进行移除操作。
-
移除单个迁移对象
在选择区域的右侧列表中,鼠标悬停至目标对象,单击显示的 移除 ,即可移除该迁移对象。
-
移除全部迁移对象
在选择区域的右侧列表中,单击右上角的 全部移除 。在对话框中,单击 确定 ,即可移除全部迁移对象。
-
-
选择 匹配规则 ,详情请参见 配置匹配规则 。
-
-
单击 下一步 。在 迁移选项 页面,配置各项参数。
-
全量迁移
在 选择迁移类型 页面,选中 全量迁移 ,才会显示下述参数。
参数
描述
读取并发配置
该参数用于配置全量迁移阶段从源端读取数据的并发数,最大限制为 512.并发数过高可能会造成源端压力过大,影响业务。
写入并发配置
该参数用于配置全量迁移阶段往目标端写入数据的并发数,最大限制为 512。并发数过高可能会造成目标端压力过大,影响业务。
全量迁移速率限制
您可以根据实际需求决定是否开启全量迁移速率限制。如果开启,请设置 RPS(全量迁移阶段每秒最多可以迁移至目标端的数据行数的最大值限制)和 BPS(全量迁移阶段每秒最多可以迁移至目标端的数据量的最大值限制)。
说明此处设置的 RPS 和 BPS 仅作为限速和限流能力,全量迁移实际可以达到的性能受限于源端、目标端、实例规格配置等因素的影响。
目标端表对象存在记录时处理策略
处理策略包括 忽略 和 停止迁移 :
-
选择 忽略 :当目标端表对象存在数据时,如果原数据与写入数据冲突,数据传输采用将冲突数据记录日志,保留原数据不变的策略进行数据写入。
重要选择 忽略 ,全量校验将使用 IN 模式拉取数据,无法校验目标端存在源端没有的数据的场景,并且校验性能会有一定程度降级。
-
选择默认值 停止迁移 :当目标端表对象存在数据时,全量迁移会报错不允许迁移,请处理好目标端数据后再继续迁移。
重要如果出错后单击恢复,数据传输将忽略该配置选项,继续迁移表数据,请谨慎操作。
是否允许索引后置
您可以设置是否允许全量数据迁移完成后再创建索引,索引后置功能能够缩短全量迁移耗时。选择索引后置的注意事项,请参见表格下方的说明。
重要-
在 选择迁移类型 页面同时选中 结构迁移 和 全量迁移 ,才会显示该参数。
-
仅非唯一键索引支持后置创建。
允许索引后置的情况下,建议您根据 OceanBase 数据库的硬件条件和当前业务流量情况,自行调节参数。
-
如果您使用的是 OceanBase 数据库 V4.x,请通过黑屏客户端工具调整以下 sys 租户参数和业务租户参数。
-
调整 sys 租户参数
// parallel_servers_target 用于设置每个 Server 上的并行查询排队条件。 // 如果完全为了性能,建议您将该参数调整为大于物理 CPU 的值,例如 1.5 倍。同时设置的值不超过 64,避免产生 OceanBase 数据库内核抢锁问题。 set global parallel_servers_target = 64;
-
调整业务租户参数
// 文件内存缓冲区限制 alter system set _temporary_file_io_area_size = '10' tenant = 'xxx'; // V4.x 关闭限流 alter system set sys_bkgd_net_percentage = 100;
-
-
如果您使用的是 OceanBase 数据库 V3.x ,请通过黑屏客户端工具调整以下 sys 租户参数。
// parallel_servers_target 用于设置每个 Server 上的并行查询排队条件。 // 如果完全为了性能,建议您将该参数调整为大于物理 CPU 的值,例如 1.5 倍。同时设置的值不超过 64,避免产生 OceanBase 数据库内核抢锁问题。 set global parallel_servers_target = 64; // data_copy_concurrency 用于设置系统中并发执行的数据迁移复制任务的最大并发数。 alter system set data_copy_concurrency = 200;
-
-
增量同步
在 选择迁移类型 页面,选中 增量同步 ,才会显示下述参数。
参数
描述
写入并发配置
该参数用于配置增量同步阶段往目标端写入数据的并发数,最大限制为 512。并发数过高可能会造成目标端压力过大,影响业务。
增量同步速率限制
您可以根据实际需求决定是否开启增量同步速率限制。如果开启,请设置 RPS(增量同步阶段每秒最多可以同步至目标端的数据行数的最大值限制)和 BPS(增量同步阶段每秒最多可以同步至目标端的数据量的最大值限制)。
说明此处设置的 RPS 和 BPS 仅作为限速限流能力,增量同步实际可以达到的性能受限于源端、目标端、实例规格配置等因素的影响。
增量同步起始位点
-
如果选择迁移类型时已选择 全量迁移 ,该参数不显示。
-
如果选择迁移类型时未选择 全量迁移 ,但选择了 增量同步 ,请在此处指定迁移某个时间节点之后的数据,默认为当前系统时间。详情请参见 设置增量同步位点 。
-
-
反向增量
在 选择迁移类型 页面,选中 增量同步 ,才会显示该区域的参数。反向增量的配置参数默认 复用增量同步配置 。
您也可以取消复用增量同步配置,根据实际需求进行配置。
参数
描述
写入并发配置
该参数用于配置反向增量阶段往源端写入数据的并发数,最大限制为 512。并发数过高可能会造成源端压力过大,影响业务。
增量同步速率限制
您可以根据实际需求决定是否开启增量同步速率限制。如果开启,请设置 RPS(反向增量同步阶段每秒最多可以同步至源端的数据行数的最大值限制)和 BPS(反向增量同步阶段每秒最多可以同步至源端的数据量的最大值限制)。
说明此处设置的 RPS 和 BPS 仅作为限速限流能力,反向增量同步实际可以达到的性能受限于源端、目标端、实例规格配置等因素的影响。
增量同步起始位点
默认以正向切换(如有)为准,不支持修改。
-
迁移高级配置
当源端 OceanBase 数据库为 V4.3.0 及之后版本,并且在 选择迁移类型 页面,选中 反向增量 > DDL 同步 ,才会显示该区域的参数。
源端表对象存储类型包括 默认 、 行存 、 列存 和 行列混存 ,该配置用于确定反向增量同步时源端表对象的存储类型。详情请参见 default_table_store_format 。
说明默认 选项是根据目标端参数配置自适应其他选项,是反向增量时增量 DDL 的新增表对象根据设置的存储类型写对应的结构。
-
-
单击 预检查 ,系统对数据迁移项目进行预检查。
在 预检查 环节,数据传输会检查数据库用户的读写权限、数据库的网络连接等是否符合要求。全部检查项目均通过后才能启动数据迁移项目。如果预检查报错:
-
您可以在排查并处理问题后,重新执行预检查,直至预检查成功。
-
您也可以单击错误预检查项操作列中的 跳过 ,会弹出对话框提示您跳过本操作的具体影响,确认可以跳过后,请单击对话框中的 确定 。
-
-
预检查成功后,单击 启动项目 。
如果您暂时无需启动项目,请单击 保存 。后续您只能在 迁移项目列表 页面手动启动项目或通过批量操作启动项目。批量操作的详情请参见 批量操作数据迁移项目 。
数据传输支持在数据迁移项目运行过程中修改迁移对象,详情请参见 查看和修改迁移对象 。数据迁移项目启动后,会根据选择的迁移类型依次执行,详情请参见 查看迁移详情 。