当客户选择切换到GaussDB(DWS)数据库后可能会面临数据库的迁移任务,数据库迁移包括用户数据迁移和应用程序sql脚本迁移,其中,应用程序sql脚本迁移是一个复杂、高风险且耗时的过程。
DSC(Database Schema Convertor)是一款运行在Linux或Windows操作系统上的命令行工具,致力于向客户提供简单、快速、可靠的应用程序sql脚本迁移服务,通过内置的语法迁移逻辑解析源数据库应用程序sql脚本,并迁移为适用于GaussDB T、GaussDB A 和 DWS数据库的应用程序sql脚本。
DSC不需要连接数据库,可在离线模式下实现零停机迁移,迁移过程中还会显示迁移过程状态,并用日志记录操作过程中发生的错误,便于快速定位问题。
迁移对象
DSC支持迁移Teradata、Oracle、Netezza、MySQL、DB2数据库的对象有:
- Oracle、Teradata、Netezza、MySQL、DB2支持的通用对象:SQL模式,SQL查询
- 仅Oracle和Netezza支持的对象:PL/SQL
- 仅Teradata支持的对象:包含BTEQ和SQL_LANG脚本的Perl文件
迁移流程
DSC迁移sql脚本流程如下:
- 从Teradata或Oracle数据库导出待迁移的sql脚本到已安装了DSC的Linux或Windows服务器。
- 执行DSC命令进行语法迁移,命令中指定输入文件路径、输出文件路径以及日志路径。
- DSC自动将迁移后的sql脚本和日志信息归档在指定路径中
执行Oracle SQL迁移
执行以下命令设置源数据库、输入和输出文件夹路径、日志路径、应用程序语言和迁移类型:
Linux操作系统:
./runDSC.sh
--source-db Oracle
[--input-folder <input-script-path>]
[--output-folder <output-script-path>]
[--log-folder <log-path>]
[--application-lang Oracle]
[--conversion-type <conversion-type>]
Windows操作系统:
runDSC.bat
--source-db Oracle
[--input-folder <input-script-path>]
[--output-folder <output-script-path>]
[--log-folder <log-path>]
[--application-lang Oracle]
[--conversion-type <conversion-type>]
迁移不含PL/SQL语句的普通DDL语句(表、视图、索引、序列等)时,应使用Bulk模式(即,将conversion-type参数设为Bulk)。
以示例文件夹路径为例,将conversion-type参数设为Bulk,命令如下
Linux操作系统:
./runDSC.sh --source-db Oracle --input-folder /opt/DSC/DSC/input/oracle/ --output-folder /opt/DSC/DSC/output/ --log-folder /opt/DSC/DSC/log/ --application-lang SQL --conversion-type bulk --targetdb gaussdbA
Windows操作系统:
runDSC.bat --source-db Oracle --input-folder D:\test\conversion\input --output-folder D:\test\conversion\output --log-folder D:\test\conversion\log --application-lang SQL --conversion-type blogic --targetdb gaussdbA
在工具执行时,控制台上会显示迁移汇总信息,包括迁移进度和完成状态。执行信息和错误会录入日志文件。
********************** Schema Conversion Started *************************
DSC process start time : Mon Jan 20 17:24:49 IST 2020
Statement count progress 100% completed [FILE(1/1)]
Schema Conversion Progress 100% completed
**************************************************************************
Total number of files in input folder : 1
**************************************************************************
Log file path :....../DSC/DSC/log/dsc.log
DSC process end time : Mon Jan 20 17:24:49 IST 2020
DSC total process time : 0 seconds
********************* Schema Conversion Completed ************************
迁移含PL/SQL语句的函数、过程、包等对象时,应使用BLogic模式(即,将conversion-type参数设为BLogic)。
以示例文件夹路径为例,将conversion-type参数设为BLogic,命令如下:
java -jar migrationtool.jar --source-db Oracle --input-folder D:\test\migration\input --output-folder D:\test\migration\output --log-folder D:\test\migration\log --application-lang SQL --conversion-type blogic
在工具执行时,控制台上会显示迁移汇总信息,包括迁移进度和完成状态。执行信息和错误会录入日志文件。
********************** Schema Conversion Started *************************
DSC process start time : Mon Jan 20 17:24:49 IST 2020
Statement count progress 100% completed [FILE(1/1)]
Schema Conversion Progress 100% completed
**************************************************************************
Total number of files in input folder : 1
Total number of valid files in input folder : 1
**************************************************************************
Log file path :....../DSC/DSC/log/dsc.log
Error Log file :
DSC process end time : Mon Jan 20 17:24:49 IST 2020
DSC total process time : 0 seconds
********************* Schema Conversion Completed ************************
Oracle PACKAGE迁移注意事项
- 应将包规范(即包头)与包体分置于不同文件、相同输入路径中进行迁移。
- 应先使用Bulk模式迁移普通DDL语句(包含PACKAGE脚本中引用到的全部表结构信息),以在config/create-types-UDT.properties文件中形成字典信息。之后再使用Blogic模式迁移包规范(即包头)与包体。具体解释如下:
在部分Oracle PACKAGE定义包规范时,使用了"tbName.colName%TYPE"语法以基于其他表对象声明自定义的记录类型。
例如
CREATE OR REPLACE PACKAGE p_emp
AS
--定义RECORD类型
TYPE re_emp IS RECORD(
rno emp.empno%TYPE,
rname emp.empname%TYPE
);
END;
GaussDB暂不支持通过"tbName.colName%TYPE"语法在CREATE TYPE命令中指定列数据类型,MT工具在迁移时需要构建含有诸如emp表信息的数据库上下文环境。由此需要先使用MT工具迁移所有的建表脚本(即使用Bulk模式迁移普通DDL语句),MT内部会自动生成相应的数据字典。当含有各种表信息的上下文环境构建完成后,可以使用Blogic模式迁移 Oracle PACKAGE,此时re_emp记录类型会根据emp表的列类型完成迁移。
期望输出
CREATE TYPE p_emp.re_emp AS (
rno NUMBER(4),
rname VARCHAR2(10)
);