创建自定义字符编码

CDC Replication 支持 Java 和 ICU(Unicode 国际组件)提供的多种字符编码(或字符集)。 如果 CDC 不支持您的编码,您可以向其中添加自定义编码。

开始之前

  • 下载并安装 ICU makeconv 工具。 对于 Windows 系统,请参阅 makeconv 工具的下载说明。 对于 Linux ,您可以使用包管理器进行安装。 sudo apt install icu-devtools例如, sudo dnf install icu 或。
  • 请确认您拥有重启 CDC 实例的权限。
  • 请确保您拥有具备订阅配置权限的管理控制台访问权限。

关于本任务

自定义字符编码可帮助您处理使用非标准字符集的旧系统或专用应用程序中的数据。 此流程同时适用于源 CDC 实例和目标 CDC 实例。
注意: 添加自定义编码需要重启 CDC 实例,这会暂时中断正在进行的复制操作。

过程

  1. 为您的编码创建或下载 ICU CHARMAP UCM(Unicode 转换映射)文件。

    <CDC Replication installation directory>/samples/*.ucm有关 UCM 文件的示例,请参见。 要下载 UCM 文件,请访问 ICU GitHub 仓库

    注: UCM 文件定义了 Unicode 码点与自定义编码的字节序列之间的映射关系。
  2. 根据需要编辑 UCM 文件。
  3. 使用 ICU makeover 工具编译这些 *.ucm 文件,以生成 *.cnv 目标文件。
  4. 将文件 *.cnv 放在 <CDC Replication installation directory>/lib/user/charset.
  5. 请按照以下步骤重启 CDC 实例:
    1. 取消所有订阅。
    2. 运行 dmshutdown -I <instancename> 该命令以停止实例。
    3. 请等待实例完全关闭(请查看进程列表或服务状态)。
    4. 重新启动订阅,但计划修改的订阅除外。
  6. 使用管理控制台为表映射中的列指定编码覆盖设置。

    如需更多信息,请参阅 MC 文档