Replica di dati carattere multibyte (MBCS) e doppio byte (DBCS)

Replica CDC replica i dati dei caratteri tra un'ampia gamma di codifiche e convertirà automaticamente i dati dalla codifica di colonna rilevata sull'origine alla codifica di colonna rilevata sulla destinazione. Ad esempio, è possibile replicare i dati di caratteri multibyte come Giapponese, Cinese o Coreano. I dati carattere in queste lingue non possono essere rappresentati in un singolo byte. L'implementazione MBCS più comune è DBCS (double - byte character sets).

Per impostazione predefinita, Replica CDC presuppone che i dati memorizzati in una colonna con capacità di caratteri siano nella codifica associata a tale tipo di colonna. Ad esempio, se il database è impostato per utilizzare Shift - JIS, per impostazione predefinita si presuppone che i dati memorizzati nelle colonne CHAR e VARCHAR siano in Shift - JIS. Tuttavia, CDC Replication si occupa solo della codifica dei dati, non della codifica del tipo di archiviazione della colonna. Questa flessibilità consente al prodotto di gestire situazioni in cui la codifica dei dati non corrisponde alla codifica specificata per la colonna nel database. La capacità di sovrascrivere la codifica rilevata è determinata da CDC Replication. La sovrascrittura della codifica della colonna rilevata consente di specificare la codifica effettiva dei dati come noti.
Limitazioni:
  • Le sovrascritture di codifica non sono consentite per CDC Replication Engine for FlexRep.
  • Per le destinazioni DataStage e Kafka , la codifica di destinazione è UTF-8 per tutti i dati carattere. Per le destinazioni Kafka , puoi sovrascrivere la codifica in modo che sia binaria.

Questa funzionalità è stata estesa non solo ai tipi di colonna che supportano i caratteri standard come CHAR e VARCHAR, ma anche alle colonne che supportano tradizionalmente Unicode come NCHAR e NVARCHAR, molti tipi di colonna tradizionalmente binari, così come molti tipi di colonna LOB (large object), indipendentemente dal fatto che siano o meno tradizionalmente considerati basati sui caratteri. Replica CDC li tratta tutti come se fossero in grado di supportare i dati carattere. Per fornire il massimo livello di flessibilità e laddove consentito dalle limitazioni del database, Replica CDC si impegna a eliminare la distinzione tra i dati stessi e il tipo di dati noto al database utilizzato per contenere i dati.

Ci possono essere situazioni in cui si desidera replicare i dati esattamente come sono senza alcuna modifica alla codifica. In queste situazioni, è possibile indicare la colonna come binaria e i dati verranno replicati così come sono. Tutti i dati di colonna designati binari devono essere associati anche ai dati di colonna binari.

La conversione della codifica può aumentare il carico di lavoro per i server di origine o di destinazione. Replica CDC fornisce la possibilità di specificare (con una preferenza a livello di sottoscrizione) dove si verificherà il carico di lavoro - sull'origine o sulla destinazione.

CDC Replication fornisce anche un processo di upgrade per le sottoscrizioni che utilizzano implementazioni precedenti (CDC Replication versione 6.3 e precedenti) del supporto MBCS. La console di gestione consente di convertire rapidamente le sottoscrizioni alla modalità di codifica automatica per i dati MBCS disponibili in CDC Replication versione 6.5 e successive.

Nota: quando si sovrascrivono le codifiche di caratteri predefinite per un database, la codifica specificata deve essere quella supportata dal database stesso.