Introducción a la conversión de caracteres

En informática, todos los caracteres se codifican de acuerdo con las reglas de un determinado esquema de codificación y una página de códigos. Si su base de datos puede manejar datos de varias páginas de códigos, en determinados momentos estos datos pueden convertirse de una página de códigos a otra. Este proceso de conversión se denomina conversión de caracteres.

Es probable que se dé el caso de que deban manejarse datos de diferentes páginas de códigos si su base de datos y sus aplicaciones contienen datos internacionales o datos en diferentes conjuntos de caracteres, como Latin-1 y Katakana. En este caso, es probable que se produzcan conversiones de caracteres.

El problema de las conversiones de caracteres es que pueden degradar el rendimiento y potencialmente ocasionar la pérdida de datos. Por tanto, debe evitar estas conversiones en la medida de lo posible. Un modo de evitar estas conversiones es tener todos los datos en una página de códigos. Si utiliza varios conjuntos de caracteres, puede plantearse utilizar la página de códigos Unicode. Esta página de códigos incluye todos los caracteres. Si utiliza Unicode para todos los datos, pueden evitarse las conversiones. Sin embargo, convertir todos los datos a Unicode no es un proceso sencillo.

Este documento trata principios básicos sobre la conversión de caracteres y recomendaciones generales que puede aplicar a su entorno para un rendimiento y un almacenamiento óptimos.