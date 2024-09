Mientras que las bases de datos relacionales estructuran los datos en un formato tabular, las bases de datos no relacionales no tienen un esquema de base de datos tan rígido. De hecho, las bases de datos no relacionales organizan los datos de manera diferente según el tipo de base de datos. Independientemente del tipo de base de datos no relacional, todas tienen como objetivo resolver los problemas de flexibilidad y escalabilidad inherentes a los modelos relacionales que no son ideales para formatos de datos no estructurados, como texto, vídeo e imágenes. Estos tipos de bases de datos incluyen:

Almacén clave-valor: este modelo de datos sin esquema se organiza en un diccionario de pares clave-valor, donde cada elemento tiene una clave y un valor. La clave podría ser algo similar a lo que se encuentra en una base de datos SQL, como el ID de un carrito de la compra, mientras que el valor es una matriz de datos, como cada artículo del carrito de la compra de ese usuario. Se utiliza habitualmente para almacenar en caché la información de la sesión del usuario, como en el caso de los carritos de la compra. Sin embargo, no es lo ideal cuando se necesita extraer varios registros a la vez. Redis y Memcached son ejemplos de bases de datos de código abierto con este modelo de datos.

Almacén de documentos: como sugiere el nombre, las bases de datos de documentos almacenan datos como documentos. Pueden ser útiles en la gestión de datos semiestructurados y, por lo general, los datos se almacenan en los formatos JSON, XML o BSON. Esto mantiene los datos juntos cuando se utilizan en aplicaciones, lo que reduce la cantidad de traducción necesaria para utilizar los datos. Los desarrolladores también disfrutan de una mayor flexibilidad, ya que no es necesario que los esquemas de datos coincidan entre documentos (por ejemplo, name vs. first_name). Sin embargo, esto puede resultar problemático para transacciones complejas y corromper los datos. Los casos de uso más populares de las bases de datos de documentos son los sistemas de gestión de contenidos y los perfiles de usuario. Un ejemplo de una base de datos orientada a documentos es MongoDB, el componente de base de datos de la pila MEAN.

Almacén de columna ancha: estas bases de datos almacenan información en columnas, lo que permite a los usuarios acceder solo a las columnas que necesitan sin asignar memoria adicional a datos irrelevantes. Esta base de datos intenta resolver las deficiencias de los almacenes clave-valor y de documentos, pero dado que puede ser un sistema más complejo de administrar, no se recomienda su uso para equipos y proyectos más nuevos. Apache HBase y Apache Cassandra son ejemplos de bases de datos de columna ancha y código abierto. Apache HBase se basa en el sistema de ficheros distribuido de Hadoop que proporciona una forma de almacenar conjuntos de datos dispersos, de uso común en muchas aplicaciones de big data. Apache Cassandra, por otro lado, ha sido diseñado para administrar grandes cantidades de datos en múltiples servidores y clústeres que abarcan múltiples centros de datos. Se ha utilizado para una variedad de casos de uso, como sitios web de redes sociales y análisis de datos en tiempo real.

Almacén de gráficos: este tipo de base de datos suele albergar datos de un grafo de conocimiento. Los elementos de datos se almacenan como nodos, aristas y propiedades. Cualquier objeto, lugar o persona puede ser un nodo. Una arista define la relación entre los nodos. Las bases de datos de grafos se utilizan para almacenar y administrar una red de conexiones entre elementos dentro del grafo. Neo4j (enlace externo a IBM), un servicio de base de datos orientada a grafos basado en Java con una edición comunitaria de código abierto donde los usuarios pueden adquirir licencias para copias de seguridad en línea y extensiones de alta disponibilidad, o una versión con licencia preempaquetada con copia de seguridad y extensiones incluidas.

Las bases de datos NoSQL también dan prioridad a la disponibilidad sobre la coherencia.

Cuando los ordenadores se ejecutan a través de una red, siempre deben decidir si dan prioridad a resultados coherentes (donde cada respuesta es siempre la misma) o a un alto tiempo de actividad, llamado "disponibilidad". Es lo que se denomina "teoría CAP" (del acrónimo en inglés de Consistency, Availability, Partition tolerance). Las bases de datos relacionales garantizan que la información esté siempre sincronizada y sea coherente. Algunas bases de datos NoSQL, como Redis, prefieren proporcionar siempre una respuesta. Esto significa que la información que recibe de una consulta puede ser incorrecta por unos segundos, tal vez hasta medio minuto. En las redes sociales implica, por ejemplo, ver una foto de perfil antigua cuando la más reciente es de hace apenas unos instantes. La alternativa podría ser un tiempo de espera o un error. Por otro lado, en las transacciones bancarias y financieras, un error y un nuevo envío pueden ser preferibles a información antigua e incorrecta.

Para conocer las diferencias entre SQL y NoSQL, consulte "Bases de datos SQL vs. NoSQL: ¿en qué se diferencian?".