El almacenamiento de datos se refiere a los soportes magnéticos, ópticos o mecánicos que registran y conservan la información digital para operaciones en curso o futuras.
Hay dos tipos de información digital: datos de entrada y de salida. Los usuarios proporcionan los datos de entrada y los ordenadores proporcionan los datos de salida. Sin embargo, la CPU de un ordenador no puede calcular nada ni producir datos de salida sin la entrada del usuario.
Los usuarios pueden introducir los datos de entrada directamente en un ordenador. Sin embargo, al principio de la era informática, descubrieron que introducir datos continuamente de forma manual es prohibitivo en cuanto a tiempo y energía. Una solución a corto plazo es la memoria del ordenador, también conocida como memoria de acceso aleatorio (RAM). Sin embargo, su capacidad de almacenamiento y retención de memoria son limitadas. La memoria de solo lectura (ROM) es, como su nombre indica, donde los datos solo se pueden leer pero no necesariamente editar. Controla las funciones básicas de un ordenador.
Aunque los informáticos lograron avances significativos en la memoria de los ordenadores con el desarrollo de la RAM dinámica (DRAM) y la DRAM síncrona (SDRAM), siguen estando limitadas por el coste, el espacio y la retención de memoria. Cuando un ordenador se apaga, también lo hace la capacidad de la RAM para retener datos. ¿La solución? Almacenamiento de datos.
Con el espacio de almacenamiento de datos, los usuarios pueden guardar datos en un dispositivo. En caso de que el ordenador se apague, los datos se conservan. En lugar de ingresar datos manualmente en un ordenador, los usuarios pueden indicarle que extraiga datos de los dispositivos de almacenamiento. Los ordenadores pueden leer datos de entrada de varias fuentes según sea necesario y, a continuación, pueden crear y guardar la salida en las mismas fuentes u otras ubicaciones de almacenamiento. Los usuarios también pueden compartir el almacenamiento de datos con otras personas.
Hoy en día, las organizaciones y los usuarios requieren almacenamiento de datos para satisfacer las necesidades computacionales de alto nivel para análisis de big data, inteligencia artificial (IA), machine learning (ML) e Internet de las cosas (IoT). La otra cara de la exigencia de un gran almacenamiento de datos es la protección contra la pérdida de datos debida a catástrofes, fallos o fraudes. Así que, para evitar la pérdida de datos, las organizaciones también pueden emplear el almacenamiento de datos como solución de copia de seguridad y restauración.
En términos simples, los ordenadores o terminales modernos se conectan a dispositivos de almacenamiento, ya sea directamente o a través de una red. Los usuarios instruyen a los equipos para que accedan a los datos y los almacenen en estos dispositivos de almacenamiento. Sin embargo, a un nivel fundamental, hay dos fundamentos para el almacenamiento de datos: la forma en que se toman los datos y los dispositivos en los que se registran y almacenan.
Para almacenar los datos, independientemente de la forma, los usuarios necesitan dispositivos de almacenamiento. Los dispositivos de almacenamiento de datos vienen en dos categorías principales: almacenamiento de área directa y almacenamiento basado en red
.El almacenamiento de área directa, también conocido como almacenamiento de conexión directa (DAS), es, como su nombre indica, un almacenamiento que suele estar en el área inmediata y conectado directamente al equipo que accede a él. A menudo, es el único equipo conectado. El DAS también puede proporcionar servicios de copia de seguridad locales decentes, pero su uso compartido es limitado. Los dispositivos DAS incluyen disquetes, discos ópticos (CD y DVD), unidades de disco duro (HDD), unidades flash y unidades de estado sólido (SSD).
El almacenamiento basado en red permite que varios ordenadores accedan a él a través de una red, lo que lo hace mejor para el intercambio de datos y la colaboración. Su capacidad de almacenamiento externo también es más adecuada para copias de seguridad y protección de datos. Dos configuraciones de almacenamiento estándar basadas en red son el almacenamiento adjunto de red (NAS) y el storage area network (SAN).
NAS suele ser un dispositivo único compuesto por contenedores de almacenamiento redundantes o una matriz redundante de discos independientes (RAID). El almacenamiento SAN puede ser una red de múltiples dispositivos de diversos tipos, como SSD y almacenamiento flash, almacenamiento híbrido, almacenamiento en la nube híbrido, software y dispositivos de almacenamiento en la nube y de copia de seguridad.
Así es como se diferencian NAS y SAN:
NAS
SAN
El almacenamiento flash es una tecnología de unidad de estado sólido que utiliza chips de memoria flash para escribir y almacenar datos. Una unidad flash de disco de estado sólido (SSD) almacena datos utilizando memoria flash. En comparación con las unidades de disco duro (HDD), un sistema de estado sólido no tiene piezas móviles y tiene menos latencia, por lo que hay menos unidades SSD. Dado que la mayoría de las unidades SSD modernas están basadas en flash, el almacenamiento flash es sinónimo de sistema de estado sólido.
Las SSD y flash ofrecen un mayor rendimiento que las HDD, pero las all flash array pueden ser más caras. Muchas organizaciones adoptan un almacenamiento hibrido, mezclando la velocidad del flash con la capacidad de almacenamiento de las unidades de disco duro. Una infraestructura de almacenamiento equilibrada permite a las empresas aplicar tecnología específica para satisfacer diferentes necesidades de almacenamiento. El almacenamiento hibrido ofrece una forma económica de realizar la transición de los discos duros tradicionales sin tener que pasar por completo a la memoria flash.
El almacenamiento en la nube ofrece una alternativa rentable y escalable al almacenar archivos en discos duros locales o redes de almacenamiento. Los proveedores de servicio en la nube (CSP), como Google Cloud, Microsoft Azure, IBM Cloud y Amazon Web Services (AWS), le permiten almacenar datos y archivos en una ubicación externa a la que puede acceder a través de Internet pública o una conexión de red privada dedicada. El proveedor aloja, protege, administra y mantiene los servidores y la infraestructura asociada y se asegura de que pueda acceder a los datos cuando sea necesario.
El almacenamiento en la nube híbrida combina elementos de nubes privadas y públicas. Con el almacenamiento en nube híbrida, las organizaciones pueden elegir en qué nube almacenar los datos. Por ejemplo, los datos muy regulados sujetos a estrictos requisitos de archivado y replicación son más adecuados para un entorno de nube privada, mientras que los datos menos sensibles pueden almacenarse en la nube pública. Algunas organizaciones utilizan nubes híbridas para complementar sus redes de almacenamiento interno con almacenamiento en nubes públicas.
El almacenamiento y los dispositivos de copia de seguridad protegen la pérdida de datos de desastres, fallos o fraudes. Realizan copias periódicas de datos y aplicaciones en un dispositivo secundario independiente y, a continuación, utilizan esas copias para la recuperación ante desastres. Los dispositivos de copia de seguridad van desde HDD y SSD hasta unidades de cinta y servidores.
Los proveedores de servicio en la nube (CSP) también ofrecen almacenamiento de copia de seguridad como un servicio denominado copia de seguridad como servicio (BaaS). Como la mayoría de las soluciones como servicio, BaaS ofrece una opción de bajo coste para proteger los datos, guardándolos en una ubicación remota con escalabilidad.
Los datos pueden registrarse y almacenarse en tres formas principales: almacenamiento de archivos, almacenamiento de bloques y almacenamiento de objetos.
Para una comparación más detallada de los tipos de almacenamiento de datos, consulte "Object versus File versus Block Storage: What’s the Difference?" y vea el siguiente vídeo.
El almacenamiento de archivos, o almacenamiento basado en archivos, es una metodología de almacenamiento jerárquico que se utiliza para organizar y almacenar los datos. En otras palabras, los datos se almacenar en archivos, que se organizan en carpetas, que se organizan en una jerarquía de directorios y subdirectorios.
El almacenamiento en bloque, a veces llamado almacenamiento a nivel de bloque, es una tecnología para almacenar datos en bloques. A continuación, los bloques se almacenan como piezas separadas, cada una con un identificador único. Los desarrolladores prefieren el almacenamiento en bloque para situaciones informáticas que requieren una transferencia de datos rápida, eficiente y fiable.
El almacenamiento de objetos, a menudo denominado almacenamiento basado en objetos, es una arquitectura de almacenamiento de datos para gestionar grandes cantidades de datos no estructurados. Estos datos no se ajustan, o no pueden organizarse fácilmente, a una base de datos relacional tradicional con filas y columnas. Algunos ejemplos son el correo electrónico, los vídeos, las fotos, las páginas web, los archivos de audio, los datos de sensores y otros contenidos multimedia y web (textuales o no textuales). Otros casos de uso incluyen la creación de aplicaciones nativas de la nube o la transformación de aplicaciones heredadas en aplicaciones de nube de nueva generación mediante el uso del almacenamiento de objetos basado en la nube como almacén de datos persistente.
La memoria del ordenador y el almacenamiento local podrían no ofrecer suficiente almacenamiento, protección, acceso para múltiples usuarios, velocidad y rendimiento para las aplicaciones empresariales. Por ello, la mayoría de las organizaciones emplean algún tipo de red de área de almacenamiento (SAN), además de un sistema de almacenamiento conectado a red (NAS).
A veces denominada la red detrás de los servidores, una red de área de almacenamiento (SAN) es una red especializada de alta velocidad que conecta servidores y dispositivos de almacenamiento. Consiste en una infraestructura de comunicación que proporciona conexiones físicas, lo que permite que cualquier dispositivo conecte la red mediante elementos interconectados, como conmutadores y directores.
La SAN también puede considerarse una extensión del concepto de bus de almacenamiento. Este concepto permite interconectar dispositivos de almacenamiento y servidores utilizando elementos similares, como las redes de área local (LAN) y las redes de área extensa (WAN). Una SAN también incluye una capa de gestión que organiza las conexiones, los elementos de almacenamiento y los sistemas informáticos. Esta capa garantiza transferencias de datos seguras y sólidas.
Tradicionalmente, solo un número limitado de dispositivos de almacenamiento podía conectarse a un servidor. Alternativamente, una SAN introdujo flexibilidad de red, permitiendo que un servidor o muchos servidores heterogéneos en varios centros de datos compartan una utilidad de almacenamiento común. La SAN elimina la conexión dedicada tradicional entre un servidor y el almacenamiento. También elimina el concepto de que el servidor posee y gestiona eficazmente los dispositivos de almacenamiento. Por lo tanto, una red puede incluir muchos dispositivos de almacenamiento, incluidos discos, cintas magnéticas y almacenamiento óptico, y la utilidad de almacenamiento puede estar ubicada lejos de los servidores que utiliza.
La infraestructura de almacenamiento es la base sobre la que se basa la información. Por lo tanto, debe respaldar los objetivos comerciales y el modelo de negocio de la empresa. Una infraestructura SAN proporciona una mayor disponibilidad de la red, accesibilidad a los datos y capacidad de gestión del sistema. En este entorno, no basta con implementar más dispositivos de almacenamiento y más rápidos. Una buena RAS comienza con un buen diseño.
El primer elemento a tener en cuenta en cualquier implementación de SAN es la conectividad de los componentes de almacenamiento y servidor, que suelen utilizar Fibre Channel, una tecnología de transferencia de datos de alta velocidad. Las SAN, al igual que las LAN, interconectan las interfaces de almacenamiento en muchas configuraciones de red y a través de distancias más largas.
La infraestructura de servidor es la razón subyacente de todas las soluciones SAN, y esta infraestructura incluye una combinación de plataformas de servidor. Iniciativas como la consolidación de servidores y el comercio electrónico aumentan la necesidad de SAN, lo que hace que el almacenamiento en red sea más crítico.
Un sistema de almacenamiento puede consistir en sistemas de discos y sistemas de cintas. El sistema de disco puede incluir HDD, SSD o unidades flash. El sistema de cinta puede constar de unidades de cinta, cargadores automáticos en cinta y bibliotecas de cintas.
La conectividad SAN comprende componentes de hardware y software que interconectan los dispositivos de almacenamiento y los servidores. El hardware puede incluir concentradores, conmutadores, directores y enrutadores
.Hoy en día, el almacenamiento de datos ha evolucionado hacia un enfoque de software que gira en torno al almacenamiento definido por software (SDS) y tecnologías relacionadas que aumentan la agilidad y la eficiencia en la gestión de datos. En un informe de Technavio, se estima que el tamaño del mercado global de almacenamiento definido por software (SDS) crecerá en 105 070 millones de dólares en 2024-20291
.El almacenamiento definido por software (SDS) es un tipo de almacenamiento de datos en el que una capa de software desvincula los recursos de almacenamiento de su infraestructura de hardware de almacenamiento físico subyacente. El SDS utiliza la virtualización para crear un conjunto unificado de recursos de almacenamiento que pueden asignarse dinámicamente mediante la automatización o manualmente a través de un panel de control API.
A diferencia de los sistemas NAS o SAN tradicionales, SDS ofrece la flexibilidad necesaria para responder al complejo proceso de transformación digital. Por ejemplo, SDS puede agilizar significativamente las tareas relacionadas con la gestión del almacenamiento automatizando las cargas de trabajo relacionadas con el aprovisionamiento, la monitorización y la resolución de problemas.
La virtualización de almacenamiento se refiere a agrupar los recursos de almacenamiento físico de varios sistemas de almacenamiento para que parezca que todo el almacenamiento está almacenado en un solo dispositivo. Por el contrario, el SDS abstrae los servicios de almacenamiento y los separa del propio dispositivo. Los usuarios gestionan la virtualización de almacenamiento a través de una consola para garantizar la seguridad, la fiabilidad y la eficacia de sus datos y recursos de almacenamiento para entornos de servidores y escritorios virtualizados.
El almacenamiento hiperconvergente es una arquitectura de almacenamiento de datos en la que los recursos SDS se agrupan y gestionan dentro de una infraestructura hiperconvergente (HCI).
El almacenamiento hiperconvergente integra todo el almacenamiento directamente en la pila HCI, junto con las funciones informáticas y de red. A través de la virtualización, HCI libera los recursos de almacenamiento de las piezas individuales de hardware, lo que hace que el almacenamiento hiperconvergente sea mucho más flexible y escalable que las soluciones de almacenamiento tradicionales.
La seguridad del almacenamiento de datos protege los datos en las instalaciones y en entornos basados en la nube contra vulneraciones de datos, ciberataques y otras amenazas de seguridad.
Las vulneraciones de datos son costosas y suponen un problema permanente para las empresas. Según el Informe "Cost of a Data Breach" de 2023 de IBM, el coste medio mundial de una vulneración de datos en ese año fue de 4,45 millones de dólares, un 15 % más en tres años. El informe también reveló que el ahorro medio para las organizaciones que utilizan ampliamente la automatización y la IA de seguridad es de 1,76 millones de dólares en comparación con las organizaciones que no lo hacen
Las empresas implementan medidas de seguridad de datos para mejorar la visibilidad del almacenamiento de datos. Las características de hardware y software de seguridad de almacenamiento incluyen permisos especiales, cifrado, enmascaramiento de datos y redacción de archivos confidenciales. Las últimas soluciones de software de almacenamiento de seguridad también ayudan a automatizar la generación de informes para agilizar las auditorías y cumplir con los requisitos normativos.
Además, la ciberresiliencia, la capacidad de una organización para prevenir, resistir y recuperarse de incidentes de ciberseguridad, se ha convertido en una parte integral de la seguridad del almacenamiento de datos. La ciberresiliencia lleva la seguridad de datos a un nuevo nivel al combinar la continuidad del negocio y la recuperación ante desastres (BCDR), la seguridad de los sistemas de información y la resiliencia organizativa para ayudar a las organizaciones a protegerse de las amenazas y salvaguardar sus datos.
Hoy en día, los sectores que necesitan conservar registros y mantener la integridad de los datos (por ejemplo, sanidad, gobierno) pueden optar por el almacenamiento inmutable, que protege los datos almacenados evitando cualquier cambio o alteración durante un tiempo determinado o indefinido. Estos sistemas de archivos permiten acceder repetidamente a los datos almacenados una vez creados, pero no modificarlos, y pueden ayudar a proteger los datos de manipulaciones, ciberataques y ransomware.
IBM Storage DS8000 es el sistema de almacenamiento más rápido, fiable y seguro para IBM zSystems y IBM Power servers.
IBM Storage es una familia de hardware de almacenamiento de datos, almacenamiento definido por software y software de gestión del almacenamiento.
IBM ofrece soporte proactivo para servidores web e infraestructura de centros de datos para reducir el tiempo de inactividad y mejorar la disponibilidad de la TI.
1 Software-Defined Storage (SDS) Market size is set to grow by USD 105.07 billion 2024–2028, Surge in cloud adoption boosts the market (enlace externo a ibm.com). Technavio. 24 de junio de 2024.