El almacenamiento de datos se refiere a medios magnéticos, ópticos o mecánicos que registran y preservan información digital para operaciones en curso o futuras.
Hay dos tipos de información digital: datos de entrada y de salida. Los usuarios proporcionan los datos de entrada y las computadoras proporcionan los datos de salida. Sin embargo, la CPU de una computadora no puede calcular nada ni producir datos de salida sin la entrada del usuario.
Los usuarios pueden ingresar los datos de entrada directamente en una computadora. Sin embargo, al principio de la era de las computadoras, descubrieron que ingresar datos continuamente de forma manual es prohibitivo en cuanto a tiempo y energía. Una solución a corto plazo es la memoria de la computadora, también conocida como memoria de acceso aleatorio (RAM). Sin embargo, su capacidad de almacenamiento y retención de memoria son limitadas. La memoria de solo lectura (ROM) es, como su nombre lo indica, donde los datos solo se pueden leer, pero no necesariamente editar. Controla las funciones básicas de una computadora.
Aunque los informáticos lograron avances significativos en la memoria de las computadoras con el desarrollo de la RAM dinámica (DRAM) y la DRAM síncrona (SDRAM), todavía están limitadas por el costo, el espacio y la retención de memoria. Cuando una computadora se apaga, también lo hace la capacidad de la RAM para retener datos. ¿La solución? Almacenamiento de datos.
Con el espacio de almacenamiento de datos, los usuarios pueden guardar datos en un dispositivo. Si la computadora se apaga, los datos se conservan. En lugar de ingresar datos manualmente en una computadora, los usuarios pueden indicarle a la computadora que extraiga datos de los dispositivos de almacenamiento. Las computadoras pueden leer datos de entrada de varias fuentes según sea necesario, y luego pueden crear y guardar la salida en las mismas fuentes u otras ubicaciones de almacenamiento. Los usuarios también pueden compartir el almacenamiento de datos con otros.
Hoy en día, las organizaciones y los usuarios requieren almacenamiento de datos para satisfacer las necesidades computacionales de alto nivel para el analytics de big data, la inteligencia artificial (IA), el machine learning (ML) y el Internet de las Cosas (IoT). La otra cara de la necesidad de un gran almacenamiento de datos es la protección contra la pérdida de datos debida a desastres, fallos o fraudes. Así que, para evitar la pérdida de datos, las organizaciones también pueden emplear el almacenamiento de datos como solución de copia de seguridad y restauración.
En términos simples, las computadoras o terminales modernos se conectan a dispositivos de almacenamiento ya sea directamente o a través de una red. Los usuarios dan instrucciones a los equipos para que accedan a los datos de estos dispositivos de almacenamiento y los almacenen en ellos. No obstante, a un nivel fundamental, existen dos bases para el almacenamiento de datos: la forma en que se toman los datos y los dispositivos en los que se registran y almacenan.
Para almacenar datos, independientemente de su formato, los usuarios necesitan dispositivos de almacenamiento de datos. Los dispositivos de almacenamiento de datos se dividen en dos categorías principales: almacenamiento directo y almacenamiento en red.
El almacenamiento de área directa, también conocido como almacenamiento de conexión directa (DAS), es como su nombre lo indica. Este almacenamiento suele estar en el área inmediata y conectado directamente a la máquina informática que accede a él. A menudo, es la única máquina conectada a él. El DAS también puede proporcionar servicios de copia de seguridad locales decentes, pero el uso compartido es limitado. Los dispositivos DAS incluyen disquetes, discos ópticos (discos compactos (CD) y discos de video digitales (DVD), unidades de disco duro (HDD), unidades flash y unidades de estado sólido (SSD).
El almacenamiento basado en red permite que varias computadoras accedan a él a través de una red, lo que lo hace mejor para el intercambio de datos y la colaboración. Su capacidad de almacenamiento externo también es más adecuada para copias de seguridad y protección de datos. Dos configuraciones de almacenamiento estándar basadas en red son el almacenamiento adjunto de red (NAS) y la red de área de almacenamiento (SAN).
El NAS suele ser un único dispositivo compuesto por contenedores de almacenamiento redundantes o una matriz redundante de discos independientes (RAID). El almacenamiento SAN puede ser una red de múltiples dispositivos de varios tipos, incluyendo SSD y almacenamiento flash, almacenamiento híbrido, almacenamiento en la nube híbrida, almacenamiento en la nube y software y dispositivos de copia de seguridad.
Aquí se explica en qué se diferencian NAS y SAN:
NAS
SAN
El almacenamiento flash es una tecnología de unidad de estado sólido que emplea chips de memoria flash para escribir y almacenar datos. Una unidad flash de disco de estado estable (SSD ) almacena datos empleando memoria flash. En comparación con las unidades de disco duro (HDD), un sistema de estado estable no tiene piezas móviles y tiene menos latencia, por lo que hay menos SSD. Como la mayoría de las unidades SSD modernas están basadas en flash, almacenamiento flash es sinónimo de sistema de estado estable.
Las unidades SSD y flash ofrecen mayor rendimiento que los discos duros, pero las matrices íntegramente flash pueden ser más caras. Muchas organizaciones adoptan un enfoque híbrido, combinando la velocidad de la tecnología flash con la capacidad de almacenamiento de los discos duros. Una infraestructura de almacenamiento equilibrada permite a las compañías aplicar tecnología específica para satisfacer diferentes necesidades de almacenamiento. El almacenamiento híbrido ofrece una forma económica de migrar de los discos duros tradicionales sin pasar completamente a la tecnología flash.
El Almacenamiento en la nube ofrece una alternativa escalable y rentable al almacenar archivos en discos duros on premises o redes de almacenamiento. Los proveedores de servicio en la nube (CSP), como Google Cloud, Microsoft Azure, IBM Cloud y Amazon Web Services (AWS), permiten almacenar datos y archivos en una ubicación externa que se puede acceder a través de Internet público o una conexión de red privada dedicada. El proveedor aloja, protege, gestiona y mantiene los servidores y la infraestructura asociada, y garantiza que se pueda acceder a los datos siempre que se necesiten.
Elalmacenamiento en nube híbrida combina elementos de nube privada y pública. Con el almacenamiento en nube híbrida, las organizaciones pueden elegir en qué nube almacenar los datos. Por ejemplo, los datos muy regulados sujetos a estrictos requisitos de archivado y replicación son más adecuados para un entorno de nube privada, mientras que los datos menos sensibles pueden almacenar en la nube pública. Algunas organizaciones emplean nubes híbridas para complementar sus redes de almacenamiento interno con almacenamiento en nubes públicas.
El almacenamiento y los dispositivos de copia de seguridad protegen la pérdida de datos en caso de desastres, fallos o fraudes. Realizan copias periódicas de datos y aplicaciones en un dispositivo secundario independiente y, a continuación, emplean esas copias para la recuperación ante desastres. Los dispositivos de copia de seguridad van desde discos duros y SSD hasta unidades de cinta y servidores.
Los proveedores de servicios en la nube (CSP) también ofrecen almacenamiento de copia de seguridad como un servicio llamado copia de seguridad como servicio (BaaS). Al igual que la mayoría de las soluciones como servicio, BaaS proporciona una opción de bajo costo para proteger los datos, almacenándolos en una ubicación remota con escalabilidad.
Los datos se pueden registrar y almacenar en tres formas principales: almacenamiento de archivos, almacenamiento en bloques y almacenamiento de objetos.
Para una comparación más profunda de los tipos de almacenamiento de datos, consulte “Almacenamiento de objetos versus archivos versus Block Storage: ¿cuál es la diferencia?” y vea el siguiente video.
File storage, o almacenamiento basado en archivos, es una metodología de almacenamiento jerárquica que se emplea para organizar y almacenar datos. En otras palabras, los datos se almacenar en archivos, que se organizan en carpetas, que se organizan bajo una jerarquía de directorios y subdirectorios.
El almacenamiento en bloque, a veces llamado almacenamiento a nivel de bloque, es una tecnología para almacenar datos en bloques. A continuación, los bloques se almacenan como piezas separadas, cada una con un identificador único. Los desarrolladores prefieren el almacenamiento en bloque para situaciones informáticas que requieren una transferencia de datos rápida, eficiente y fiable.
El almacenamiento de objetos, a menudo llamado almacenamiento basado en objetos, es una arquitectura de almacenamiento de datos para manejar grandes cantidades de datos no estructurados. Estos datos no se ajustan -o no pueden organizar fácilmente- a una base de datos relacional tradicional con filas y columnas. Algunos ejemplos son el correo electrónico, los videos, las fotos, los sitios web, los archivos de audio, los datos de sensores y otros contenidos multimedia y sitio web (textuales o no). Otros casos de uso incluyen la creación de aplicaciones nativas de la nube o la transformación de aplicaciones heredadas en aplicaciones de nube de nueva generación mediante el uso de almacenamiento de objetos basado en la nube como almacén de datos persistente.
Es posible que la memoria del equipo y el almacenamiento local no proporcionen suficiente almacenamiento, protección del almacenamiento, acceso de múltiples usuarios, velocidad y rendimiento para las aplicaciones empresariales. Por lo tanto, la mayoría de las organizaciones emplean algún tipo de red de área de almacenamiento además de un sistema de almacenamiento adjunto de red (NAS)
.A veces llamada la red detrás de los servidores, una red de área de almacenamiento (SAN) es una red especializada y de alta velocidad que conecta servidores y dispositivos de almacenamiento. Consiste en una infraestructura de comunicación que proporciona conexiones físicas, lo que permite que un dispositivo cualquiera conecte la red mediante el uso de elementos interconectados, como conmutadores y directores.
La SANTO también puede ver como una extensión del concepto de bus de almacenamiento. Este concepto permite que los dispositivos de almacenamiento y los servidores se interconecten mediante el uso de elementos similares, como redes de área local (LAN) y redes de área amplia (WAN). Una SANTO también incluye una capa de gestión que organiza las conexiones, los elementos de almacenamiento y los sistemas informáticos. Esta capa garantiza transferencias de datos seguras y robustas.
Tradicionalmente, sólo un número limitado de dispositivos de almacenamiento podía conectarse a un servidor. En cambio, una SAN introdujo la flexibilidad de red, permitiendo que un servidor o muchos servidores heterogéneos de varios centros de datos compartieran una utilidad de almacenamiento común. La SANTO elimina la tradicional conexión dedicada entre un servidor y el almacenamiento. También elimina el concepto de que el servidor posee y gestiona efectivamente los dispositivos de almacenamiento. Así, una red puede incluir muchos dispositivos de almacenamiento, incluidos discos, cintas magnéticas y almacenamiento óptico, y la utilidad de almacenamiento puede estar situada lejos de los servidores que emplea.
La infraestructura de almacenamiento es la base sobre la que se basa la información. Por lo tanto, debe apoyar los objetivos de negocio y el modelo de negocio de la compañía. Una infraestructura SAN proporciona mayor disponibilidad de red, accesibilidad a los datos y capacidad de administración del sistema. En este entorno, simplemente desplegar más y más rápidos dispositivos de almacenamiento no es suficiente. Un buen SAN comienza con un buen diseño.
El primer elemento a tener en cuenta en cualquier implementación de SANTO es la conectividad de los componentes de almacenamiento y servidor, que suelen emplear Fibre Channel, una tecnología de transferencia de datos de alta velocidad. Las SANTO, al igual que las LAN, interconectan las interfaces de almacenamiento en muchas configuraciones de red y a través de distancias más largas.
La infraestructura de servidores es la razón subyacente de todas las soluciones SAN, y esta infraestructura incluye una combinación de plataformas de servidores. Iniciativas como la consolidación de servidores y el comercio electrónico aumentan la necesidad de SAN, lo que hace que el almacenamiento en red sea más crítico.
Un sistema de almacenamiento puede constar de sistemas de disco y sistemas de cinta. El sistema de disco puede incluir HDD, SSD o unidades flash. El sistema de cinta puede estar compuesto por unidades de cinta, cargadores automáticos de cintas y bibliotecas de cintas.
La conectividad SAN comprende componentes de hardware y software que interconectan dispositivos de almacenamiento de información y servidores. El hardware puede incluir hubs, switches, directores y routers
.Hoy en día, el almacenamiento de datos evolucionó hacia un enfoque de software que voltea en torno al almacenamiento definido por software (SDS) y tecnologías relacionadas que aumentan la agilidad y la eficiencia en la gestión de datos. En un reporte de Technavio, se estima que el tamaño del mercado global de almacenamiento definido por software (SDS) crecerá en USD 105.07 mil millones en 2024-2029.1
El almacenamiento definido por software (SDS) es un tipo de almacenamiento de datos en el que una capa de software desvincula los recursos de almacenamiento de su infraestructura de hardware de almacenamiento físico subyacente. El SDS emplea la virtualización para crear un conjunto unificado de recursos de almacenamiento que pueden asignar dinámicamente mediante la automatización o manualmente a través de un panel de control API.
A diferencia de los sistemas NAS o SANTO tradicionales, SDS ofrece la flexibilidad necesaria para responder al complejo proceso de transformación digital . Por ejemplo, SDS puede optimizar significativamente las tareas relacionadas con la administración del almacenamiento mediante la automatización de las cargas de trabajo relacionadas con el aprovisionamiento, la supervisión y la resolución de problemas.
La virtualización de almacenamiento se refiere a la agrupación de Recursos de almacenamiento físico de varios sistemas de almacenamiento para que parezca que todo el almacenamiento se almacena en un dispositivo. Por el contrario, SDS abstrae los servicios de almacenamiento y los separa del propio dispositivo. Los usuarios gestionan la virtualización de almacenamiento a través de una consola para garantizar la seguridad, la fiabilidad y la eficiencia de sus datos y Recursos de almacenamiento para entornos de servidores y escritorios virtualizados.
El almacenamiento hiperconvergente es una arquitectura de almacenamiento de datos en la que los recursos de SDS se agrupan y gestionan dentro de una infraestructura hiperconvergente (HCI).
El almacenamiento hiperconvergente integra todo el almacenamiento directamente en la pila HCI, junto con las funciones informáticas y de red. A través de la virtualización, HCI libera los recursos de almacenamiento de las piezas individuales de hardware, lo que hace que el almacenamiento hiperconvergente sea mucho más flexible y escalable que las soluciones de almacenamiento tradicionales.
La seguridad del almacenamiento de datos protege los datos en on premises y en entornos basados en la nube contra filtraciones de datos, ciberataques y otras amenazas de seguridad.
Las filtraciones de datos son costosas y presentan un problema continuo para las empresas. Según el Informe del costo de una filtración de datos de IBM 2023 , el costo promedio global de la filtración de datos en ese año fue de 4.45 millones de dólares, un aumento del 15 % en tres años. El informe también reveló que el ahorro promedio para las organizaciones que utilizan ampliamente la IA de seguridad y la automatización es de 1.76 millones de dólares en comparación con las organizaciones que no lo hacen.
Las empresas despliegan medidas de seguridad de datos para mejorar la visibilidad del almacenamiento de datos. Las características de hardware y software de seguridad de almacenamiento incluyen permisos especiales, cifrado, enmascaramiento de datos y redacción de archivos confidenciales. Las últimas soluciones de software de almacenamiento de seguridad también ayudan a automatizar la generación de informes para agilizar las auditorías y cumplir con los requisitos normativos.
Además, la resiliencia cibernética, la capacidad de una organización para prevenir, resistir y recuperarse de incidentes de ciberseguridad, se ha convertido en una parte integral de la seguridad del almacenamiento de datos. La resiliencia cibernética lleva la seguridad de los datos a un nuevo nivel al combinar la continuidad de negocio y la recuperación ante desastres (BCDR), la seguridad de los sistemas de información y la resiliencia organizacional para ayudar a las organizaciones a evitar amenazas y proteger sus datos.
Hoy en día, las industrias que necesitan preservar los registros y mantener la integridad de los datos (por ejemplo, la atención médica, el gobierno) pueden optar por el almacenamiento inmutable, que protege los datos almacenados al evitar cualquier cambio o alteración durante un periodo de tiempo determinado o indefinido. Estos sistemas de archivos permiten acceder repetidamente a los datos almacenados una vez creados, pero no modificados, y pueden ayudar a proteger los datos de la manipulación, los ciberataques y el ransomware.
IBM Storage DS8000 es el sistema de almacenamiento más rápido, confiable y seguro para IBM zSystems y servidores IBM Power.
IBM Storage es una familia de hardware de almacenamiento de datos, almacenamiento definido por software y software de gestión del almacenamiento.
IBM ofrece soporte proactivo para servidores web e infraestructura de centros de datos para reducir el tiempo de inactividad y mejorar la disponibilidad de la TI.
1 Software-Defined Storage (SDS) Market size is set to grow by USD 105.07 billion 2024–2028, Surge in cloud adoption boosts the market (enlace externo a ibm.com), Technavio, 24 de junio de 2024.