El almacenamiento de datos de fuente abierta ofrece una gran flexibilidad, pero desbloquear sus beneficios requerirá recursos técnicos sólidos para cumplir con requisitos como la estabilidad, la alta disponibilidad y la seguridad.
En 2016, un grupo de empresas se unió para abordar un desafío clave de administración de almacenamiento al que se enfrentaban ellos y sus clientes, es decir, administrar una huella de almacenamiento heterogénea que obstaculizaba la implementación de servicios de datos y almacenamiento.
En ese momento, el grupo integrado por Dell EMC, Fujitsu, Hitachi, Huawei, Intel y Vodafone formó el proyecto OpenSDS (almacenamiento definido por software abierto), un proyecto de código abierto incubado bajo The Linux Foundation para crear una comunidad que abordara esos problemas en un manera genérica y estandarizada.
“Ningún cliente usa un solo proveedor para el almacenamiento: querían algo como una plataforma o marco para conectarse a diferentes tipos de almacenamiento y monitorear e implementar”, dice Steven Tan, presidente de la Fundación Soda , que se formó en junio de 2020 para expandirse. el alcance del proyecto OpenSDS.
Si bien OpenSDS ha allanado el camino para el almacenamiento virtualizado que agrupa varios sistemas de almacenamiento, la Fundación Soda va más allá al fomentar un ecosistema de herramientas y capacidades de administración de datos de código abierto, desde el perímetro hasta la nube.
Soda, un acrónimo recursivo que significa Soda Open Data Autonomy, se compone de siete proyectos centrales enfocados en brindar capacidades como administración de infraestructura, administración de datos de múltiples nubes e interfaces de programación de aplicaciones (API), entre otras.
"Creo que la mejor parte de OpenSDS y la Fundación Soda es reunir a todos para encontrar una solución", dijo Tan a Computer Weekly, y señaló que Soda es un marco flexible que es lo suficientemente flexible para que cualquier usuario o proveedor lo adapte o amplíe. para satisfacer sus necesidades.
De hecho, las organizaciones de usuarios finales y los principales proveedores de almacenamiento y software de código abierto se están subiendo al carro, ya sea que vean su trabajo como parte del marco de trabajo de Soda o no.
Rancher Labs, por ejemplo, desarrolló originalmente el proyecto Longhorn de código abierto para proporcionar una plataforma de almacenamiento distribuida nativa de la nube para Kubernetes.
“Funciona con cualquier distribución de Kubernetes y hace que la implementación de almacenamiento de bloques persistente de alta disponibilidad en su entorno de Kubernetes sea fácil, rápida y confiable en arquitecturas x86 y ARM64 en el centro de datos, en la nube pública y en el perímetro”, dice Vishal Ghariwala, SUSE's director de tecnología (CTO) para Asia-Pacífico y Japón y Gran China.
SUSE, que adquirió Rancher Labs en 2020, contribuye activamente al proyecto de almacenamiento Longhorn, que se está desarrollando como un proyecto de espacio aislado bajo Cloud Native Computing Foundation (CNCF). SUSE también contribuye al proyecto Ceph diseñado para proporcionar almacenamiento escalable basado en objetos, bloques y archivos bajo un sistema unificado.
El código abierto también ha llamado la atención de proveedores de almacenamiento de datos como NetApp. La empresa ya contribuye al marco de datos abiertos de la Fundación Soda, que incluye la integración de KubeEdge y soporte de archivos para el software de gestión de datos Ontap de NetApp .
En el borde, el gigante de TI empresarial Dell es colaborador de StarlingX , una pila de software de infraestructura en la nube para el borde utilizada por aplicaciones exigentes en Internet industrial de las cosas , telecomunicaciones, entrega de video y otros casos de uso de latencia ultrabaja.
En 2019, contribuyó con un código prototipo a la Fundación Linux para sembrar el Proyecto Alvarium que entrega datos de dispositivos a aplicaciones con seguridad y confianza medibles. También ha diseñado Project Nautilus, una solución de almacenamiento de transmisión y análisis en tiempo real creada desde cero para proporcionar la base para aplicaciones de transmisión confiables.
Beneficios del almacenamiento de código abierto
Matthew Hurford, vicepresidente de ingeniería de soluciones y CTO de campo de NetApp en Asia-Pacífico, señala que un beneficio clave del almacenamiento de código abierto es el acceso a la innovación.
“La comunidad de software de código abierto atrae a un gran grupo de talentos tecnológicamente diversos a nivel mundial. Motivados para resolver desafíos, estos talentos pueden contribuir a los códigos fuente abiertos existentes. Esta naturaleza colaborativa de las comunidades de código abierto da como resultado un ciclo virtuoso en el que el software resultante creado mejora con el tiempo a través de las revisiones colectivas de varios colaboradores”, agrega.
Por ejemplo, Apache Spark tiene más de 2000 desarrolladores y más de 3000 confirmaciones al año. Hubiera llevado casi 270 años desarrollar Spark fuera de un marco de código abierto. Linux tuvo más de 23 000 desarrolladores y 75 000 confirmaciones solo en los últimos 12 meses.
“En NetApp, continuaremos contribuyendo a las comunidades y proyectos de código abierto, como CNCF (Kubernetes, Helm e Istio), el kernel de Linux y muchos otros”, dice Hurford.
Otro beneficio es un menor tiempo de comercialización. Los procesos comerciales pueden ser más ágiles con una automatización y administración de datos efectivas. Se pueden realizar modificaciones a los productos rápidamente y mejorar la velocidad de implementación.
“ La integración continua y el despliegue continuo son ejemplos de esto. Además, el código abierto se puede personalizar según las necesidades de la organización. Debido a su naturaleza modular, los proveedores pueden ajustar el código fácilmente. Esto permite que el código abierto funcione tan completo como el software propietario en cualquier capa de la pila empresarial”, dice Hurford.
El código abierto también proporciona una gran cantidad de agilidad y flexibilidad, dice Ghariwala. Por ejemplo, al definir una arquitectura de software de administración de datos y almacenamiento, las organizaciones tienen la flexibilidad de elegir tecnologías de código abierto de múltiples proveedores, en lugar de estar encerradas en un solo proveedor.
“También tiene la agilidad de cambiar a otro proveedor de código abierto que brinde capacidades similares que podrían deberse a factores de costo, factores tecnológicos o incluso factores comerciales, como que un proveedor de código abierto sea adquirido por otro proveedor más grande que puede afectar la forma en que un cliente hace. negocio con el vendedor original.
“Con las soluciones propietarias, este nivel de agilidad y flexibilidad generalmente está disponible solo cuando se utilizan soluciones de ese proveedor o de algunos socios exclusivos de ellos”, señala.
Consideraciones de adopción
Si bien el software de almacenamiento de datos de código abierto es rentable, existe una gran diferencia entre descargar un proyecto de forma gratuita y probarlo en una máquina de desarrollador en lugar de utilizarlo para impulsar aplicaciones de misión crítica que tienen requisitos estrictos como estabilidad, alta disponibilidad y seguridad.
Ghariwala señala que las empresas necesitarán recursos técnicos sólidos para diseñar una solución que respalde sus requisitos de aplicaciones de misión crítica, así como recursos dedicados para clasificar los problemas de producción. Esto puede ser muy complejo para la mayoría de las organizaciones.
El segundo desafío al que se pueden enfrentar las empresas está relacionado con la flexibilidad, que no está garantizada cuando se utilizan tecnologías de código abierto. Ghariwala dice que el problema generalmente surge cuando los proveedores solo respaldan sus propias tecnologías con sus soluciones comerciales de código abierto, lo que crea un bloqueo y limita la capacidad de una organización para elegir la solución adecuada para sus necesidades.
Danny Elmarji, vicepresidente de preventa de Dell Technologies en Asia-Pacífico y Japón, señala que algunos clientes de Dell están comenzando a definir y utilizar su propio almacenamiento de software que se ejecuta en el hardware y la computación de Dell, aprovechando las contribuciones de código abierto.
Si bien estas organizaciones tienen el talento y las capacidades para respaldar, diseñar, construir y mantener el ciclo de vida de su pila personalizada definida por software, deben asegurarse de que sus capas de almacenamiento definidas por software estén diseñadas para integrarse con la plataforma de hardware y administrar su ciclo de vida y experiencia de soporte.
Teniendo en cuenta el fuerte aumento de las amenazas cibernéticas desde 2020, Elmarji también instó a las organizaciones a considerar los aspectos de resiliencia cibernética a medida que adoptan proyectos de código abierto.
“Los fundamentos de los productos de administración de datos y almacenamiento verdaderamente duraderos no han cambiado, y la eficiencia, el rendimiento, el rendimiento y la resiliencia todavía se consideran criterios principales al tomar decisiones de adquisición”, dice.
Para aprovechar un software de gestión de datos y almacenamiento de código abierto, Hurford dice que las organizaciones deberán considerar si el software puede admitir un entorno híbrido y de múltiples nubes, integrar Kubernetes sin problemas, permitir la escalabilidad y la agilidad con el almacenamiento y la gestión de datos.
Además de eso, será crucial garantizar que los datos estén protegidos y archivados de manera eficiente en cuanto al espacio.
“Una solución integral para la gestión del almacenamiento en la nube brinda a los usuarios facilidad de uso e integración inmediata con recursos en la nube y en las instalaciones. Esto aumentará en gran medida el tiempo que lleva poner en uso un servicio de archivos y limitará la sobrecarga involucrada en el mantenimiento de la solución”, agrega.
Fuente: Computer Weekly
Más información:
Fundaciones Linux y Apache Software organizan una conferencia sobre Big Data
Las fundaciones Linux y Apache Software organizan una conferencia sobre Big Data
Java Vs Python ¿Cuál es mejor para ciencia de datos?
Que triunfan en las grandes empresas Siete proyectos Open Source
Segun LinkedIn los trabajos con mas demanda