Los investigadores del MIT han diseñado un novedoso sistema de almacenamiento flash que podría reducir a la mitad la energía y el espacio físico necesarios para uno de los componentes más caros de los centros de datos: el almacenamiento de datos.
Los centros de datos son granjas de servidores que facilitan la comunicación entre los usuarios y los servicios web, y son algunas de las instalaciones con mayor consumo de energía del mundo. En ellas, miles de servidores que consumen mucha energía almacenan datos de los usuarios y servidores separados ejecutan servicios de aplicaciones queacceder a esos datos. Otros servidores a veces facilitan el cálculo entre esos dos grupos de servidores.
La mayoría de los servidores de almacenamiento de hoy en día usan unidades de estado sólido SSD, que usan almacenamiento flash, microchips de memoria programables y borrables electrónicamente sin partes móviles, para manejar solicitudes de datos de alto rendimiento a altas velocidades.En la Conferencia Internacional de ACM sobre Soporte Arquitectónico para Lenguajes de Programación y Sistemas Operativos, los investigadores describen un nuevo sistema llamado LightStore que modifica los SSD para conectarse directamente a la red de un centro de datos, sin necesidad de ningún otro componente, y para admitir computacionalmente más simple y más eficienteoperaciones de almacenamiento de datos. Otras innovaciones de software y hardware integran perfectamente el sistema en la infraestructura del centro de datos existente.
En experimentos, los investigadores encontraron un grupo de cuatro unidades LightStore, llamadas nodos de almacenamiento, que funcionaban dos veces más eficientemente que los servidores de almacenamiento tradicionales, medido por el consumo de energía necesario para las solicitudes de datos de campo. El grupo también requería menos de la mitad del espacio físico ocupadopor servidores existentes.
Los investigadores desglosaron el ahorro de energía mediante operaciones de almacenamiento de datos individuales, como una forma de capturar mejor el ahorro total de energía del sistema. En la "escritura aleatoria" de datos, por ejemplo, que es la operación más intensiva en computación en memoria flash, LightStore funcionó casiocho veces más eficiente que los servidores tradicionales.
La esperanza es que, algún día, los nodos LightStore puedan reemplazar los servidores que consumen mucha energía en los centros de datos. "Estamos reemplazando esta arquitectura con una solución de almacenamiento más simple y barata ... eso va a tomar la mitad de espacio y la mitad de la energía, sin embargo, proporciona el mismo rendimiento de capacidad de rendimiento ", dice el coautor Arvind, el profesor Johnson en Ingeniería en Ciencias de la Computación e investigador en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial." Eso lo ayudará en el gasto operativo, ya que consume menos energía,y gastos de capital, porque el ahorro de energía en los centros de datos se traduce directamente en ahorro de dinero ".
Uniéndose a Arvind en el papel están: el primer autor Chanwoo Chung, un estudiante graduado en el Departamento de Ingeniería Eléctrica y Ciencias de la Computación; y los estudiantes graduados Jinhyung Koo y Junsu Im, y el Profesor Sungjin Lee, todos del Instituto de Ciencia Daegu Gyeongbuk yTecnología DGIST.
Agregando "valor" a flash
Un problema importante de eficiencia con los centros de datos actuales es que la arquitectura no ha cambiado para acomodar el almacenamiento flash. Hace años, los servidores de almacenamiento de datos consistían en discos duros relativamente lentos, junto con muchos circuitos dinámicos de memoria de acceso aleatorio DRAMy unidades centrales de procesamiento CPU que ayudan a procesar rápidamente todos los datos que ingresan desde los servidores de aplicaciones.
Sin embargo, hoy en día, los discos duros se han reemplazado en su mayoría por unidades flash mucho más rápidas ". La gente simplemente conectó la memoria flash donde solían estar los discos duros, sin cambiar nada más", dice Chung. "Si solo puede conectar unidades flash directamentepara una red, no necesitará estos costosos servidores de almacenamiento ".
Para LightStore, los investigadores primero modificaron las SSD para acceder a ellas en términos de "pares clave-valor", un protocolo muy simple y eficiente para recuperar datos. Básicamente, las solicitudes de los usuarios aparecen como claves, como una cadena de números. Las claves se envíana un servidor, que libera los datos valor asociados con esa clave.
El concepto es simple, pero las claves pueden ser extremadamente grandes, por lo que computarlas buscarlas e insertarlas únicamente en SSD requiere mucha potencia de cálculo, que es utilizada por la tradicional "capa de traducción flash". Este software bastante complejo se ejecuta enun módulo separado en una unidad flash para administrar y mover datos. Los investigadores utilizaron ciertas técnicas de estructuración de datos para ejecutar este software de administración flash utilizando solo una fracción de la potencia informática. Al hacerlo, descargaron el software completamente en un pequeño circuito enla unidad flash que funciona de manera mucho más eficiente.
Esa descarga libera CPU separadas que ya están en el disco, que están diseñadas para simplificar y ejecutar la computación más rápidamente, para ejecutar el software LightStore personalizado. Este software utiliza técnicas de estructuración de datos para procesar eficientemente las solicitudes de pares de valores clave.sin cambiar la arquitectura, los investigadores convirtieron una unidad flash tradicional en una unidad de valor clave. "Entonces, estamos agregando esta nueva característica para flash, pero realmente no estamos agregando nada", dice Arvind.
Adaptación y escalado
El desafío consistía en garantizar que los servidores de aplicaciones pudieran acceder a los datos en los nodos LightStore. En los centros de datos, las aplicaciones acceden a los datos a través de una variedad de protocolos estructurales, como sistemas de archivos, bases de datos y otros formatos. Los servidores de almacenamiento tradicionales ejecutan software sofisticado que proporcionalos servidores de aplicaciones acceden a través de todos estos protocolos, pero esto utiliza una buena cantidad de energía de cálculo y no es adecuado para ejecutarse en LightStore, que depende de recursos computacionales limitados.
Los investigadores diseñaron un software muy computacionalmente ligero, llamado "adaptador", que traduce todas las solicitudes de los usuarios de los servicios de aplicaciones en pares clave-valor. Los adaptadores usan funciones matemáticas para convertir información sobre los datos solicitados, como comandos de losprotocolos y números de identificación del servidor de aplicaciones - en una clave. Luego envía esa clave al nodo LightStore apropiado, que encuentra y libera los datos emparejados. Debido a que este software es computacionalmente más simple, puede instalarse directamente en los servidores de aplicaciones.
"Independientemente de los datos a los que acceda, hacemos una traducción que me dice la clave y el valor asociado con ella. Al hacerlo, también estoy quitando algo de complejidad a los servidores de almacenamiento", dice Arvind.
Una innovación final es que agregar nodos LightStore a un clúster se escala linealmente con el rendimiento de datos: la velocidad a la que se pueden procesar los datos. Tradicionalmente, las personas apilan SSD en los centros de datos para abordar un mayor rendimiento. Pero, aunque la capacidad de almacenamiento de datos puede crecer, el rendimiento se estabilizó después de unas pocas unidades adicionales. En experimentos, los investigadores descubrieron que cuatro nodos LightStore superan los niveles de rendimiento en la misma cantidad de SSD.
Fuente de la historia :
Materiales proporcionado por Instituto de Tecnología de Massachusetts . Original escrito por Rob Matheson. Nota: El contenido puede ser editado por estilo y longitud.
Cita esta página :