Nuevo módulo de expansión Samsung CXL.mem

En la industria informática, hemos vivido con PCIe como estándar durante mucho tiempo. Se utiliza para agregar funcionalidad adicional a un sistema: gráficos, almacenamiento, puertos USB, más almacenamiento, red, tarjetas complementarias, almacenamiento, tarjetas de sonido, Wi-Fi. Oh, ¿mencioné la memoria? Bueno, lo único que no pudimos poner en una ranura PCIe es DRAM; no me refiero a DRAM como dispositivo de almacenamiento, sino a memoria que en realidad se agrega al sistema como DRAM utilizable. En 2019 se introdujo un nuevo estándar CXL que utiliza una conexión PCIe 5.0 como interfaz física. Parte de este estándar es CXL.memory: la capacidad de insertar DRAM en un sistema a través de una ranura CXL / PCIe. Samsung presenta hoy el primer módulo DRAM especialmente desarrollado de esta manera.

CXL: un repaso

El estándar CXL original comenzó como un proyecto de investigación dentro de Intel para crear una interfaz que admitiera aceleradores, E / S, caché y memoria. Luego, la compañía se dividió en su propio consorcio con más de 50 miembros y el apoyo de los principales actores de la industria: Intel, AMD, Arm, IBM, Broadcom, Marvell, NVIDIA, Samsung, SK Hynix, WD y otros. El último estándar es CXL 2.0, que se completó en noviembre de 2020.

El estándar CXL 1.1 cubre tres conjuntos de peculiaridades conocidas como CXL.io, CXL.memory y CXL.cache. Estos permiten un control más profundo sobre los dispositivos conectados, así como una expansión de las posibilidades. El consorcio CXL ve tres áreas principales para esto:

El primer tipo es un caché / acelerador, p. Ej. B. un motor de descarga o un SmartNIC (un controlador de red inteligente). Con las propiedades CXL.io y CXL.cache, el controlador de red puede ordenar y analizar los datos entrantes y filtrar los datos requeridos directamente en la memoria del procesador principal.

El segundo tipo es un acelerador con memoria y acceso directo al HBM en el acelerador desde el procesador (así como acceso a DRAM desde el acelerador). La idea es un diseño aritmético pseudo-heterogéneo que permite solucionadores aritméticos más simples pero densos.

Quizás el tercer tipo es lo que más nos interesa hoy: los búferes de memoria. Con CXL.memory se puede instalar un búfer de memoria a través de una conexión CXL y la memoria conectada se puede combinar directamente con la memoria del sistema. Esto permite un mayor ancho de banda de memoria o una mayor expansión de memoria del orden de miles de gigabytes.

CXL 2.0 también presenta CXL.security, soporte para almacenamiento persistente y funciones de conmutación.

Cabe señalar que CXL utiliza la misma interfaz eléctrica que PCIe. Esto significa que cada dispositivo CXL tiene un conector PCIe físico. Además, CXL usa PCIe durante el inicio. Por lo tanto, actualmente todos los dispositivos compatibles con CXL también deben admitir una conexión PCIe a PCIe, de modo que cada controlador CXL sea también un controlador PCIe de forma predeterminada.

Una de las preguntas más comunes que he visto es qué pasaría si se hiciera una CPU CXL pura. Dado que CXL y PCIe están entrelazados, una CPU no solo puede ser CXL, también debe admitir conexiones PCIe. Desde la otra dirección: si vemos tarjetas gráficas basadas en CXL, por ejemplo, estas también tendrían que inicializarse a través de PCIe al menos. Sin embargo, si CXL no está inicializado, los modos de trabajo completos pueden no ser posibles.

Intel presentará CXL 1.1 sobre PCIe 5.0 con sus procesadores Sapphire Rapids. Microchip ha anunciado retimers basados ​​en PCIe 5.0 y CXL para extensiones de seguimiento de la placa base. Samsung marca hoy el tercer anuncio de dispositivos compatibles con CXL. IBM tiene una tecnología similar llamada OMI (OpenCAPI Memory Interface), pero no ha encontrado una aceptación generalizada fuera de los propios procesadores de IBM.

Índice

    Módulo de memoria CXL de Samsung

    Los procesadores modernos utilizan controladores de memoria para el acceso DRAM conectado. Los procesadores x86 de primera línea tienen ocho canales DDR4, mientras que varios aceleradores han tomado la ruta de HBM. Uno de los factores que limitan el aumento del ancho de banda de la memoria es el número de controladores, que también puede limitar la capacidad. Además, la memoria debe estar validada y entrenada para trabajar con un sistema. La mayoría de los sistemas no están diseñados para simplemente agregar o eliminar almacenamiento, como es el caso de un dispositivo de almacenamiento.

    Ingrese CXL y la opción de agregar almacenamiento como un dispositivo de almacenamiento. Samsung presenta hoy un módulo CXL que está completamente equipado con DDR5. Utiliza un enlace PCIe 5.0 x16 completo que permite 32 GT / s bidireccionales teóricos, pero con varios TB de almacenamiento detrás de un controlador de búfer. Similar a la forma en que compañías como Samsung empaquetan NAND en un factor de forma U.2 con enfriamiento adecuado, Samsung también lo hace aquí, pero con DRAM.

    La DRAM sigue siendo una memoria volátil y los datos se perderán si se interrumpe el suministro de energía. (Dudo que también sea intercambiable en caliente, pero sucedieron cosas más extrañas). Se puede usar almacenamiento permanente, pero solo con CXL 2.0. Samsung no ha declarado si su dispositivo es compatible con CXL 2.0, pero debería ser al menos CXL 1.1, ya que actualmente se está probando con la plataforma Sapphire Rapids de Intel.

    Cabe señalar que una ranura DRAM moderna normalmente está diseñada para un máximo de ~ 18 W. Los únicos módulos en esta ventana son Optane DCPMM de Intel, pero un módulo DDR4 de 256 GB estaría en ese rango de ~ 10 + W. Supongo que un módulo CXL adicional de 2TB como este funcionaría alrededor de 70-80W. Agregar esa cantidad de DRAM a través de la interfaz CXL probablemente requeriría un enfriamiento activo, así como el gran disipador de calor que sugieren estos renderizados.

    Samsung no da ningún detalle sobre el módulo que revelan aparte de que está basado en CXL e incluye DDR5. No solo eso, las "fotos" proporcionadas también son muy similares a la renderización. Por lo tanto, es difícil decir si hay una unidad estética disponible para fotografía o si hay un controlador en funcionamiento en algún lugar de un laboratorio de actualización que haya validado un sistema. Como parte del anuncio, Samsung citó a AMD e Intel, indicando con qué socios están trabajando más de cerca y lo que tienen hoy se validará en los servidores Intel de próxima generación. Está previsto que los servidores de próxima generación de Intel, Sapphire Rapids, lleguen al mercado a finales de año. Esto está en línea con el contrato de supercomputación de Aurora, que originalmente estaba programado para enviarse a fin de año.

    Lectura relacionada

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

    Subir