¿Incluir Die RAID garantiza que los SSD ofrezcan un rendimiento continuo a largo plazo?

La corrección de errores es una función esencial en todos los productos de almacenamiento y memoria. Los bits de error son inevitables, ya sea porque los productos se acercan al final de su vida útil o debido a las radiaciones cósmicas dispersas.

Florencia Gómez Forti junio 5, 2020

3 minutos de lectura

Cuestiones como la Ley de Moore —que ha impulsado el desarrollo de semiconductores cada vez más pequeños— y la necesidad de capacidad —que implica más bits en cada espacio disponible— han aumentado aún más el problema de los bits de error en los últimos años. Sin la aplicación de contramedidas, esto conllevaría el fallo de los dispositivos flash NAND modernos después de un tiempo relativamente corto.

Aquí es donde Die RAID se perfila como una magnífica herramienta para combatir los bits de error y es también una de las razones por las que algunos SSDs parecen tener capacidades por debajo de la tabla de potencias de dos estándares. El SSD reservará espacio para los datos de paridad utilizados para corregir los bits de error que otras medidas de corrección de errores no hayan podido mitigar.

A continuación, analizaremos por qué la combinación de Die RAID con otras soluciones de corrección de errores como LDPC es uno de los métodos más eficaces para aumentar los ciclos P/E (Program/Erase) y garantizar un rendimiento duradero de la memoria flash.

Antecedentes

Código BCH: este método popular de corrección de errores usado en flash NAND, así como en la comunicación por satélite que utiliza la toma de decisiones de tipo «hard». BCH prácticamente alcanzó la ubicuidad en el mercado de los SSD debido a su eficacia. Sin embargo, dadas las recientes limitaciones a tenor de los avances en la tecnología flash NAND, está siendo reemplazado por la comprobación de paridad de baja densidad como el método ECC preferido para los SSD.
Código LDPC: actualmente, LDPC es la función ECC estándar de la mayoría de los SSD. Ofrece una mayor capacidad de corrección de errores en comparación con el código BCH utilizando una toma de decisiones de tipo «soft» que, explicada de forma sencilla, permite una identificación más precisa de la cadena de bits original después de que se haya producido un error.
Matriz redundante de unidades de disco independientes (RAID): RAID describe varios métodos para organizar dos o más unidades de almacenamiento a fin de garantizar la integridad de los datos (y/o un mejor rendimiento). Esto se puede conseguir mediante la duplicación – RAID 1- (copia los datos de una unidad a otra garantizando que un conjunto de datos esté disponible incluso si la otra unidad falla), la separación (se escriben los conjuntos de datos en las diferentes unidades, en lugar de almacenarlos todos en una sola unidad ) y el almacenamiento de datos de paridad -RAID 5- (empleado en configuraciones de tres o más unidades que almacenan un conjunto de datos de paridad en una unidad que puede utilizarse para recuperar datos de cualquier otra unidad que falle)
Función XOR: describe la forma básica en la que se determina un bit de paridad.

Desafíos

La disminución del tamaño físico de las celdas flash NAND nos permite añadir más celdas por unidad de área, lo que nos da una mayor capacidad por circuito integrado. Sin embargo, también conlleva un mayor riesgo de interferencia en la carga atrapada dentro de la celda, lo que a su vez hace aumentar la tasa de bits de error.

Esto se agravará con la creación de celdas para contener más bits, ya que el búfer entre cada nivel de voltaje disminuye y es más probable que ocurran errores de lectura.

Soluciones

Die RAID sigue el mismo principio que el estándar RAID para las unidades de almacenamiento (RAID 5). En lugar de dividir los datos en las unidades, Die RAID divide los datos en diferentes matrices con un búfer de paridad que se añade a cada conjunto.

Junto al sobre aprovisionamiento, Die RAID ocupará una cierta cantidad de espacio en el SSD. El siguiente cuadro muestra un ejemplo de la diferencia de distribución entre un SSD con Die RAID y un SSD estándar.

El motor RAID ubicado dentro del controlador es lo que decide cómo se deben almacenar los datos recibidos por el SSD. El motor crea las divisiones RAID y ejecuta la recuperación de RAID si se detectan bits de error y otras funciones ECC no logran mitigar el problema.

Esto significa que Die RAID actúa como una capa adicional de defensa contra los bits de error y, en última instancia, aumenta la vida útil de cualquier SSD. Por eso se recomienda que, de forma predeterminada, los SSD retrasen el inicio de los reintentos de lectura y aumenten el número de ciclos P/E totales.

Ver que parte de la capacidad de los SSD está reservada para la corrección de errores puede resultar confuso al principio. Pero cuando se comprende la necesidad de resistencia de los SSD, especialmente en el campo industrial, Die RAID contribuye en gran medida a garantizar una mayor vida útil y una mayor integridad general de los datos.

Por Emilio Huang Account Manager at Innodisk Corporation, Latin America Region.

Para obtener mayor información acerca de los productos Innodisk, haz click aquí.

Autor

Florencia Gómez Forti

Periodista y Social Media Manager especializada en tecnología y espectáculos. Comenzó su camino en el mercado IT de la mano de ITSitio y hoy es Editora de Contenidos para toda la región. Realiza coberturas especiales internacionales y nacionales para marcas como HP Inc. e IBM.
Ver todas las entradas