RAID 5 frente a RAID 6

Los diferentes niveles de RAID ofrecen diferentes beneficios. Algunos ofrecen mejoras de rendimiento al agrupar la capacidad de almacenamiento y E/S de lectura/escritura, mientras que otros protegen contra fallas de hardware al proporcionar redundancia de datos.

De estos niveles, RAID 5 y 6 han sido dos de los más populares últimamente, ya que ofrecen una combinación de rendimiento y seguridad. Debido a sus diversas similitudes, determinar cuándo es mejor usar RAID 5 versus RAID 6 puede ser confuso.

Por lo tanto, en este artículo, discutiremos qué son exactamente estos dos niveles de RAID, cuáles son sus principales similitudes y diferencias, y cuándo se debe usar uno de los dos.

¿Qué es RAID5?

Como se mencionó anteriormente, los diferentes niveles de RAID se enfocan en la protección de datos y la mejora del rendimiento en diferentes grados. RAID 5 ofrece paridad distribuida y de bloques intercalados.

Formato de matriz RAID 5

Por lo tanto, el rayado tiene lugar a nivel de bloque. El usuario puede configurar el tamaño de estos bloques, también conocido como tamaño de fragmento, pero normalmente oscila entre 64 KB y 1 MB.

También se escribe un dato de paridad para cada franja. Estos bloques de paridad se encuentran dispersos en la matriz en lugar de almacenarse en un disco de paridad dedicado.

Discutiremos por qué RAID 5 maneja la paridad de esta manera más adelante en este artículo, pero en última instancia, esto da como resultado que se reserve espacio para los datos de paridad.

ventajas:

  • Tolerancia a fallas contra fallas de un solo disco
  • Alta capacidad de almacenamiento utilizable
  • Alta velocidad de lectura
  • Puede configurarse con un controlador de hardware o implementarse en software
Desventajas:

  • Penalización por logro de escritura
  • Solo puede manejar un error de disco. Más dará como resultado una falla en la matriz
  • Proceso de recuperación arriesgado

¿Qué es RAID6?

RAID 6 es muy similar a RAID 5, pero utiliza dos bloques de paridad distribuidos en una franja en lugar de uno solo. Ese detalle lo cambia todo, desde la tolerancia a fallas del arreglo hasta su rendimiento y almacenamiento utilizable.

Formato de matriz RAID 6

Escribir la paridad dos veces hace que la matriz sea mucho más confiable, pero al mismo tiempo el rendimiento de escritura sufre el doble. Sin embargo, al igual que con RAID 5, el rendimiento de lectura es excelente.

ventajas:

  • Tolerancia a fallos frente a dos fallos de disco
  • Gran rendimiento de lectura.
  • La recuperación de fallas del disco duro es más segura
Desventajas:

  • Mayor sobrecarga de rendimiento de escritura
  • Se requieren dos discos para la paridad

Diferencias clave entre RAID 5 y RAID 6

RAID 5 y 6 se diferencian principalmente en que RAID 6 usa dos bloques de paridad por franja, mientras que RAID 5 usa solo uno. Pero como se mencionó, esto también conduce a una serie de otras diferencias, que discutiremos en las siguientes secciones.

Tolerancia a fallos

Lo primero que afecta la cantidad de bloques de paridad es el nivel de tolerancia a fallas. En una matriz RAID 5, se escribe un bloque de datos de paridad para cada franja. En caso de que falle una unidad, los datos perdidos se pueden volver a calcular utilizando los datos de paridad y los datos de las otras unidades de la matriz.

Leer:   Cómo transferir fotos a una tarjeta SD
error raid5

Básicamente, esto significa que una matriz RAID 5 puede manejar una sola falla de disco sin pérdida de datos. Por lo general, de todos modos. Esta tolerancia a fallas fue la razón por la cual RAID 5 fue muy popular hasta la década de 2010. Hoy, sin embargo, RAID 5 rara vez se usa porque su confiabilidad ya no es satisfactoria. Esto se debe a la forma en que la mayoría de los controladores RAID de hardware manejan las recuperaciones.

Normalmente, si el controlador encuentra un error de lectura irrecuperable (URE) durante la reconstrucción, marca todo el arreglo como fallido para evitar más daños en los datos. A menos que tenga copias de seguridad o planee recuperar datos de unidades individuales, los datos se perderán.

Los discos duros han crecido exponencialmente en tamaño durante las últimas dos décadas, pero las velocidades de lectura/escritura han sido mucho más moderadas. Esencialmente, los tamaños de las matrices crecieron mucho más rápido que las tasas de transferencia de datos, lo que significa que los tiempos de recuperación se hicieron muy largos.

Según la configuración, puede llevar horas o días recuperar la matriz de una falla del disco duro. Dichos tiempos de recuperación significaban una mayor probabilidad de encontrar URE durante la recuperación, lo que generaba una mayor probabilidad de que fallara todo el arreglo.

En los últimos años, las frecuencias URE en los discos duros se han reducido significativamente debido a los avances tecnológicos. Por lo tanto, RAID 5 se usa aquí y allá. Pero el consenso general en la industria es optar por RAID 6 u otros niveles, y con razón.

Con RAID 6, los datos de paridad se escriben dos veces por banda. Esto significa que una matriz RAID 6 puede sobrevivir hasta dos fallas del disco duro sin pérdida de datos. Esto hace que RAID 6 sea mucho más confiable, lo que lo hace más adecuado para arreglos más grandes con datos críticos.

rendimiento de escritura

cabezal de disco duro

Una matriz RAID 5 debe leer los datos, calcular la paridad, escribir los datos y luego la paridad. Como resultado, RAID 5 se ve penalizado por las cargas de trabajo de solo escritura.

Con RAID 6, la paridad se calcula y se escribe dos veces, lo que es excelente para la confiabilidad, pero también significa el doble de sobrecarga para las escrituras.

Para tamaños de E/S más pequeños (normalmente 256 KB e inferiores), RAID 5 y 6 tienen un rendimiento de escritura muy similar. Pero para tamaños de E/S más grandes, RAID 5 es definitivamente superior.

número de discos

RAID 5 requiere dos discos para creación de bandas y un disco para almacenar datos de paridad. Esto significa que una matriz RAID 5 requiere al menos 3 unidades.

RAID 6 es similar pero requiere al menos 4 discos ya que los datos de paridad ocupan espacio en dos discos.

Leer:   ¿Cómo usar una tarjeta gráfica dedicada en lugar de una tarjeta gráfica integrada?

memoria utilizable

En una matriz RAID 5, el espacio utilizable se puede calcular como (N – 1) x (tamaño de disco más pequeño), donde N es el número de unidades de disco. Por ejemplo, a continuación mostramos una matriz RAID 5 con tres unidades de 1 TB. Se utiliza un disco duro para almacenar datos de paridad y, dado que el tamaño más pequeño del disco duro es de 1 TB, el espacio utilizable es de 2 TB.

raid 5 memoria utilizable

Es importante usar unidades del mismo tamaño, de lo contrario, la unidad más pequeña crearía un cuello de botella, lo que resultaría en una gran cantidad de espacio desperdiciado. El siguiente ejemplo muestra el mismo escenario en el que la unidad de 500 GB ha provocado que 1,5 TB queden inutilizables.

raid 5 cuello de botella por espacio en disco no utilizado

En una matriz RAID 6, el almacenamiento utilizable se calcula mediante (N – 2) x (tamaño de disco más pequeño). Una vez más, es importante utilizar unidades del mismo tamaño para asegurarse de que no haya espacio inutilizable en la matriz.

Raid de memoria utilizable 6

calculo de paridad

En RAID 5, cada byte de datos se somete a XOR para calcular la información de paridad en RAID 5. Por ejemplo, suponga que el primer byte de datos en una matriz de 4 discos se parece a esto:

A1-11010101
A2-10001100
A3-10101100

Si hacemos una operación XOR en las dos primeras tiras (A1 y A2) y luego hacemos lo mismo con la salida y la tercera tira (A3), la salida es la información de paridad (Ap). En este caso el valor es 11110101.

Si un disco (por ejemplo, el disco 1) falla, ocurre lo siguiente. Primero, A2 XOR A3 nos da la salida 00100000. Si usamos esta salida en una operación XOR con Ap, obtenemos como resultado 11010101, que son los datos perdidos.

0010000
11110101
11010101

De esa manera, esencialmente los datos de paridad se calculan y utilizan para volver a calcular los datos perdidos en RAID 5.

RAID 6 es mucho más complejo ya que calcula la paridad dos veces. Dependiendo de la configuración, esto se implementa de diferentes maneras, por ejemplo, B. cálculo de datos de verificación doble (paridad y Reed-Solomon), datos de verificación de paridad doble ortogonal, paridad diagonal, etc.

controlador RAID

RAID 5 se puede implementar tanto con hardware como con software. El primero, obviamente, implica el uso de un controlador RAID de hardware dedicado. Debido a que RAID 5 requiere un cálculo de paridad, esta es la ruta recomendada.

Esto es particularmente importante en ciertos casos, como B. en un NAS donde el procesador no es lo suficientemente potente para realizar los cálculos sin crear un cuello de botella significativo.

controlador de redada

Si bien no es ideal por motivos de rendimiento, RAID 5 también se puede configurar mediante soluciones de software. Por ejemplo, Windows le permite fusionar sus unidades con la función Espacios de almacenamiento. También puede crear un volumen RAID 5 desde Administración de discos.

Leer:   Comprobación de la memoria de la tarjeta gráfica

RAID 6, por otro lado, requiere un controlador RAID de hardware. Esto se debe a que los cálculos de polinomios realizados para calcular la segunda capa de paridad son bastante intensivos en el procesador.

¿Son similares RAID 5 y RAID6?

En este punto, debe quedar claro que, si bien RAID 5 y 6 tienen algunas diferencias clave, también son similares en muchos aspectos. Primero, RAID 1, RAID 5 y 6 brindan tolerancia a fallas a través de la paridad en lugar de la duplicación.

Específicamente, usan paridad distribuida, que es diferente de los discos de paridad especiales usados ​​por RAID 2, 3 y 4. Con paridad distribuida, no tiene que preocuparse por los cuellos de botella como lo haría con un solo disco de paridad.

Tanto RAID 5 como 6 tienen un excelente rendimiento de lectura gracias a la distribución de datos. Pero de manera similar, ambos también sufren impactos en el rendimiento de escritura, aunque en diferentes grados.

¿Qué tiene de bueno RAID 5?

RAID 5 ofrece una buena combinación de espacio utilizable, protección de datos y rendimiento. También puede configurarlo con menos unidades, lo que lo convierte en una opción económica.

Si quiere pensar en términos de rendimiento, RAID 5 es mejor para grandes cargas de trabajo de lectura como: B. Servidor de correo electrónico.

En cuanto a la tolerancia a fallos, ya hemos hablado de cómo RAID 5 se ha vuelto menos fiable con el paso de los años. Todavía está bien para arreglos pequeños, pero no recomendamos RAID 5 para arreglos más grandes donde es más probable que se produzcan fallas en la reconstrucción.

¿Cuándo es mejor RAID 6?

La confiabilidad de RAID 6 se logra a expensas del rendimiento de escritura y el espacio de almacenamiento utilizable. Sin embargo, esa pequeña diferencia sin duda vale la pena si los datos en las unidades son importantes.

RAID 6 no es el más adecuado para arreglos más pequeños (por ejemplo, 4 unidades) ya que se pierde una cantidad significativa de almacenamiento debido a la redundancia. Si se requiere redundancia en arreglos pequeños, RAID 5 o algo como RAID 10 sería mejor.

En cambio, RAID 6 es mejor para arreglos más grandes que tienen el potencial de perder muchos más datos si la instalación no es confiable.

Veredicto final: RAID 5 frente a RAID 6

RAID 5 no es del todo poco confiable y aún se puede usar para arreglos más pequeños. Pero para los datos realmente críticos, desea priorizar la protección sobre las diferencias sutiles en el rendimiento, y ahí es donde entra en juego RAID 6.

Sin embargo, independientemente del nivel de RAID que elija, es importante comprender que RAID no es una copia de seguridad. La redundancia RAID solo protege contra fallas del disco duro. Incluso una matriz RAID 6 puede fallar durante la reconstrucción.

Si los datos en las unidades son lo suficientemente importantes como para ejecutar RAID 6 u otras versiones «confiables», tampoco realice copias de seguridad ni patrullas. Finalmente, para resumir las principales diferencias entre RAID 5 y RAID 6:

RAID 5 RAID6
capas de paridad Los datos de paridad se calculan una vez. Los datos de paridad se calculan dos veces.
Tolerancia a fallos Puede tolerar fallas en el disco duro. Puede tolerar fallas de dos placas.
rendimiento de escritura El rendimiento de la escritura sufre algún castigo. El rendimiento de escritura tiene una sobrecarga relativamente mayor.
Unidades mínimas Se requieren al menos 3 unidades. Se requieren al menos 4 unidades.
memoria utilizable Proporciona más espacio de almacenamiento utilizable. El espacio de almacenamiento utilizable es relativamente pequeño.
calculo de paridad La paridad se calcula mediante una simple operación XOR. La paridad se calcula usando XOR junto con otros algoritmos complejos.
implementación Se puede implementar con soluciones de hardware o software. Requiere un controlador RAID de hardware dedicado.

Gracias por leer absolutoyrelativo.com. ¡Hasta la próxima!

Deja un comentario