Synology
Imagem - Together Studios

Tudo sobre NAS Parte 2: Discos e RAID

Na segunda parte do nosso especial sobre sistemas NAS vamos falar da alma destes dispositivos: a armazenagem em si.

Como vimos na parte anterior, um sistema NAS é um dispositivo cuja função principal é a partilha de espaço de armazenagem por vários utilizadores através de uma rede local ou da Internet. Para o conseguir fazer, o utilizador tem de instalar e configurar os discos rígidos que vão disponibilizar esse espaço. Mas há algumas coisas a decidir primeiro.

Escolher discos para um NAS

Os discos rígidos são a razão de existir dos NAS. Para que um sistema deste tipo seja minimamente utilizável, as unidades de armazenamento que são usadas devem ser o mais rápidas possível, mas também o mais fiáveis possível. Porque ninguém gosta de perder dados inesperadamente.

Velocidade

Os discos rígidos mecânicos, ao contrário dos SSD, têm cabeças que percorrem os pratos giratórios do disco, para ler ou escrever fisicamente a informação numa zona específica. Isto cria um desfasamento de tempo entre o momento em que os dados são enviados para a unidade e a altura em que são escritos. Ou, se a informação estiver muito fragmentada no disco, pode demorar mais tempo a ser lida.

Para resolver este problema, os fabricantes usam algumas técnicas, como aumentar a velocidade de rotação dos discos dentro da unidade e uma pequena quantidade de memória RAM, que serve de tampão (cache) entre o disco e o resto do sistema, dando assim a impressão de que as operações de leitura e de escrita são mais rápidas.

Claro que estas duas técnicas têm os seus inconvenientes. Por exemplo, quando se aumenta a velocidade de rotação de um disco, reduz-se o tempo de vida da unidade. E quando se usa uma grande quantidade de memória cache, corre-se o risco de se perderem dados se acontecer uma perda de energia.

Fiabilidade

Como os sistemas NAS são pensados para estarem ligados horas a fio, para além da velocidade, um dos critérios para a escolha de um disco neste contexto é o da fiabilidade. O problema é que só de olhar para uma unidade de disco, não se consegue perceber se ele vai falhar em breve, ou nunca.

IronWOLF
Um disco rígido para NAS da gama IronWolf da Seagate.

Por isso, nos últimos anos, os fabricantes de discos rígidos começaram a vender discos próprios para NAS, que prometem mais fiabilidade e menos erros que os discos vendidos para instalação em PC.

Estes discos têm algumas diferenças (poucas) para os discos que se compram normalmente para instalar dentro de um computador:

Tolerância às vibrações. Os discos como dispositivos mecânicos que são geram vibrações. Esta vibração é absorvida através de pequenas peças de borracha que são colocadas nos pontos de montagem da unidade, mas há sempre alguma que é passada para a estrutura da drive. Os discos vendidos para NAS têm uma tolerância maior a essas vibrações quando são usados por longos períodos.

Menos velocidade de rotação. Para aumentar a fiabilidade das drives para NAS, estas têm velocidades de rotação um pouco mais baixas que as das drives para computador. As vantagens são aquecer menos, gerar menos vibração e consumir menos energia.

Firmware específico. O firmware dos discos para NAS está optimizado para funcionar em ambientes com mais do que um disco, como por exemplo em configurações RAID (que vamos abordar um pouco mais à frente), usadas normalmente em dispositivos NAS.

Ainda assim, é perfeitamente possível usar uma drive para computador num NAS, até é possível misturar os dois tipos de drives no mesmo dispositivo.

SSD

wd-red-sata-ssd-500gb.png.thumb.1280.1280
Uma unidade SSD de duas polegadas para sistemas NAS.

Também é possível usar drives SSD de 2 polegadas em baias para drives de 3,5 polegadas. Alguns modelos de NAS permitem a utilização de drives SSD M.2 para fins de cache ou de armazenamento tradicional. Ao usar uma destas drives como cache, acelera as operações principalmente de escrita para os discos mecânicos.

RAID

O que é RAID? A sigla RAID quis dizer inicialmente “Redundant Array of Inexpensive Drives” (Conjunto Redundante de Discos Baratos). Com o tempo, passou para “Redundant Array of Independent Disks” (Conjunto Redundante de Discos Independentes).

RAID está disponível em todos os dispositivos NAS, e é um meio de se criar um subsistema de armazenamento composto por vários discos individuais, com a finalidade de aumentar a segurança dos dados através da introdução de redundância e aumentar desempenho.

Ao configurar um sistema RAID no NAS, o utilizador tem de ter vários aspectos em atenção:

Capacidades dos discos. Os discos usados num sistema RAID (menos em JBOD) devem de ter a mesma capacidade, porque, se tiverem capacidades diferentes, o sistema vai ajustar pelo disco com menor capacidade. Por exemplo: se usar dois discos, um com 1 TB e outro com 2 TB, só será usado 1 TB do disco com 2 TB de capacidade no sistema RAID. As velocidades dos discos individuais são indiferentes, mas para um desempenho consistente, convém que ofereçam a mesma velocidade.

Nível de RAID. Existem vários níveis de RAID, que são designados por números. Alguns oferecem apenas velocidade, sem qualquer tipo de redundância, outros oferecem apenas redundância e outros tentam fazer uma mistura dos dois. Aconselhamos sempre a optar por um nível de RAID que ofereça um qualquer tipo de redundância, para evitar perdas de dados, caso um dos discos falhe, ou deixe de funcionar de todo.

Níveis de RAID

Originalmente, existiam 5 níveis de RAID, mas, ao longo do tempo, surgiram muitas variações, como níveis RAID híbridos (nested RAID) e níveis não padronizados (non-standard RAID, na maioria formatos proprietários).

RAID 0 (Striping)

No striping, ou distribuição, os dados são subdivididos em segmentos consecutivos (stripes, ou faixas) que são escritos sequencialmente através de cada um dos discos de um conjunto, ou array. Cada segmento tem um tamanho definido em blocos. A distribuição, ou striping, oferece melhor desempenho quando comparado com a utilização de discos individuais, se o tamanho de cada segmento for ajustado de acordo com a aplicação que utilizará o conjunto, ou array.
Este sistema oferece mais desempenho, mas não tem qualquer tipo de redundância. Neste caso, se um dos discos falhar, os dados que estão no sistema perdem-se todos.

RAID 1 (Mirroring)

RAID 1 é o nível de RAID que implementa o espelhamento de disco, também conhecido como mirror. Para esta implementação são necessários dois discos ou mais. O funcionamento deste nível é simples: todos os dados são gravados em discos diferentes; se um disco falhar ou for removido do NAS, os dados preservados no outro disco permitem manter a operação do sistema.

RAID 2

O RAID 2 surgiu no final dos anos 80, quando os discos ainda não tinham funcionalidades de verificação de erros. Assim, pode-se dizer que o RAID 2 é similar ao RAID 0, mas possui algoritmos de Hamming ECC (Error Correcting Code), que é a informação de controlo de erros, no lugar da paridade. Além disso, podem ter-se várias configurações, como 10 discos normais + 4 discos somente para ECC. Isto permite ter uma protecção adicional dos dados.

RAID 3

O RAID 3 é uma versão simplificada do RAID nível 2. Neste arranjo, um único bit de paridade é calculado para cada palavra de dados e escrito numa drive de paridade. À primeira vista, pode parecer que um único bit de paridade permite apenas a detecção de erros, e não a correcção de erros. No entanto, no caso da falha de falha de uma drive, este nível permite a correcção total de erros de um bit, uma vez que a posição do bit defeituoso é conhecida. Se uma drive falhar, o controlador apenas finge que todos os seus bits são “zeros”.

RAID 4

O RAID 4 funciona com três ou mais discos iguais. Um dos discos guarda a paridade (uma forma de soma de segurança) da informação contida nos outros discos. Se algum dos discos avariar, a paridade pode ser imediatamente utilizada para reconstituir o seu conteúdo. Os discos restantes, usados para armazenar dados, são configurados para usarem segmentos suficientemente grandes (tamanho medido em blocos) para acomodar um registo inteiro. Isto permite leituras independentes da informação armazenada, fazendo do RAID 4 um array perfeitamente ajustado para ambientes transaccionais que requerem muitas leituras pequenas e simultâneas.

RAID 5 (Distributed parity)

O RAID 5 é frequentemente usado e funciona similarmente ao RAID 4, mas supera alguns dos problemas mais comuns do RAID 4. As informações sobre paridade para os dados do array são distribuídas ao longo de todos os discos, em vez de serem armazenadas num disco dedicado, oferecendo assim mais desempenho que o RAID 4, e, simultaneamente, tolerância a falhas.
Se usar 8 discos com 20 GB cada um, em RAID 5, num total de 160 GB de dados, teremos 20 GB de paridade (capacidade de 1 dos discos) e 140 GB disponíveis.

RAID 6 (Dual parity)

Este nível RAID é semelhante ao RAID 5, no entanto usa o dobro de bits de paridade, garantindo a integridade dos dados caso até 2 dos discos falhem ao mesmo tempo. É necessário um mínimo de 4 discos para poder ser implementado. Ao usar 8 discos com 20 GB cada um, em RAID 6, para um total de 160 GB de dados, teremos 40 GB de paridade (capacidade de 2 discos) e 120 GB disponíveis.

RAID 10

O RAID 10 é uma combinação dos níveis 0 (Striping) e 1 (Mirroring). Cada par será espelhado (RAID 1), garantindo redundância, e os pares serão distribuídos (RAID 0), melhorando desempenho. Assim como o RAID 0+1, o RAID 10 exige pelo menos 4 discos rígidos, e em quantidade par. Até metade dos discos pode falhar simultaneamente, sem perder os dados no conjunto, desde que não falhem os dois discos de um espelho qualquer. É o nível recomendado para bases de dados, por ser o mais seguro e dos mais velozes, assim como qualquer outro uso onde a necessidade de economia não se sobreponha à segurança e desempenho.

JBOD

Embora esteja relacionado com o RAID, o JBOD não é um modo RAID, mas também é bastante usado, sobretudo em servidores de ficheiros. No JBOD (Just a Bunch Of Disks) a capacidade dos discos é somada e os discos passam a ser vistos pelo sistema como uma única unidade. Os ficheiros são simplesmente espalhados pelos discos, com cada um armazenando uma parte do total (neste caso ficheiros completos, e não fragmentos como no caso do RAID 0).

Em JBOD não existe qualquer ganho de desempenho, nem de fiabilidade. Caso ocorra um erro com um dos discos, os ficheiros armazenados nessa unidade são perdidos, mas os ficheiros armazenados nos outros mantêm-se intactos. Na verdade, o único ganho é ser prático, com a possibilidade de usar vários discos com capacidades diferentes para formar um único volume de grande capacidade, em vez de ter que espalhar os ficheiros e pastas entre os vários discos.


Depois de falarmos de como se podem configurar os discos, na parte seguinte vamos configurar um NAS do zero.