Durante anos, o armazenamento automatizado por níveis tem sido uma solução essencial para empresas que procuram gerenciar a área ocupada de seu data center com eficiência e, ao mesmo tempo, reduzir o custo total de propriedade (TCO). A estratégia é simples: use algoritmos e políticas de classificação automática e mantenha os dados ativos no armazenamento primário enquanto move os dados inativos para categorias de armazenamento econômicas. Nos últimos anos, o Cloud Tiering surgiu como uma solução robusta e econômica que gerencia a movimentação de dados inativos para armazenamento de objetos de baixo custo na nuvem. Com a série ThinkSystem DM, a Lenovo permite que as empresas gerenciem alternativas de dados e nuvem com uma solução de armazenamento inteligente. Essa estratégia de nuvem aborda com sucesso a capacidade, agilidade e segurança em ambientes de nuvem híbrida, sem comprometer a capacidade de gerenciamento, segurança ou desempenho.
Durante anos, o armazenamento automatizado por níveis tem sido uma solução essencial para empresas que procuram gerenciar a área ocupada de seu data center com eficiência e, ao mesmo tempo, reduzir o custo total de propriedade (TCO). A estratégia é simples: use algoritmos e políticas de classificação automática e mantenha os dados ativos no armazenamento primário enquanto move os dados inativos para categorias de armazenamento econômicas. Nos últimos anos, o Cloud Tiering surgiu como uma solução robusta e econômica que gerencia a movimentação de dados inativos para armazenamento de objetos de baixo custo na nuvem. Com a série ThinkSystem DM, a Lenovo permite que as empresas gerenciem alternativas de dados e nuvem com uma solução de armazenamento inteligente. Essa estratégia de nuvem aborda com sucesso a capacidade, agilidade e segurança em ambientes de nuvem híbrida, sem comprometer a capacidade de gerenciamento, segurança ou desempenho.
Este artigo discute como Soluções de armazenamento Lenovo ThinkSystem e a série DM oferece uma estratégia de data center de ponta a ponta, desde o local até a nuvem. Em primeiro lugar, abordaremos alguns conceitos fundamentais sobre armazenamento de dados, camadas de nuvem e novos desafios de gerenciamento de armazenamento. Veremos o ecossistema de gerenciamento de dados da Lenovo e como a empresa se destaca no mercado de armazenamento com a série DM. Além disso, examinaremos de perto o software ONTAP e as políticas de armazenamento em camadas do FabricPool. E, finalmente, em nosso laboratório, mostraremos a configuração e a validação da solução de classificação em nuvem da Lenovo.
Em um modelo de data center tradicional, à medida que uma empresa cresce, ela começa a coletar dados e arquivos críticos em suas instalações. No entanto, esses dados eventualmente se tornam antigos e raramente são acessados, apropriando-se de desempenho e capacidade valiosos do armazenamento primário e secundário, impactando cargas de trabalho críticas. Arquivar esses dados no passado era uma solução prática para as empresas; no entanto, ao fazer isso, os dados não ficam imediatamente disponíveis caso sejam necessários repentinamente.
Esse problema criou consciência entre as organizações de TI para considerar camadas de armazenamento com diferentes características de capacidade, custo e desempenho. Eles também precisam reconhecer e estar preparados para atender aos requisitos de crescimento de dados em ambientes múltiplos e em nuvem. O Cloud Tiering é a resposta e deve ser considerado em arquiteturas de armazenamento modernas. Caso contrário, uma pegada de dados em expansão sobrecarregará o investimento que a empresa fez em armazenamento primário de alto desempenho em seu data center.
A nuvem como uma camada de armazenamento
À medida que tecnologias mais avançadas se tornam acessíveis, as camadas de armazenamento existentes podem ser transformadas conforme necessário, e outras podem ser adicionadas para diversificar ainda mais a arquitetura de armazenamento em camadas. A nuvem abriu novas possibilidades para organizações de TI, permitindo soluções de armazenamento de provedores de nuvem pública como um nível adicional (inferior). Se bem projetada e conduzida, a nuvem será uma solução excelente e menos dispendiosa do que uma camada local inferior.
Em camadas de armazenamento primário que usam flash para desempenho extremamente alto, cerca de 50% dos dados frios podem ser alocados para a nuvem. Cópias instantâneas e dados não estruturados geralmente incluem essa categoria, incluindo aplicativos de missão crítica. Em camadas secundárias, os dados frios armazenados no armazenamento podem ser de até 90% das cópias de backup. Todos esses dados valiosos, mas acessados apenas ocasionalmente, também podem ser movidos para a nuvem. Provedores e serviços de nuvem populares prontos para dados inativos em camadas incluem armazenamento de Blob do Azure, AWS S3 e armazenamento em nuvem do Google.
Assim como o armazenamento automatizado por níveis local, podemos criar políticas e regras para administrar os dados para a nuvem. As condições nos permitem transferir arquivos diretamente do local para a nuvem pública. As políticas são aplicadas de várias maneiras. Por exemplo, os dados podem ser movidos com base na extensão do arquivo, nos padrões incluídos no nome do arquivo ou na frequência com que o arquivo é acessado em um determinado período. Esta última opção é provavelmente o melhor cenário, onde os arquivos e blocos de armazenamento recebem valores de temperatura, marcando os dados recém-gravados como quentes e os inativos como frios. Implementando um conjunto de políticas de armazenamento em camadas, os dados frios podem ser movidos rapidamente para a nuvem executando regras sob demanda ou por agendamento.
Novos desafios de gerenciamento de armazenamento
Os principais desafios observados no mercado hoje em torno do gerenciamento de dados em nuvem híbrida consistem em volume e variedade, velocidade e integridade dos dados.
Os volumes de dados estão crescendo a uma taxa quase exponencial. As organizações de TI precisam controlar não apenas o crescimento dos dados, mas também o crescimento e o gerenciamento de dados em vários ambientes. O volume e a variedade de dados gerados continuam a ser impressionantes. Sem os recursos para armazenar, categorizar e processar esses dados em uma solução de nuvem híbrida, as organizações perdem insights críticos sobre seus clientes e negócios. Além disso, prevê-se que os volumes de dados aumentem 10 vezes até 2025 (cerca de 163ZB), impulsionados pela IoT e pela tecnologia de ponta. Se os dados são o ativo mais valioso, devem ser tratados com cuidado e devem ser capazes de fornecer insights para decisões focadas, ao mesmo tempo em que permitem um olhar para o futuro. Além disso, encontrar formas mais eficientes de processar esses dados para transformá-los em valor é vital para as decisões de compra dos clientes.
As ameaças de TI também estão evoluindo – e manter a infraestrutura segura é uma batalha contínua. Uma boa estratégia de segurança é construir uma base sólida baseada em saber exatamente quando, onde e como os dados são armazenados. Esse tipo de estratégia ajuda as empresas a evitar o aumento dos custos associados a violações de dados, bem como a novos malwares, desastres e regulamentações que representam riscos significativos para as operações. A segurança dos dados é de absoluta importância para as empresas, seja protegendo contra perda de dados ou garantindo a integridade dos dados. É aqui que a Lenovo cobre todas as opções e garante que os dados de seus clientes estarão sempre protegidos.
Soluções de armazenamento Lenovo ThinkSystem
Antecipar novos desenvolvimentos também é desafiador, assim como acompanhar a melhor estratégia de armazenamento e nuvem. No entanto, a indústria já fez um grande investimento em ecossistemas e plataformas de pesquisa que agregam valor e oportunidades para a empresa. Dando o próximo passo estratégico para a indústria de armazenamento, a Lenovo adaptou sua solução para atender aos principais desafios observados no gerenciamento de dados. Esta jogada inteligente da Lenovo visa fornecer a solução definitiva para seus clientes e oferece uma combinação única de produtos e serviços para permitir que as empresas utilizem melhor a nuvem híbrida.
A Lenovo é uma das empresas de tecnologia exclusivas no mercado que fornece uma solução completa de data center por meio do Lenovo Data Center Group (DCG). Além disso, a Lenovo fornece segurança de ponta a ponta e gerenciamento de software com seu ecossistema Intelligent Device Group (IDG). Com essas ofertas e a série ThinkSystem DM da Lenovo, as empresas podem melhorar sua infraestrutura e lidar com qualquer carga de trabalho em execução em seus ambientes.
O ThinkSystem DM Series é a principal solução de armazenamento da Lenovo que oferece um conjunto versátil de gerenciamento de dados para dados estruturados e não estruturados. Ele abrange desde o espaço de entrada até um midrange alto e pode fornecer recursos ricos em dados, como redução de dados integrada, proteção de dados e segurança de dados. Cada uma das séries DM pode oferecer capacidade de nuvem híbrida integrada para soluções de provedores de nuvem pública. Simultaneamente, a Lenovo está desenvolvendo suas ofertas NVMe de ponta a ponta com seus Série DM7100F lançada recentemente, e no final deste ano planeja expandir a oferta de NVMe de ponta a ponta para mais cargas de trabalho de nível básico para os clientes criarem uma malha NVMe corporativa em toda a infraestrutura.
Piscinas de tecido
O DM Series Data Management Suite unifica o gerenciamento de dados em flash, disco e nuvem para simplificar os ambientes de armazenamento. Este software abrangente é simples de usar e altamente flexível, projetado para armazenamento eficiente e possui recursos robustos de gerenciamento de dados, bem como integração perfeita com a nuvem. No geral, a DM Series visa simplificar a implantação e o gerenciamento de dados e impulsionar os aplicativos corporativos; ou seja, está pronto para o futuro para infraestruturas de dados.
Juntamente com a capacidade integrada de gerenciamento de dados, está a tecnologia FabricPool Cloud Tiering. Ele permite camadas automatizadas de dados para camadas de armazenamento de objeto S3 de baixo custo, localizadas no local ou na nuvem pública. Ao contrário das soluções de hierarquização manual, o FabricPool automatiza a hierarquização dos dados para reduzir o custo de armazenamento. Os dados ativos permanecem em unidades de alto desempenho e os dados inativos são armazenados em camadas para o armazenamento de objetos, preservando a funcionalidade DM Series e eficiências de dados.
FabricPool oferece suporte a uma ampla gama de provedores de nuvem pública e seus serviços de armazenamento. Isso inclui Amazon S3, Alibaba Cloud Object Storage Service, Microsoft Azure Blob Storage, Google Cloud Storage, IBM Cloud Object Storage e nuvens privadas. Os clientes também se beneficiarão ao manter os recursos integrados de redução de dados ao mover dados de e para a nuvem. Isso economiza custos de transporte quando os dados precisam ser movidos de volta da nuvem. Além disso, a criptografia de dados integrada protege os dois dados durante a transferência para a nuvem e continua uma vez na nuvem. Isso garante que não haja vulnerabilidades em todo o processo de camadas de nuvem.
Políticas FabricPool
O FabricPool tem dois casos de uso principais: recuperar capacidade no armazenamento primário ou reduzir o espaço ocupado pelo armazenamento secundário. Nosso foco neste artigo é a opção de recuperar capacidade no armazenamento primário. Existem três políticas diferentes e exclusivas para armazenamento primário em camadas em nuvem: classificação automática em camadas, somente instantâneos e todas as camadas.
Manter dados acessados com pouca frequência associados a software de produtividade, projetos concluídos e conjuntos de dados antigos no armazenamento primário é um uso ineficiente do armazenamento flash de alto desempenho. Colocar esses dados em camadas em um armazenamento de objeto é uma maneira fácil de recuperar a capacidade flash existente e reduzir a quantidade de capacidade necessária no futuro. A Política de Auto Tiering move todos os blocos frios no volume para a camada de nuvem. Se lidos por leituras aleatórias, os blocos de dados frios na camada de nuvem tornam-se quentes e são transferidos para a camada local. Se lidos por leituras sequenciais, como aquelas associadas a varreduras de índice e antivírus, os blocos de dados frios na camada de nuvem permanecem frios e não são gravados na camada local.
As cópias instantâneas podem frequentemente consumir mais de 10% de um ambiente de armazenamento típico. Embora essenciais para proteção de dados e recuperação de desastres, essas cópias pontuais raramente são usadas e são um uso ineficiente de flash de alto desempenho. A política de camadas somente para instantâneos para FabricPool é uma maneira fácil de recuperar espaço de armazenamento em armazenamento flash. Durante nossos testes, Snapshot-Only foi a política usada para testar as operações de camadas de nuvem. Blocos Cold Snapshot no volume que não são compartilhados com o sistema de arquivos ativo são movidos para a camada de nuvem. Se lidos, os blocos de dados frios na camada de nuvem tornam-se quentes e são transferidos para a camada local.
Um dos usos mais comuns do FabricPool é mover volumes inteiros de dados para nuvens. Projetos concluídos, relatórios herdados ou registros históricos são candidatos ideais para armazenamento de objetos de baixo custo. A movimentação de volumes inteiros é realizada definindo a All Tiering Policy em um volume. Esta política é usada principalmente com dados secundários e volumes de proteção de dados. Ainda assim, também pode ser usado para classificar todos os dados em volumes de leitura/gravação.
Os dados em volumes que usam a All Tiering Policy são imediatamente rotulados como frios e colocados em camadas na nuvem o mais rápido possível. Não há espera de um número mínimo de dias antes que os dados sejam esfriados e escalonados. Se lidos, os blocos de dados frios na camada de nuvem permanecem frios e não são gravados de volta na camada local.
Uma quarta opção de política de níveis também está disponível com a Lenovo e é apropriadamente chamada de política de níveis 'Nenhuma'. Com esta política, nenhum dado é hierarquizado, permitindo manter tudo em flash. Um bom exemplo de seu uso são os snapshots em ambientes DevOps, onde as cópias point-in-time anteriores são usadas com frequência.
Configuração de armazenamento em nuvem da Lenovo
Para testar os recursos e alguns dos recursos da solução de armazenamento Lenovo para a nuvem, configuramos um modelo DM7000F em nosso laboratório.
Primeiro, criamos um contêiner de armazenamento usando o Azure Blob Storage, nossa solução em nuvem para este teste. Novamente, é bom observar a ampla gama de opções disponíveis na Lenovo, que incluem Alibaba Cloud, Amazon S3, Google Cloud, IBM Cloud e outros. Durante o teste, o objetivo era usar o Microsoft Azure Blob Storage para a nuvem como a camada de nuvem para FabricPool. Depois de terminar a configuração do armazenamento em nuvem, era hora de fazer login na interface GUI do DM7000.
Uma vez conectado, a página padrão do Painel é exibida. O Dashboard mostra a integridade, capacidade, desempenho e informações de rede do array em questão.
Em seguida, criamos dois volumes (um por controlador) e duas VMs (uma para cada volume). O plano era permitir que essas VMs fossem executadas e, em seguida, deixá-las inativas por um tempo. A imagem abaixo mostra os volumes utilizados: host_lun_1 e host_lun_2.
Ao editar ou criar o volume, podemos selecionar a política de camadas desejada. Aqui, selecionamos apenas instantâneo. Ao selecionar essa política de camadas, nossos dados (vistos como frios após cada instantâneo) se movem para o Armazenamento de Blobs do Azure criado em um intervalo de segundo plano. O intervalo é executado em seu próprio tempo, prevendo quando as cargas de trabalho serão menos afetadas.
Na página Camadas, podemos adicionar nossa camada de nuvem das nuvens públicas. Aqui, anexamos o recurso Armazenamento de Blob do Azure e o conectamos às duas camadas de armazenamento local. Na imagem abaixo, você pode ver dois recursos anexados ao Azure.
A configuração é simples; clicando em Add Cloud Tier e selecionando nossa nuvem desejada (Azure, neste cenário), poderíamos configurar imediatamente a camada de nuvem.
Por fim, em nosso painel da conta de armazenamento do Azure, queríamos mostrar os dados que entram no Azure (entrada) e os dados que saem (saída). Os pequenos picos mostrados a cada dia são novos instantâneos de dados sendo transferidos para o Azure. Por outro lado, os picos de saída mostram dados de saída, ilustrando uma restauração de instantâneo de um volume para reverter.
Considerações Finais
Em geral, a nuvem e o gerenciamento dos dados são um tema amplo e em constante evolução entre as empresas. A Lenovo deseja fornecer soluções que preparem os clientes para as necessidades em constante mudança, seja no data center ou por meio de ambientes de nuvem híbrida. Nós da StorageReview estamos bastante impressionados com a abordagem da Lenovo para suas matrizes de armazenamento. Por meio dessa avaliação, experimentamos como os dados em camadas para a nuvem funcionam a partir do Storage Manager for DM Series e como a capacidade flash valiosa é recuperada ou estendida para a nuvem. É importante ressaltar que o sistema de armazenamento DM7000F oferece essa flexibilidade sem fazer alterações na infraestrutura. Além disso, a funcionalidade é fácil de implementar.
Apoiado por DCG e IDG, vemos a Lenovo em uma posição forte no mercado de armazenamento de dados. Suas soluções de armazenamento permitem que os clientes comprem o que precisam hoje, aproveitando a nuvem para atender aos requisitos de crescimento de dados do futuro. O resultado líquido é que o armazenamento em nuvem da Lenovo reduzirá custos e permitirá que as empresas tenham a flexibilidade que desejam ao considerar um investimento em armazenamento.
Matrizes de armazenamento Lenovo ThinkSystem série DM
Este relatório é patrocinado pela Lenovo. Todas as visões e opiniões expressas neste relatório são baseadas em nossa visão imparcial do(s) produto(s) em consideração.