Nota de esclarecimento sobre os problemas com o serviço de email institucional

O NTI da FURG gostaria de apresentar suas desculpas a todos os usuários do serviço de e-mail institucional. Uma falha física no sistema de armazenamento das caixas de e-mail causou a perda irrecuperável das mensagens ali armazenadas. O acesso as contas foi restabelecido e estão sendo feitas mudanças para que o serviço tenha mais confiabilidade e robustez. Somos conscientes de nossa responsabilidade perante nossos usuários e dos grandes transtornos causados por essa falha. Nossa preocupação inicial foi recuperar a funcionalidade do serviço e melhorá-lo.

A seguir detalhamos o que aconteceu:

- no dia 01/10/2014 foi identificado um alerta em duas das três storages "DAS" instaladas no NTI, uma delas que armazena as imagens do sistema de vigilância da FURG (CFTV) e a outra que armazena as caixas de e-mail institucional, incluindo os "@furg.br", "@uab.furg.br", "@hu.furg.br", "@faherg.furg.br", "@faurg.furg.br", etc;

- os contatos iniciais com a empresa fabricante foram infrutíferos pois os equipamentos não estavam mais cobertos por garantia ou qualquer contrato de suporte, após isso começamos tratativas com a DELL para nos atender mesmo nessa situação;

- segundo as informações que tínhamos da empresa que forneceu e instalou os storages, o sistema estava configurado com RAID 5 e com um disco, de um total de 15 discos, como "HOT SPARE", isso significa que podíamos perder dois discos, sendo que quando um dos discos do array do raid falhasse o disco em hot spare assumiria a posição e após sincronizado o raid mais um do array poderia falhar sem causar perda dos dados;

- no dia 06/10/2014 entramos em contato com com a DELL, fabricante dos equipamentos, e apesar dos equipamentos não estarem mais cobertos por garantia ou outra forma de contrato de suporte, a DELL prestou todo suporte necessário;

- a empresa enviou os softwares necessários para a verificação e diagnóstico físico dos equipamentos;

- no dia 08/10/2014 preparamos o ambiente e fizemos a primeira parada no sistema para executar os procedimentos necessários;

- percebemos então que a informação anterior estava errada, o RAID configurado era o 5 mas sem disco "HOT SPARE", isso trazia uma urgência pois um dos disco já estava com problema físico e dois estavam apresentando problemas;

- enviamos os resultados para o técnico que nos atendia e que após algum tempo de análise nos retornou os passos seguintes;

- o storage do CFTV tinha um disco com problemas de gravação e o e-mail tinha dois discos com problemas, um com problemas físicos e outro com problemas de gravação, que precisavam ser trocados separadamente;

- no dia 13/10/2014 foi solicitada a compra emergencial de 3 HDs para repor as que apresentavam falhas, o setor de compras foi ágil e conseguiu adquirir as HDs em pouquíssimos dias úteis;

- por precaução decidimos fazer primeiro no CFTV que tinha somente um disco com problema ao invés do serviço de e-mail;

- a troca foi feita no dia 20/10/2014 e ocorreu normalmente a reconstrução (rebuild) do "array";

- mais tranquilos fizemos o planejamento da troca das HDs no servidor de e-mail;

- no dia 22/10/2014, foram iniciados os procedimentos de limpeza e arquivamento das contas não usadas e o backup das contas ativas;

- perto da meia noite e meia, no meio do procedimento de arquivamento preparação do arquivo de backup, o sistema colapsou perdendo o acesso físico aos discos;

- tomamos todas as medidas possíveis no momento para restaurar o acesso mas não obtivemos sucesso;

- na manhã seguinte dia 23/10/2014 as 07:00 entramos em contato com o setor de suporte da DELL que prontamente nos auxiliou novamente mesmo sem termos contrato formal de suporte, apesar disso e de tentarmos durante várias horas restabelecer o sistema fomos forçados a reconhecer que não teríamos como recuperar as caixas de e-mail;

- o atendimento DELL recomendou algumas mudanças na configuração da storage e "extra-oficialmente" tirou qualquer esperança de recuperar as HD danificadas já que os problemas eram físicos nos discos

- ainda tentamos substituir fisicamente uma e após as duas HDs e executar procedimentos de recuperação, mas continuamos sem sucesso;

- finalmente encerramos as tentativas no meio da tarde e comunicamos a Administração Superior do ocorrido;

- passamos o resto do dia recriando as caixas dos usuários e restabelecendo o envio e recebimento das mensagens por volta das 18:00;

- estamos fazendo mudanças visando melhorar a confiabilidade, estamos estudando também outras possibilidades para gerenciamento e controle das contas e caixas.

Novamente pedimos desculpas pelos transtornos causados nesse momento e no futuro, pois sabemos da necessidade de recuperar mensagens antigas e não poderemos atender essa demanda, sendo que somente o próprio usuário poderá solicitar aos seus remetentes que reenviem os e-mails trocados. O que podemos é nos comprometer a redobrar os cuidados necessários para manter esse e outros serviços indispensáveis ao bom funcionamento da Universidade.

Luís Alberto Azambuja

Diretor do NTI - FURG

 

Assunto: Arquivo