Redação do Site Inovação Tecnológica - 18/10/2004
Os sistemas operacionais atuais têm o grande mérito, em relação àqueles do início da era da microinformática, de se apresentarem em agradáveis interfaces gráficas, cuidadosamente desenhadas e com as opções visíveis e em locais mais ou menos padronizados. Bem, pelo menos enquanto tudo está indo bem. O problema é que as coisas nem sempre vão bem.
E quando elas vão mal, desaparece todo o trabalho de centenas de profissionais que estudaram gostos e padrões de comportamento dos usuários, e a bela interface gráfica é substituída por algo bem mais arcano e com mensagens esotéricas. Os usuários do sistema operacional Microsoft Windows, por exemplo, estão acostumados com uma "bela" tela azul, que aparece repentinamente e avisa que algo deu errado, o sistema está instável e que ele pode esperar ou desligar o computador.
Nesses momentos não há muito o que fazer, a não ser apertar o botão "Reset" e começar tudo de novo. Mas sistemas operacionais que suportam as chamadas aplicações de missão crítica, como transações as de um banco, sistemas de compras pela Internet ou o banco de dados de um hospital, por exemplo, não podem se dar ao luxo de simplesmente exigirem que o usuário feche todas as suas aplicações e "desligue e ligue" o computador.
É claro que as coisas também dão errado nos computadores de grande porte. Mas os sistemas operacionais que os fazem funcionar possuem sistemas de recuperação de falhas extremamente bem desenvolvidos. Esses programas são capazes de monitorar rigorosamente todo o funcionamento do computador e dos programas e permitir que os técnicos refaçam todo o trajeto da falha, detectem exatamente onde e por quê ela ocorreu e, claro, corrijam o defeito. A grande vantagem é que o mesmo erro não acontecerá duas vezes.
Estas ferramentas são chamadas de "crash dump", e fazem uma cópia da memória do computador no exato momento em que ocorreu a falha. Não apenas um endereço em hexadecimal que ninguém sabe onde é ou o que significa, mas uma duplicata exata de tudo o que estava acontecendo no computador no exato momento em que ocorreu a falha.
O sistema operacional Linux há muito saiu da categoria experimental e dos laboratórios das Universidades. Ele equipa, por exemplo, a maioria dos servidores Web no mundo. Mas ele já é também o preferido para a construção de aglomerados computacionais, os chamados "cluster", reuniões de computadores pessoais que passam a funcionar como um só, disponibilizando um poder computacional antes só acessível através de supercomputadores de milhões de dólares.
Mas os profissionais de TI mais exigentes se ressentiam da falta de uma ferramenta que colocasse o Linux realmente em pé de igualdade com os sistemas operacionais dos supercomputadores quando o assunto é segurança contra falhas. É que, até agora, todas as ferramentas de "crash dump" para Linux, como netdump ou LKCD, se baseavam no próprio kernel que está rodando. Ou seja, se a pane for realmente geral, o sistema de coleta de informações da falha também fica comprometido.
Agora, pesquisadores japoneses das empresas NTT Data Corporation e VA Linux Systems acabam de anunciar o lançamento e a disponibilização gratuita do Mini Kernel Dump, uma ferramenta de "crash dump" para Linux que fica fora do kernel principal. É como um guarda que fica do lado de fora, gravando tudo o que está acontecendo "no lado de dentro" do kernel.
A nova ferramenta é totalmente gratuita, liberada sob a licença GPL, com código-fonte aberto. As duas empresas também lançaram programas auxiliares que facilitam a análise das informações coletadas pelo Mini Kernel Dump.
Como o próprio nome indica, o Mini Kernel Dump utiliza um mini-kernel dedicado unicamente para coletar informações do kernel principal, sem depender dele. Se algum aplicativo, ou o próprio kernel principal, apresentar problemas, o mini-kernel não é afetado e pode coletar com segurança todas as informações da falha.
O lançamento do Mini Kernel Dump dará um impulso substancial à utilização do Linux em ambientes corporativos e em aplicações de missão crítica. Em ambientes empresariais, sua adoção não apresentará dificuldades, já que ela exige apenas uma recompilação do kernel, com poucas modificações, e nenhum device driver adicional.