Este trabalho apresenta uma implementação de uma ferramenta para o auxílio da avaliação de erros de interface do roteador CISCO. Esta ferramenta foi desenvolvida, utilizando-se da MIBII (RFC 1213), acessada através de lingagem C, utilizando-se da bi
blioteca da CMU.
Tendo em mente que a análise de um erro, depende por muitas vezes do comportamento dos fatos ocorridos anteriormente, a proposta de implementação não apenas visou alertar as possiveis variações abruptas do comportamento dos objetos, como também prov
ê um histórico do comportamento do roteador. Para tal, criou-se um processo em background, que a cada cinco minutos sofre um wakeup, amostra os dados do roteador, e entra em sleep novamente. Tal processo pode assim se comportar indefinidamente, ou até que
o administrador deseje que pare (basta um kill). Também os intervalos de amostragem podem ser configurados, possibilitando um melhor ajuste da coleta de informação em redes com comportamentos diversos.
O uso do log gerado pelo sistema, permite ao administrador traçar um perfil do comportamento de seu roteador, seja ele por horario, dia da semana, etc.
Vale ressaltar que o log é gerado em html, de maneira a refletir
imediatamente a amostra coletada, isto é, a cada cinco minutos o
conteúdo da página de log em html é atualizado automaticamente.
Os valores dos objetos são coletados, e assim calcula-se o valor médio de cada objeto ao longo do tempo. Cada vez que o valor amostrado no último intervalo de tempo ultrapassa o dobro da média, é emitido um alerta no log. Tal alerta pode ou não ser
relevante, dependendo da análise dos eventos anteriores (não necessariamente muitos deles, talvez 3 ou quatro quando o intervalo é de 5 minutos).
O dobro da média foi escolhido por destacar rajadas de ocorrências de um evento, e também por amortizar a média acumulada após a ocorrência de tal rajada, procurando adaptar-se ao comportamento da distribuição dos eventos.
Os campos apresentados no log são:
TR [x] - Throughtput (calculado com os objetos necessários) onde x é o valor obtido no periodo de amostragem
InDiscars[x] - ifInDiscards, onde x é a quantidade deste evento ocorrida no intervalo amosrado, e não o valor instantâneo do objeto
InErrors[x] - ifInErrors, onde x é a quantidade deste evento ocorrida no intervalo amosrado, e não o valor instantâneo do objeto
InUnkProt[x] - ifInUnknownProtos, onde x é a quantidade deste evento ocorrida no intervalo amosrado, e não o valor instantâneo do objeto
OutDiscar[x] - ifOutDiscards, onde x é a quantidade deste evento ocorrida no intervalo amosrado, e não o valor instantâneo do objeto
OutErrors[x] - ifOutErrors, onde x é a quantidade deste evento ocorrida no intervalo amosrado, e não o valor instantâneo do objeto
Os dados foram coletados para as interfaces ethernet e serial do roteador sendo apresentadas em logs distintos.
Para a interface ethernet os valores foram considerados altos para a análise a seguir quando ultrapassaram o dobro da média, exibindo os seguintes alertas, sugeridos em "Router Error Report" em http://tampico.cso.uiuc.edu/uiucnet/reports/report.html
:
ifInErrors ultrapassando o dobro da média alerta dispara como causas possíveis:
- cabeamento de rede fora de especificação;
- repetidor falhando;
- interface de roteador falhando (baixa).
ifOutErrors ultrapassando o dobro da média alerta dispara como causas possíveis:
- problemas de cabeamento físico;
- interface de roteador falhando (baixa).
ifInDiscards ultrapassando o dobro da média alerta dispara como causas possíveis:
- problemas do software roteador (baixo).
ifOutDiscards ultrapassando o dobro da média alerta dispara como causas possíveis:
- talvez problema com o software que o roteador está executando;
- falha do roteador.
Se nenhum alerta aparece no log, significa que nao houve variação abrupta do objeto amostrado, todavia vale ressaltar que variações pequenas e sucessivas podem levar ao aumento da média de maneira a não disparar o alerta. No caso do administrador per
ceber perda de desempenho, mesmo sem alerta, recomenda-se a análise do log a procura deste tipo de crescimento "linearmente" comportado.
Vale ainda ressaltar que as 3 ou 4 primeiras amostras do log, normalmente devem ser desconsideradas, pois as médias foram inicalizadas com zero, e são necessárias algumas amostras para começar a ter um valor que expresse o comportamento.