UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL

UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL

INSTITUTO DE INFORMÁTICA

CURSO DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO

Apoio ao Gerenciamento de Redes

Por

Cinara Menegazzo

PLANO DE ESTUDOS E PESQUISA - PEP

CPGCC – UFRGS

Profª Drª. Maria Janilce B. Almeida

Orientadora

Profª Drª. Liane Margarida R. Tarouco

Co-Orientadora

Porto Alegre, março de 1999.

Resumo

A rotina de um ambiente de gerenciamento de redes de computadores, têm ficado cada vez mais repleto de problemas e trabalhos. Ambos agravados pelo aumento na diversidade de fornecedores de equipamentos e aplicativos, que vem proporcionar uma gama enorme de problemas.

Os gerentes de redes tem gasto o seu precioso tempo em cima de problemas inéditos e muitas vezes repetidos, que podem ter suas soluções esquecidas, desta maneira passam a operar como apagadores de incêndios, deixando de lado projetos ou tarefas que possam vir a fazer com que a rede possa funcionar com a sua capacidade devida.

A principal forma de contornar estes problemas está nas características que levaram a espécie humana a evolução, ou seja, a administração da informação que possa ser colhida, aprendida e repassada.

Esta informação disponível na hora e tempo certo pode ser manipulada, analisada e tratada com a finalidade de dar aos núcleos de gerência de redes a possibilidade de desenvolvimento de determinadas funções complexas por substitutos de especialistas. Tal propósito pode ser alcançado pelos sistemas especialistas, que tem ganho muito terreno no domínio de redes, devido aos benefícios que vem a fornecer principalmente dentro do gerenciamento de falhas.

O trabalho a ser desenvolvido propõe-se a criação de um ambiente para gerenciamento de falhas de rede de computador, apoiado pelas facilidades da metodologia de sistemas especialistas baseados em casos. Onde pretende-se unir projetos já desenvolvidos na Universidade Federal do Rio Grande do Sul à nova proposta de ambiente. Para que o objetivo seja alcançado, este trabalho considera uma série de questões que precisam ser definidas, como formas de armazenamento de casos, tratamento de casos não solúveis ou incompletos e formas de adaptação dos mesmos, apesar de constantes desenvolvimentos neste domínio e metodologia, tais pontos encontram-se pendestes.

Introdução e Motivação

As organizações, que cada vez mais, procuram equipamentos e facilidades, tanto hardware quanto software, de diferentes fabricantes e fornecedores estão encontrando a solução para o gerenciamento integrado e eficiente de seus sistemas de padronização. Segundo [JAN96], até 1990, a maioria dos Sistemas de Gerenciamento de Rede (SGR) poderiam ser considerados ilhas de informação, fornecendo capacidade para monitorar e controlar um limitado conjunto de equipamentos e, usualmente, não operavam com equipamentos de outros fabricantes. Com o crescimento das redes de computadores nas organizações, isto tornou-se um fato crítico. Devido aos sistemas não interagirem forçava os operadores a se locomoverem de um console para outro a fim de resolver falhas isoladas. Esta situação serviu de motivação para o surgimento de vários grupos interessados no processo de desenvolvimento de padrões para o gerenciamento de redes. O objetivo principal destes grupos era fornecer mecanismos para a interconexão daquelas ilhas de informação.

A padronização veio facilitar o processo de gerenciamento, uma vez que a informação transportada pelo sistema pode ser interpretada e entendida por qualquer uma das partes envolvidas, proporcionando interoperabilidade. Os sistemas de gerência existentes hoje em dia aderem com mais ou menos força ao padrão definido pelo RM-OSI (Reference Model for Open Systems Interconnection), proposto pela ISO (International Organization for Standardization), [ISO84].

A gerência de redes é uma aplicação distribuída onde processos de gerência (agentes e gerentes) trocam informações com o objetivo de monitorar e controlar a rede. A dinâmica dos processos de gerência pode ser assim descrita: o processo gerente envia solicitações ao processo agente que por sua vez responde às solicitações e também transmite notificações referentes aos objetos que residem na MIB (Management Information Base) [BRI93].

O trabalho de gerência de redes envolve diversas áreas funcionais de gerenciamento onde incluí-se falhas, contabilização, configuração desempenho e segurança[BRI93]. Para cada uma delas existem determinados processos e procedimentos a serem realizados, a fim de melhorar e implementar produtos de hardware e software que sejam realmente confiáveis no gerenciamento de protocolos, plataformas e ferramentas.

A chave para um perfeito gerenciamento de redes encontra-se nas informações que possam ser obtidas da mesma. Fazendo-se necessário, ter-se a possibilidade de visão e manipulação destas informações, bem como, compartilha-las com outras pessoas que trabalhem nas mesmas funções e/ou em colaboração, para desta forma obter-se fundamentação e evolução nos trabalhos realizados.

Qualquer informação que transita por uma rede, ou está em uma MIB, sendo tratada pelos processos de gerência, ou trafegando na rede em comunicação de gerente/agente ou gerente/gerente, ou ainda, pode ser deduzida de informações vindas destas comunicações. Nestas informações pode-se encontrar as falhas e soluções aos problemas que possam ocorrer na rede.

Uma rede de computadores sempre está funcionando cercada de problemas repentinos, inéditos ou repetitivos que contribuem para uma parada nas tarefas a serem desenvolvidas, tanto dos usuários que tem seus trabalhos interrompidos, como dos técnicos que precisam parar suas atividades para resolvê-los. Situação que transforma os responsáveis por gerenciamento de redes (técnicos) em bombeiros da rede, apagadores de incêndio, para que a rede consiga desempenhar suas funcionalidades.

Dada a freqüência em que ocorrem os mesmos ou diferentes problemas de redes, os procedimentos de solução de problemas são sempre construídos através de uma análise da situação considerando a experiência de quem os tenta resolver, com o que a rede oferece de informação. Esta análise resulta em um diagnóstico dado pela validade e intensidade dos dados e em seguida em uma solução, que muitas vezes pode não ser imediata ou ideal.

Para um mesmo problema, este tipo de procedimento pode ser realizado por um mesmo gerente ou outro diferente, diversas vezes, pois algum detalhe ou procedimento pode ser esquecido, então todo o processo cognitivo precisa ser refeito, muitas vezes são problemas muito simples, os quais até mesmo um usuário da rede poderia consertar. Este tipo de trabalho, torna-se repetitivo e não acrescenta conhecimento aos gerentes, o que vem a causar descontentamentos, pois o serviço específico que diz respeito ao gerenciamento da rede acaba por ficar para trás devido ao tempo gasto. Desta maneira, está ficando evidente a necessidade de criação de procedimentos automatizados que venham a dar apoio ao gerenciamento de redes de computadores.

Uma solução seria a implantação de sistemas auxiliares ao trabalho de gerenciamento de redes de computadores que pudessem, através de experiências e informações fornecidas por alarmes que incluem tipos de erros, causas prováveis, e medidas da gravidade, ditar as causas e soluções prováveis e mesmo as não aplicáveis aos problemas.

Os serviços de gerência de redes prezam pela eficiência e eficácia nas respostas à problemas. Visando este objetivo, diversas pesquisas tem sido desenvolvidas em torno de gerências de redes de computadores para que sejam produzidas ferramentas, que aliadas as facilidades permitidas pela inteligência artificial [WIN93 ], forneçam auxílio e rapidez aos gerentes e usuários das redes.

A integração das tarefas de configuração, manutenção e gerenciamento de falhas em gerenciamento de redes de computadores é importante sob o aspecto de otimização tanto dos recursos humanos, quanto das respostas sistêmicas, e essa integração pode ser viabilizada por sistemas especialistas [BEY91].

A otimização das respostas sistêmicas é traduzida pela agilidade e precisão na obtenção dos diagnósticos de falhas, e a otimização dos recursos humanos se reflete na possibilidade da utilização de sistemas especialistas para o treinamento ou ainda pela utilização de operadores poucos experientes sem o comprometimento da segurança do sistema.

Os sistemas especialistas construídos utilizando-se de raciocínio baseado em casos (Case Based-Reasoning - CBR) [KOL93] são capazes de realizar este tipo de procedimento, portanto fica evidente as vantagens de sua utilização para emular o raciocínio do especialista e da utilização de frames para a modelagem das funções automáticas que possam ser requeridas.

Portanto, o passo final para a eliminação de falhas, como principal problema de um gerenciamento de redes, é efetivamente automatizar e integrar as informações.

Objetivos e Resultados

Problema

As redes de computadores estão tornando-se cada vez mais heterogêneas e maiores. A rotina de um núcleo de gerência de redes é dotado de inúmeras atividades, onde algumas centram-se em resolver problemas tais, que sejam novos ou repetidos, que envolvem desde configuração até gerenciamento de falhas, com uma grande diversidade de problemas.

Muitos profissionais da área de redes, gasta seu tempo em resolver problemas já ocorridos e solucionados ou realizando tentativas de soluções as quais já foram detectadas como não eficientes para um certo problema. Muito é gasto em atividades não nobres e repetidas, as próprias pesquisas sobre determinados conceitos e funcionamentos podem ocorrer desta forma, muitos refazendo as mesmas coisas e chegando as mesmas conclusões, ou em alguns casos, as pesquisas por novas soluções não começam ou não caminham, por falta de tempo, ocupado em soluções não menos importantes, mas menos gratificantes.

Objetivos

Torna-se evidente a necessidade da construção de alguma forma de otimização de tarefas entre os diversos gerentes de redes para que seja possível, através de informações e fatos ocorridos garantir uma melhor qualidade nas soluções de problemas de rede.

Um projeto de pesquisa desenvolvido no Instituto de Informática da Universidade Federal do Rio Grande do Sul chamado de CINEMA (Cooperative Integrated Network Management) [MAD93], composto por dois sistemas, o Sistema de Trouble Ticket e o Sistema de Alertas, onde o primeiro faz um manuseio de registros de problemas, no qual está armazenada a história completa do problema e o segundo, tem o objetivo de monitoração contínua sobre a rede e comparação dos valores coletados com limites que podem ser fornecidos pelo usuário ou calculados automaticamente pelo sistema.

Baseados neste projeto, outros surgiram como formas de apoiar o trabalho de gerência de redes, como é o caso do projeto Módulo de Automatização de Diagnóstico (MAD) [NUM97], Sistema Agregador de Ferramentas de Operação de rede (SAFO) [MED96], Sistema Inteligente de Auxílio a Gerência de Redes (SIAGRe) [OLI98] e o sistema DUMBO [MEL98] que visa manter a memória hierárquica da rede. Estes sistemas cada qual dentro de suas características tentaram amenizar as tarefas de gerenciamento de redes.

Neste contexto, propõe-se o desenvolvimento de um trabalho de pesquisa através da geração de um sistema de registros de problemas aliados a sistemas especialistas que utilizando-se do paradigma de raciocínio baseado em casos, possa fornecer a soluções de problemas de usuários de redes de computadores, no que diz respeito ao gerenciamento de falhas, trabalhando-se os seguintes pontos:

integrar o sistema de Trouble Tickets do projeto CINEMA à um sistema de Help Desk [SWI96]

na aquisição de casos [ABE96] propor uma maneira para trabalhar na descrição fornecida pelos usuários;

prover o sistema de um módulo de serviços de e-mail, onde o não tratamento de um problema possa ser enviado a um responsável, para desta forma garantir a efetiva solução do problema, bem como a comunicação entre gerentes;

gerar um módulo de tratamento de casos incompletos ou não solúveis pelo sistema, para que mais tarde, estes, possam vir a fazer parte efetiva da base de casos;

propor uma forma de adaptação aos casos, tarefa que envolve a identificação das diferenças entre o caso recuperado e o caso corrente, bem como a análise das partes dos casos recuperados que podem ser passados ao caso corrente, usando-se de fórmulas e regras que consideram esta diferença e sugerem uma solução;

utilizar as técnicas do sistema SAFO [MED96] para realizar testes e soluções indicadas.

O desenvolvimento deste trabalho, possibilitará a geração de uma base de casos que automatizará a execução das atividades inerentes aos processos de gerenciamento, chegando a um ponto de prevenção de falhas, tendo como intenção prover auxílio a tomada de decisão através do provimento de uma ferramenta que possa apoiar o gerente ou ensinar o usuário de redes de computadores, diante dos problemas encontrados nas suas rotinas, de modo interativo e amigável, possibilitando que cada vez mais os gerentes de redes possam destinar o seu tempo de trabalho a novas pesquisas e trabalhos, não centrando-se especialmente em controle de falhas.

Devido aos centros de gerenciamento de rede geralmente ficarem subdivididos em diversos pontos geográficos torna-se necessário que estas informações estejam disponíveis na WEB para todo tipo de acesso, permitindo a troca e contribuição de informações entre usuários.

A comprovação do estudo será feita mediante a construção e utilização de uma ferramenta de Help Desk que possibilite consultas à base de casos através de um novo problema, onde o sistema deverá detectar a similaridade entre o que o usuário esta consultando com o que está em suas bases, fornecendo a solução mais adequada ou um guia para que ele consiga chegar ao desejado, podendo expor procedimentos não aconselháveis.

O resultado do trabalho será comprovado durante a utilização da ferramenta em um ambiente do referido domínio, onde esta deva proporcionar soluções aos casos propostos.

2.2.1 Sistema de Trouble Tickets X Sistema de Help Desk

Trouble Ticketing Systems(STT) ou Help Desk Systems (SHD) são sistemas usados para suporte técnico, através do envolvimento de várias pessoas a fim de resolver os problemas de redes. Provém ferramentas para rápida e facilmente gerenciar problemas de redes e serviços solicitados, [SWI96].

Trouble Tickets podem ser criados manualmente ou automaticamente com interferência de sistemas de gerenciamento de redes. Vários são os meios de se obter um ticket (caso) alguns podem ser gerados por coleta de ferramentas de e-mail, de gerenciamento ou via telefone.

Portanto, utilizando-se do sistema de Trouble Tickets gerado pelo projeto CINEMA e em uso na rede da Universidade Federal do Rio Grande do Sul pretende-se montar um sistema de Help Desk voltado ao domínio de redes de computadores, o qual consiga fazer uso do paradigma de raciocínio baseado em casos [KOL93] para montar um módulo de raciocínio responsável pela elaboração, recuperação de casos relevantes e adaptação dos casos fornecendo assim, as soluções dos problemas apresentados por usuários do sistema

2.2.2 Aquisição dos Casos

O principal trabalho ao se produzir um sistema baseado em casos é tentar extrair, de um domínio de problema, feições que possam ser relevantes para caracterizar um caso. Este tipo de sistema é fortemente dependente das estruturas e contextos das bases de casos, muitas vezes referido como memória de casos. Para que seja possível realizar comparações, é preciso que a base de casos esteja analisada e armazenada de forma organizada para efetivas recuperações e reusos.

A aquisição dos casos como parte integrante da metodologia de raciocínio baseado em casos pode ser dividida em dois grandes grupos os informatizados e os não informatizados. Os informatizados, além de entrevistas, brainwriting (reunião em torno de uma mesa, com um grupo de pessoas que contribuirão no assunto), análise de protocolos (observação do comportamento do especialista em um caso real) e observação direta; têm abordagens específicas das ferramentas, como é o caso da MORE ou MOLE [RAB95].

Ao se tratar com este tipo de metodologia, é importante saber determinar quais as feições e relações estruturais que irão rotular um problema armazenado, para caracterizar um caso, assim pode-se analisar o grau de disponibilidade dos casos e a quantidade de informações que deverá ser repassada pelo especialista, problema que caracteriza a aquisição de casos.

A busca por pesquisa aqui é por uma forma de aquisição de casos onde procure-se definir as feições de um caso de maneira a não limitar a descrição do problema, para que esta se torne a mais livre possível, possibilitando que as feições, que interessam a formação de um caso, possam ser retiradas da descrição fornecida pelo usuário, ou seja, onde possa-se usar o texto para definir os casos.

2.2.3 Módulo de Serviços de e-Mail

Procura-se proporcionar ao sistema de apoio a gerência de redes uma forma de comunicação entre gerentes de redes, onde possa ser passados problemas pendentes, bem como avisos de aberturas de registros de problemas a pessoas responsáveis por determinadas tarefas. Este módulo pode ser atendido incorporando-se características de uma lista de discussão à base de casos. Aplica-se mais ao tratamento de casos incompletos ou não solúveis a fim de garantir sua efetiva conclusão, funcionando como um realimentador (feedback) da base de casos, útil para bases que estão em uma rede de computadores e que são gerenciadas somente em um determinado local.

2.2.4 Módulo de Tratamento de Casos Incompletos ou não Solúveis

Problemas inéditos geralmente necessitam de pesquisa para poderem ser resolvidos. Esta pesquisa é desenvolvida mediante coleta de informações fornecidas por eventos reportados ou estudos feitos em cima do problema. Portanto, torna-se necessário prover o sistema de HD com um módulo onde possa-se reportar casos não solucionados e onde os gerentes possam contribuir com informações para que chegue-se a solução adequada. A partir deste momento, este caso caracteriza um novo caso e deve ser anexado a base de casos do sistema, proporcionando uma forma de aprendizagem de casos. Desta maneira tenta-se impedir os problemas de perda de informações e de casos, mediante a não solução imediata.

2.2.5 Adaptação de Casos

A adaptação talvez seja a parte mais crucial de um sistema que utiliza a metodologia de raciocínio baseado em casos, por ser a responsável pela resposta de um caso não encontrado similar ou por uma resposta que não seja totalmente correta ao problema proposto, para tanto, ela necessita compreender a criação de regras específicas. Estes sistemas possuem, em geral, dois tipos de adaptações, [KOL93]:

Estrutural – aplica-se regras diretamente sobre a solução armazenada com o caso;

Derivacional – reutiliza-se algoritmos, métodos ou regras que geraram a solução original para proceder uma nova solução ao problema corrente, o que acarreta no armazenamento da seqüência que construiu a solução original juntamente com o caso, na memória de casos.

Um sistema eficiente deverá adaptar, apropriadamente os dois tipos de adaptação, a fim de que a solução seja conseguida por diferentes técnicas. Portanto, busca-se, através de pesquisas no desenvolvimento da presente proposta, dar ao sistema uma forma eficiente de adaptação, principalmente por notar-se que, a maioria das ferramentas deste tipo de metodologia, tanto comerciais como acadêmicas, não provém nenhum tipo de tratamento à adequação de casos, transformando-as em nulas, inexistente ou interativas com o usuário. Assim este problema pode ser tratado pelo relacionamento entre os módulos de e-mail e de casos não resolvidos.

2.2.6 O Sistema SAFO

O Sistema Agregador de Ferramentas de Operação de rede (SAFO) [MED96], é o resultado de um estudo de várias ferramentas já existentes e a seleção de um conjunto mínimo necessário para a realização de monitoração e manipulação dos componentes de rede. As ferramentas deste ambiente agregadas ao sistema de HD podem, em um mesmo ambiente, proporcionar ao usuário a consulta e a solução de problemas juntamente com a monitoração dos resultados desta.

Metodologia

As atividades detalhadas a serem desenvolvidas para a realização do trabalho descrito acima e o tempo estimado para a execução de cada uma, são colocadas através de um cronograma. As atividades são compreendidas por:

Revisão bibliográfica: Estudos das técnicas, ferramentas existentes que dizem respeito ao domínio da aplicação, bem como dos problemas que o cercam.

Especificação formal do ambiente: Utilizando a linguagem SDL [ITU 93] e o Sistema de Trouble Tickets do projeto CINEMA.

Especificação de uma forma de aquisição dos casos: Identificação da melhor forma para se construir uma aquisição de casos eficiente.

Elaboração do Módulo de Serviços de e-mail: Montagem de um ambiente de e-mail com a base de casos.

Elaboração do Módulo de Tratamento de Casos Incompletos ou não Solúveis pelo Sistema: Determinação de tratamento e base de casos não solúveis.

Seminário de andamento: apresentação do trabalho já realizado para a comunidade acadêmica

Especificação da adaptação de Casos: Identificação de um padrão para a adaptação de casos.

Integração do Sistema SAFO ao sistema de HD: Incoorporação do ambiente do sistema SAFO ao sistema produzido no desenvolvimento do trabalho.

Redação do texto da dissertação: realização da descrição do trabalho;

Revisão do texto: revisão do texto da dissertação junto ao orientador;

Entrega dos Exemplares: entrega do texto da dissertação à banca avaliadora;

Implementação do protótipo: implementação em um ambiente do domínio;

Testes: testes do protótipo.

Cronograma

O cronograma esboçado abaixo é baseado nas atividades descritas no item 3 deste PEP.

Atividades	03	04	05	06	07	08	09	10	11
A	X	X	X
B		X	X
C			X	X
D				X	X
E					X	X
F						X
G						X	X
H							X	X
I							X	X
J								X
K								X
L									X
M									X

Referências Bibliográficas

[ABE96] ABEL, Mara. Um Estudo sobre Raciocínio Baseado em Casos. Trabalho Individual, Porto Alegre: CPGCC da UFRGS, 1996.

[BEY91] BEYON-DAVIS, P.. Expert Database Systems - A Gentle Introduction London, McGraw-Hill, 1991.

[ISO89] ISO/JTC1/SC21 WP N3509. Information Processing – Open Systems Interconection – Management Information Services – SMI Part 4: Guidelines for the Definition of Managed Objects, May, 1989.

[ITU93] Recomendação ITU-T Z.100, v1 e v2. Lenguaje de Especificación y Descriptión del CCITT, Helsinki, 1993.

[JAN96] JANDER, Mary. Distributed Net Management: In Search of Solutions. Data Communications, New York, v.25, n.2, p.101-112, Feb. 1996.

[KOL93] KOLODNER, Janet. Case-Based Reasoning. Morgan Kaufmann, Los Altos, CA, 1993.

[MED96] MEDINA, Roseclea D. & TAROUCO, Liane M.R.. SAFO – Sistema Agreagador de Ferramentas de Operação de rede. III WAIS. Fortaleza, CE, 18-20, Maio, 1996.

[MEL98] MELCHIORS, Cristina. Raciocínio Baseado em Casos Aplicado ao Gerenciamento de Falhas em Redes de Computadores. Porto Alegre: CPGCC da UFRGS, Dissertação de Mestrado, 1998.

[NUN97] NUNES, C. M..Um discriminador Inteligente de Eventos de Redes para o Ambiente CINEMA. Porto Alegre: CPGCC da UFRGS, Dissertação de Mestrado, 1997.

[OLI98] OLIVEIRA, Roberto B. de. SIAGRe- Um Sistema Inteligente de Auxílio a Gerência de Redes de Computadores. Porto Alegre: CPGCC da UFRGS, Dissertação de Mestrado, 1998.

[TAR90] TAROUCO, Liane M.R.. Inteligência Artificial Aplicada ao Gerenciamento de Redes de Computadores. São Paulo: Escola Politécmica da USP, 1990. Tese de Doutorado.

[SWI96] SWISHER, V.M., HARRIS, D.K.Z. & PETIX, V.C.M.-,. Mastering Network Management. Numidia Press, Fremont, CA 94536, 1996.

[WIN93] WINSTON, P. H.. Artificial Intelligence (3^nd ed), Addison-Wesley, Reading, Cambridge, Massachusetts, 1993.

[RAB95] RABUSKE, Renato Antônio. Inteligência Artificial. Editora da UFSC, Florianópolis, SC, 1995.