«« Voltar
Desenvolvimento do algoritmo LexRank para classificação de Páginas de Internet
Protocolo do SIGProj:   179513.860.47939.06052014
De:31/07/2014  à  31/07/2015
 
Coordenador-Extensionista
  Edson Takashi Matsubara
Instituição
  UFMS - Universidade Federal de Mato Grosso do Sul
Unidade Geral
  FACOM - Faculdade de Computação
Unidade de Origem
  GAB/FACOM - Gabinete do Diretor
Resumo da Ação de Extensão
  A internet não é um lugar seguro para crianças. Sítios com conteúdo adulto e violento podem ser facilmente acessados por meio de qualquer computador, celular ou tablet. Uma possível solução é o uso de sistemas de controle de acesso a internet. Porém, os sistemas disponíveis atualmente necessitam de muita supervisão e atualização frequente, onde o bloqueio acontece manualmente pelo cadastro dos sites proibidos (blacklist sites). Como a internet está em constante mudança, há muita dificuldade em fazer o controle do conteúdo. Este trabalho propõe gerar classificadores automáticos de páginas de internet conhecido como LexRank (Ranking Lexicográfico). Algoritmo LexRank é um algoritmo de Aprendizado de Máquina Lexicográfico que possibilita a construção automática de ranking de exemplos. O objetivo deste trabalho de iniciação científica foi desenvolver formas alternativas de implementação, selecionando de forma eficaz os atributos, denominada FlexRank. O algoritmo foi comparado com Naive Bayes e SVM, em relação ao tempo e ao desempenho, o desempenho foi medido usando a métrica de AUC. Os resultados em comparação com os algoritmos SVM e Naive Bayes foram promissores. O FlexRank não teve diferença significativa com p-valor=0.05 do estado da arte (SVM) mas com um tempo de treino e teste menores.
Palavras-chave
   aprendizado de máquina, reconhecimento de padrões, mineração de textos
Público-Alvo
  
Situação
  Atividade COM RELATORIO FINAL
Contato
  
«« Voltar