INTELLIGENT SYSTEM FOR WEB TEXTS

Autor: FERNANDO HIDEO FUKUDA
Jazyk: portugalština
Rok vydání: 1999
Zdroj: Repositório Institucional da PUC_RIOPontifícia Universidade Católica do Rio de JaneiroPUC_RIO.
Druh dokumentu: masterThesis
Popis: COORDENAÇÃO DE APERFEIÇOAMENTO DO PESSOAL DE ENSINO SUPERIOR
Esta dissertação investigou a aplicação dos processos de KDD (Knowledge Discovery in Databases) e técnicas de inteligência artificial para a criação de uma ferramenta de avaliação de textos da WEB de acordo com um determinado perfil. O trabalho, na área de sistemas de computação, teve como objetivo o desenvolvimento de técnicas que em conjunto com técnicas de inteligência computacional podem automatizar a avaliação de textos através de uma ferramenta, bem como a construção de um protótipo desta ferramenta. As técnicas inéditas desenvolvidas nesta dissertação tiveram como objetivo avaliar automaticamente textos independente da língua utilizada nestes e sem o uso de técnicas de PLN (Processador de Linguagem Natural). Outro objetivo foi desenvolver este trabalho baseado em alguns conceitos, ferramentas, formas de documentação considerados em trabalhos anteriores como forma de dra continuidade ao desenvolvimento científico. O protótipo, SITEX - Sistema Inteligente para Textos WEB - foi desenvolvido e módulos que permitem utilizar a ferramenta que melhor se enquadre na solução de um problema. Um outro objetivo no desenvolvimento do protótipo foi a utilização da linguagem C++, a qual é largamente utilizada e conhecida entre os desenvolvedores de técnicas de inteligência artificial, permitindo com isso a integração e o desenvolvimento de outros módulos. As técnicas foram desenvolvidas tendo também como objetivo o tratamento de padrões da WEB, como o Protocolo TCP/IP, as linguagens HTML, DHTML, Javascript, VBscript, entre outros, o que permite a utilização destas na Internet, Extranet ou localmente. Os estudos de casos foram realizados com textos fornecidos pela WEB através de inscrições em jornais on-line e avaliados de acordo com três tipos de perfis. Os perfis utilizados nos estudos de casos foram: economia, esportes e informática. Os resultados dos estudos de casos comprovam a validade das técnicas descobertas e implementadas neste trabalho. A comparação dos resultados do SITEX com os resultados do TextAnalyst, produto de mercado para análise de texto da Web baseado em inteligência computacional, comprovam a qualidade das técnicas apresentadas nesta dissertação.
This dissertation investigated the application of KDD´s process and artificial intelligence techniques for the development of a WEB text evaluation tool according to a specific interest. The work, in computing systems area, had as objective the development of techniques together with computing intelligence techniques to automate the texts evaluation by a tool, as well the development of a prototype of this tool. The techniques developed in this dissertation had as objective evaluate taext automatically with independence of the language used and without using NLP (natural Language Processing) techniques. Another onjective was develop this work based on others works as a way to continue the scientific development. The prototype, SITEX - Intelligent System for WEB Texts - was developed by modules which provides the condition to choose the best tool to solve a problem. Another objectiv on the development of the prototype was to use the C++ language, which is largely used and well known by artificial intelligence techniques developers, providing in this way facilities for development and integration of others modules. The techniques was also developed with the objective for WWB standards treatment, as the TCP/IP protocol, lamguages as HTML, DHTML, javascript, Vbscript, and others, which provides the usage of theses techniques in the Internet, intranets, Extranets and locally. The case studies werw based on WEB texts provided by on- line newsletters subscriptions and evaluated according to three types of interests. The interests used in these case studies were: ecoonomy, sports and computing. The results found in this case studies shows the validity of the techniques developed in this work. The results os SITEX compared to the result of TextAnalyst, a well known product in the market for Web text analysis based on artificial intelligence, shows the quality of the techniques discovered in this dissertation.
Databáze: Networked Digital Library of Theses & Dissertations