Motor de busca aberto como estratégia de indexação e mineração de dados

Autor: Julio Cesar Liviero Della Flora
Jazyk: portugalština
Rok vydání: 2015
Zdroj: Biblioteca Digital de Teses e Dissertações da UELUniversidade Estadual de LondrinaUEL.
Druh dokumentu: masterThesis
Popis: A importância da informação para o desenvolvimento da Ciência é inquestionável. Por isso, a Ciência da Informação é relevante para a comunidade científica ao desenvolver formas de organização e recuperação da informação possibilitando que o conhecimento produzido possa ser divulgado, acessado e utilizado por outros pesquisadores. Nesse sentido, ocorre a necessidade de que a organização da informação possa ser realizada livremente e busque a melhor resposta independente de patrocínio e censura. O objetivo desse trabalho é analisar o motor de busca, baseado em software livre YaCy/Solr como estratégia de indexação e mineração de dados. Foi utilizada pesquisa qualitativa, exploratória, bibliográfica e aplicada com a técnica de análise temática. A consequência desse estudo mostra que o software proporcionou ampla gama de resultados no âmbito da mineração de dados, evidenciado pelo experimento apresentado. Porém, é importante salientar que os mesmos não configuram a real contribuição do YaCy/Solr, mas sim, a capacidade que o software dispõe para realizar tais experimentos, sejam eles concentrados em qualquer gama de documentos ou metadados. Conclui-se que a partir do YaCy/Solr obteve-se acesso à estratégia de indexação como um diferencial para produzir informações não fornecidas pelos motores de busca proprietários. Futuras investigações poderão incluir versões mais precisas do experimento realizado, assim como a utilização de novos metadados e filter queries. Apesar das limitações apresentadas na exposição do software, considera-se que o trabalho proporcionou uma visão diferenciada e pouco ortodoxa acerca dos mecanismos de busca e da mineração de dados, visão esta que poderá constituir um ponto de partida para futuras pesquisas na área.
The importance of information for the development of science is unquestionable. Therefore, the Information Science is relevant to the scientific community to develop forms of organization and information retrieval enabling the knowledge produced can be disseminated, accessed and used by other researchers. In this sense, there is the need for the organization of information can take place freely and seek the best response independent of patronage and censorship. The aim of this study is to analyze the search engine, based on free software YaCy/Solr as indexing strategy and data mining. It used qualitative, exploratory, literature and applied to thematic analysis. The result of this study shows that the software provided wide range of results within the data mining, evidenced by the presented experiment. However, it is important to note that they do not constitute the actual contribution of YaCy/Solr, but rather the ability of the software has to carry out such experiments, whether concentrated in any range of documents, or metadata. We conclude that from the YaCy/Solr was obtained access indexing strategy as a differential to produce information not provided by the owners search engines. Future research may include more accurate versions of the experiment conducted, and the use of new metadata and filter queries. Despite the limitations presented in the software exhibition, it is considered that the work provided a different and unorthodox view about the search engines and data mining, a view that could be a starting point for future research in the area.
Databáze: Networked Digital Library of Theses & Dissertations