Design of a model for efficiency of web information discovery tools

Autor: Tilki, Birol
Přispěvatelé: Hakkoymaz, Veli, Bilgisayar Mühendisliği Ana Bilim Dalı
Jazyk: angličtina
Rok vydání: 2010
Předmět:
Popis: Son yıllarda, internetin çeşitli eğitim çevrelerinde insanlar arasında iletişim ve işbirliğinde kullanılmasının bir sonucu olarak mevcut her türlü elektronik veri türleri ve miktarları büyük ölçüde artmıştır. Güncel arama motorları internet üzerindeki bu bilgi kaynaklarının çoğuna ulaşmaz. Arama motorları statik URL bağlantılarına kolayca erişmelerine rağmen internetin merkezi olmayan niteliği nedeniyle her türlü bilgi içeren kaotik bir depoyla yüz yüzeyiz (yani, metin, ses ve video dosyaları, bilimsel veri, ticari ürünler, konuşma metinleri gibi veri tipleri). Bu nedenle, ilgili kaynakları bulmak daha zor hale gelmiştir. Genel olarak, bu bilgi kaynaklarında bulunan verinin belli bir yapısı (veritabanı ilişkilerinde olduğu gibi) yoktur. Bazı veriler yarı yapılandırılmış ve bazı verilerin bir yapısı yoktur. Arama motoru gibi bilgi arama araçları, kullanıcının sorgularına cevap olarak bir liste üretir. Bu liste sorgulayan kullanıcı için bazen gereksiz belgeleri içerir ve bazen de gerekli ve önemli olanları dışarıda bırakır. Bu tezde, kullanıcı ve dokümanlar 5 yönüyle metadata kullanılarak tanımlandı. Kullanıcı ve dokümanlar arasında kavramsal ilişkiler kuruldu. Arama yapılırken kullanıcı ve dokümanlar arasındaki ilişkiler kullanılarak bir sonuç listesi elde edildi. Bu liste PageRank algoritmasıyla derecelendirildi. Volumes and types of all kinds of electronically available data have increased dramatically in recent years as a result of the Internet being primary means of communication and collaboration among people of various educational background and diversity. Current search engines do not reach most of these information sources on the Internet. Although, search engines access static URL links easily, because of the decentralized nature of the Internet, we face a chaotic repository of all types of information (that is, large variety of data types such as text, audio and video files, scientific data, commercial products, and transcripts of conversations and so on). Therefore, it is becoming more and more difficult to locate resources of interest in the web. In response to user?s queries, information discovery tools such as search engines (via crawler and/or indexer modules) produce a list which, sometimes, includes some unnecessary documents, and occasionally may leave out necessary and important ones for a querying user. In this thesis, we design a model for web information discovery tools. Users and documents are defined in five aspects by metadata. Conceptual relations are set between user and documents. While searching a list of results was obtained by using the relationship between users and documents. This result list was ranked by using PageRank algorithm. 60
Databáze: OpenAIRE