Computational aspects discourse annotation

Autor: Aktaş, Berfin
Přispěvatelé: Bozşahin, Hüseyin Cem, Bilişsel Bilim Anabilim Dalı
Jazyk: angličtina
Rok vydání: 2008
Popis: Bu tezde, söylem işaretlemenin berimsel yönlerinianaliz etmeyi amaçlıyoruz. Söylem sadececümlelerin bir birleşimi değildir, aslında söylemintümü bileşimindeki her bir parçacığın toplamındandaha fazlasıdır. Söylemi herhangi bir cümlelerkümesinden ayıran özellik `bağdaşıklık`olarak tanımlanır. Bağdaşıklık, söylemin parçalarıarasındaki ilişkilerce sağlanır. Bu çalışmada,söylem için sözcüksel (lexicalized) bir yaklaşımkullanarak söylem ilişkilerinin söylemsel bağlaçlardenen sözcüksel öğeler ile kurulduğunu varsayıyoruz.Bağdaşıklığın sistematik analizi için bağdaşıklıkilişkilerinin işaretlenmiş olduğu bir külliyataihtiyaç vardır. Amacı bağdaşıklık ilişkilerininişaretlenmiş olduğu, kuram bağımsız birveri kaynağı yaratmak olan bir söylem seviyesindeişaretleme projesinde kullanılmak üzere bir işaretlemeyazılımı geliştirdik. Bu işaretleme ortamında kullanılan veri yapılarının tasarımında veri yönelimlibir yöntem izledik. Bu amaçla, bağlaçlarınyüklem-özne yapısını inceledik. Bu analiz bizeböyle bir işaretleme ortamı için `stand off` işaretlemetekniğinin `inline` yönteme göre daha uygunolduğunu gösterdi. Bu tez bağdaşıklık ilişkiyapılarının biçimsel(formal) imaları üzerine kısabir tartışma da icermektedir. In this thesis, we aim to analyze the computational aspects of discourseannotation. Discourse is not only a concatenation of sentences; infact the totality of discourse is more than the sum total of the sentencesthat constitute it. The property that differentiates discourse froma set of arbitrary sentences is defined as coherence. Coherence isestablished by the relations between the parts of discourse. We havea lexicalized approach to discourse, therefore in this study, discourserelations are considered to be set up by lexical items called discourseconnectives. Systematic analysis of coherence requires an annotatedcorpus in which coherence relations are encoded. We developed anannotation environment to be used in an ongoing discourse level annotationproject which aims to generate a theory-neutral source of coherence relations.We followed a data-driven methodology in design of the datastructure employed in the annotation software. For this reason, we examined the predicate-argumentstructure of connectives. This analysis shows that stand-off annotationtechnique is more suitable than an inline method for such an annotation environment.This thesis also include a brief discussion on the formal implications of coherence relation constructions. 50
