Automatsko izdvajanje mišljenja iz tekstualnih komentara studentskih anketa

Autor: Nikolić, Nikola
Přispěvatelé: Kovačević, Aleksandar, Ivanović, Dragan, Dimić, Surla Bojana, Kupusinac, Aleksandar, Slivka, Jelena
Jazyk: srbština
Rok vydání: 2021
Předmět:
Zdroj: CRIS UNS
Popis: Регрутовање нових и задржавање постојећих студената су важна питања за свевисокошколске установе. Стога је пресудно стално праћење нивоа задовољствастудената. Аутоматска анализа мишљења студената се може реализоватиприменом аспектно базиране сентимент анализе (АБСА). АБСА је под-дисциплина обраде природног језика која се фокусира на идентификацијусентимената (негативних, неутралних, позитивних) и аспеката (носиоцасентимента) у реченици. Циљ ове докторске дисертације је да предложи системза АБСА текстуалних коментара студентских анкета на српском језику.Предложени систем се ослања на технике обраде природног језика, моделамашинког учења, правила и речника. Корпус је прикупљен и анотиран за развоји евалуацију система и укључује рецензије студената о наставном особљу истудијским програмима на Факултету техничких наука.Резултати истраживања показују да се позитивни сентимент може успешноидентификовати са Ф-мером 0,91, док се негативан сентимент можеидентификовати са Ф-мером 0,97. Док су Ф-мере за аспекте у опсегу између 0,49и 0,89, у зависности од њихове учесталости у корпусу.Према сазнању аутора, ово је прво истраживање АБСА које је спроведено нанивоу сегмента реченице за српски језик. Методологија и сазнања која супредстављена у овој докторској дисертацији пружају преко потребне основе задаљи рад на анализи сентимената за српски језик који је у овој областинедовољно истражен и има недостатак језичких ресурса.
Regrutovanje novih i zadržavanje postojećih studenata su važna pitanja za svevisokoškolske ustanove. Stoga je presudno stalno praćenje nivoa zadovoljstvastudenata. Automatska analiza mišljenja studenata se može realizovatiprimenom aspektno bazirane sentiment analize (ABSA). ABSA je pod-disciplina obrade prirodnog jezika koja se fokusira na identifikacijusentimenata (negativnih, neutralnih, pozitivnih) i aspekata (nosiocasentimenta) u rečenici. Cilj ove doktorske disertacije je da predloži sistemza ABSA tekstualnih komentara studentskih anketa na srpskom jeziku.Predloženi sistem se oslanja na tehnike obrade prirodnog jezika, modelamašinkog učenja, pravila i rečnika. Korpus je prikupljen i anotiran za razvoji evaluaciju sistema i uključuje recenzije studenata o nastavnom osoblju istudijskim programima na Fakultetu tehničkih nauka.Rezultati istraživanja pokazuju da se pozitivni sentiment može uspešnoidentifikovati sa F-merom 0,91, dok se negativan sentiment možeidentifikovati sa F-merom 0,97. Dok su F-mere za aspekte u opsegu između 0,49i 0,89, u zavisnosti od njihove učestalosti u korpusu.Prema saznanju autora, ovo je prvo istraživanje ABSA koje je sprovedeno nanivou segmenta rečenice za srpski jezik. Metodologija i saznanja koja supredstavljena u ovoj doktorskoj disertaciji pružaju preko potrebne osnove zadalji rad na analizi sentimenata za srpski jezik koji je u ovoj oblastinedovoljno istražen i ima nedostatak jezičkih resursa.
Student recruitment and retention are an important issue for all higher educationinstitutions. Constant monitoring of student satisfaction levels is therefore crucial.Aspect-based sentiment analysis is a sub-discipline of natural language processing(NLP) that focuses on the identification of sentiments (negative, neutral, positive) andaspects (sentiment targets) in a sentence. This research introduces a system foraspect-based sentiment analysis of free text reviews expressed in student opinionsurveys in the Serbian language. Sentiment analysis was carried out at the finest levelof text granularity - the level of sentence segment (phrase and clause).The presented system relies on NLP techniques, machine learning models, rules, anddictionaries. The corpora collected and annotated for system development, andevaluation comprise: students’ reviews of teaching staff at the Faculty of TechnicalSciences.The research results indicate that positive sentiment can successfully be identifiedwith F-measure of 0.91 while negative sentiment can be detected with F-measure of0.97. While the F-measures for the aspects are in range from 0.49 to 0.89, dependingon their frequency in the corpus.To the best of the authors’ knowledge, this is the first study of aspect-basedsentiment analysis carried out at the level of the sentence segment for the Serbianlanguage. The methodology and findings presented in this paper provide a muchneededbases for further work on sentiment analysis for the Serbian language that iswell under-resourced and under-researched in this area.
Databáze: OpenAIRE