Automatska procjena ličnosti bazirana na podudarnosti rečenica s društvenih mreža i upitničkih čestica

Autor: Gjurković, Matej, Vukojević, Iva, Šnajder, Jan, Bratko, Denis, Butković, Ana, Jukić, Josip, Masnikosa, Irina, Pocrnić, Martina, Vukasović Hlupić, Tena, Drobac, Nina
Přispěvatelé: Tucak Junaković, Ivana, Macuka, Ivana, Tokić, Andrea
Jazyk: chorvatština
Rok vydání: 2022
Předmět:
Popis: Automatska procjena ličnosti na temelju teksta s društvenih medija dobiva sve veću pozornost kako u psihologiji tako i u području umjetne inteligencije. S jedne strane, interes psihologa primarno pobuđuje mogućnost korištenja digitalnih ponašajnih tragova za procjenu ličnosti. S druge strane, zbog brzog rasta količine tekstnih podataka koje generiraju korisnici interneta, stručnjacima računarske znanosti se kao zanimljiv izazov nameće rad s takvim velikim i nestrukturiranim podacima. No, trenutačni automatski pristupi procjenjivanju ličnosti nisu usmjereni k osiguravanju interpretabilnosti (informacija koji su točno podaci relevantni za procjenu ličnosti) i valjanosti (informacija jesu li korišteni podaci zaista valjani tragovi ličnosti). Upitnici ličnosti, međutim, kao nužni temelj imaju upravo interpretabilnost i valjanost. Kako bismo ublažili navedene slabosti automatske procjene ličnosti, predlažemo pristup koji kombinira upitničku i automatsku procjenu ličnosti. Naš pristup akronima SIMPA (engl. Statement-to-Item Matching Personality Assessment) koristi metode obrade prirodnoga jezika kako bi detektirao samoopise ličnosti koji se potom koriste za automatsku procjen ličnosti. Srž pristupa jest pojam dispozicijske semantičke sličnosti između slobodno izraženih izjava i upitničkih čestica. Takva sličnost kombinira semantičku sličnost sa znanjem o načinu na koji bi se određena dispozicija mogla manifestirati. Konceptualnu osnovu pristupa SIMPA čini model realistične točnosti (Funder, 1995), koji opisuje korake u procesu dolaska do točne procjene ličnosti, a kojeg proširujemo mehanizmom povratne petlje koja dodatno poboljšava točnost procjene. U izlaganju predstavljamo jednostavnu implementaciju pristupa SIMPA na podacima s društvene mreže Reddit. Demonstriramo kako se pristup može koristiti izravno za procjenu velikih pet crta ličnosti kod korisnika Reddita, što potvrđuju statistički značajne korelacije između tako procijenjenih crta i samoprocjena istih crta. Pristup također koristimo neizravno za proizvodnju značajki za nadzirani model strojnog učenja za automatsku procjenu ličnosti, čime dobivamo trenutačno najbolje rezultate na zadatku predviđanje ličnosti korisnika Reddita. Konačno, raspravljamo o važnim mogućnostima i izazovima analize jezika na internetu.
Databáze: OpenAIRE