Bi-directional LSTM-CNNs-CRF for Italian sequence labeling
Autor: | Pierluigi Cassotti, Pierpaolo Basile, Giovanni Semeraro |
---|---|
Předmět: |
traitement de texte
Computer science tecnology linguaggio traitement du langage naturel Sequence labeling digital humenities intelligence artificielle linguistica computazionale natural language processing language business.industry tecnologia Pattern recognition langue artificial intelligence elaborazione del linguaggio naturale Computational Linguistics linguistique computationelle Artificial intelligence text processing umanistica digitale business intelligenza artificiale elaborazione del testo technologie |
Zdroj: | Scopus-Elsevier CLiC-it |
Popis: | In this paper, we propose a Deep Learning architecture for sequence labeling based on a state of the art model that exploits both word- and character-level representations through the combination of bidirectional LSTM, CNN and CRF. We evaluate the proposed method on three Natural Language Processing tasks for Italian: PoS-tagging of tweets, Named Entity Recognition and Super-Sense Tagging. Results show that the system is able to achieve state of the art performance in all the tasks and in some cases overcomes the best systems previously developed for the Italian. In questo lavoro viene descritta un’architettura di Deep Learning per l’etichettatura di sequenze basata su un modello allo stato dell’arte che utilizza rappresentazioni sia a livello di carattere che di parola attraverso la combinazione di LSTM, CNN e CRF. Il metodo è stato valutato in tre task di elaborazione del linguaggio naturale per la lingua italiana: il PoS-tagging di tweet, il riconoscimento di entità e il Super-Sense Tagging. I risultati ottenuti dimostrano che il sistema è in grado di raggiungere prestazioni allo stato dell’arte in tutti i task e in alcuni casi riesce a superare i sistemi precedentemente sviluppati per la lingua italiana. |
Databáze: | OpenAIRE |
Externí odkaz: |