Bi-directional LSTM-CNNs-CRF for Italian sequence labeling

Autor: Pierluigi Cassotti, Pierpaolo Basile, Giovanni Semeraro
Předmět:
Zdroj: Scopus-Elsevier
CLiC-it
Popis: In this paper, we propose a Deep Learning architecture for sequence labeling based on a state of the art model that exploits both word- and character-level representations through the combination of bidirectional LSTM, CNN and CRF. We evaluate the proposed method on three Natural Language Processing tasks for Italian: PoS-tagging of tweets, Named Entity Recognition and Super-Sense Tagging. Results show that the system is able to achieve state of the art performance in all the tasks and in some cases overcomes the best systems previously developed for the Italian. In questo lavoro viene descritta un’architettura di Deep Learning per l’etichettatura di sequenze basata su un modello allo stato dell’arte che utilizza rappresentazioni sia a livello di carattere che di parola attraverso la combinazione di LSTM, CNN e CRF. Il metodo è stato valutato in tre task di elaborazione del linguaggio naturale per la lingua italiana: il PoS-tagging di tweet, il riconoscimento di entità e il Super-Sense Tagging. I risultati ottenuti dimostrano che il sistema è in grado di raggiungere prestazioni allo stato dell’arte in tutti i task e in alcuni casi riesce a superare i sistemi precedentemente sviluppati per la lingua italiana.
Databáze: OpenAIRE