Výsledky vyhledávání

SQuId: Measuring Speech Naturalness in Many Languages

Autor: Thibault Sellam, Ankur Bapna, Joshua Camp, Diana Mackinnon, Ankur P. Parikh, Jason Riesa

Much of text-to-speech research relies on human evaluation, which incurs heavy costs and slows down the development process. The problem is particularly acute in heavily multilingual applications, where recruiting and polling judges can take weeks. W

Externí odkaz: https://explore.openaire.eu/search/publication?articleId=doi_dedup___::b3c2078509e36e897d48e0ce5cd4abb0

Zobrazit plný text záznamu

XTREME-S: Evaluating Cross-lingual Speech Representations

Autor: Alexis Conneau, Ankur Bapna, Yu Zhang, Min Ma, Patrick von Platen, Anton Lozhkov, Colin Cherry, Ye Jia, Clara Rivera, Mihir Kale, Daan van Esch, Vera Axelrod, Simran Khanuja, Jonathan Clark, Orhan Firat, Michael Auli, Sebastian Ruder, Jason Riesa, Melvin Johnson

We introduce XTREME-S, a new benchmark to evaluate universal cross-lingual speech representations in many languages. XTREME-S covers four task families: speech recognition, classification, speech-to-text translation and retrieval. Covering 102 langua

Externí odkaz: https://explore.openaire.eu/search/publication?articleId=doi_dedup___::7d5112276248b7b6fa2427d9ed857587

Zobrazit plný text záznamu

Improving Multilingual Models with Language-Clustered Vocabularies

Autor: Hyung Won Chung, Dan Garrette, Kiat Chuan Tan, Jason Riesa

Publikováno v: EMNLP (1)

State-of-the-art multilingual models depend on vocabularies that cover all of the languages the model will expect to see at inference time, but the standard methods for generating those vocabularies are not ideal for massively multilingual applicatio

Externí odkaz: https://explore.openaire.eu/search/publication?articleId=doi_dedup___::623fc1d9776966a7676ce9268cb1ba06

Zobrazit plný text záznamu

Small and Practical BERT Models for Sequence Labeling

Autor: Naveen Arivazhagan, Amelia Archer, Melvin Johnson, Henry Tsai, Xin Li, Jason Riesa

Publikováno v: EMNLP/IJCNLP (1)

We propose a practical scheme to train a single multilingual sequence labeling model that yields state of the art results and is small and fast enough to run on a single CPU. Starting from a public multilingual BERT checkpoint, our final model is 6x

Externí odkaz: https://explore.openaire.eu/search/publication?articleId=doi_dedup___::b3443548f1b256b12a1dff0a589f2e5c
https://doi.org/10.18653/v1/d19-1374

Zobrazit plný text záznamu

Evaluating the Cross-Lingual Effectiveness of Massively Multilingual Neural Machine Translation

Autor: Aditya Siddhant, Naveen Ari, Karthik Raman, Melvin Johnson, Jason Riesa, Ankur Bapna, Henry Tsai, Orhan Firat

Publikováno v: AAAI

The recently proposed massively multilingual neural machine translation (NMT) system has been shown to be capable of translating over 100 languages to and from English within a single model (Aharoni, Johnson, and Firat 2019). Its improved translation

Externí odkaz: https://explore.openaire.eu/search/publication?articleId=doi_dedup___::c25424f2bbee8d412632ba2763404141

Zobrazit plný text záznamu

A Fast, Compact, Accurate Model for Language Identification of Codemixed Text

Autor: Anton Bakalov, Daniel Gillick, Jason Baldridge, Jason Riesa, Yuan Zhang, David J. Weiss

Publikováno v: EMNLP

We address fine-grained multilingual language identification: providing a language code for every token in a sentence, including codemixed text containing multiple languages. Such text is prevalent online, in documents, social media, and message boar

Externí odkaz: https://explore.openaire.eu/search/publication?articleId=doi_dedup___::6c693be5937a7a66cec1f0e151ef44a5
http://arxiv.org/abs/1810.04142

Zobrazit plný text záznamu

Building an English-iraqi Arabic machine translation system for spoken utterances with limited resources

Autor: Jason Riesa, Behrang Mohit, Kevin Knight, Daniel Marcu

Publikováno v: Interspeech 2006.

Externí odkaz: https://explore.openaire.eu/search/publication?articleId=doi_________::08294a79e8795ac976917e3166393d71
https://doi.org/10.21437/interspeech.2006-261

Zobrazit plný text záznamu

Akademický článek

Lexical Semantic Change through Large Language Models: a Survey.

Autor: Periti, Francesco¹ (AUTHOR) francesco.periti@unimi.it, Montanelli, Stefano¹ (AUTHOR) stefano.montanelli@unimi.it

Publikováno v: ACM Computing Surveys. Nov2024, Vol. 56 Issue 11, p1-38. 38p.

Zobrazit plný text záznamu

Akademický článek

A Survey on Malware Detection with Graph Representation Learning.

Autor: Bilot, Tristan¹ (AUTHOR) tristan.bilot@universite-paris-saclay.fr, El Madhoun, Nour² (AUTHOR) nour.el-madhoun@isep.fr, Al Agha, Khaldoun³ (AUTHOR) alagha@lisn.fr, Zouaoui, Anis⁴ (AUTHOR) anis.zouaoui@adservio.fr

Publikováno v: ACM Computing Surveys. Nov2024, Vol. 56 Issue 11, p1-36. 36p.

Zobrazit plný text záznamu

Akademický článek

Bridging the Gap between Spatial and Spectral Domains: A Unified Framework for Graph Neural Networks.

Autor: Chen, Zhiqian¹ (AUTHOR) zchen@cse.msstate.edu, Chen, Fanglan² (AUTHOR) fanglanc@vt.edu, Zhang, Lei² (AUTHOR) zhanglei@vt.edu, Ji, Taoran³ (AUTHOR) taoran.ji@tamucc.edu, Fu, Kaiqun⁴ (AUTHOR) kaiqun.fu@sdstate.edu, Zhao, Liang⁵ (AUTHOR) liang.zhao@emory.edu, Chen, Feng⁶ (AUTHOR) feng.chen@utdallas.edu, Wu, Lingfei⁷ (AUTHOR) lwu@email.wm.edu, Aggarwal, Charu⁸ (AUTHOR) charu@us.ibm.com, Lu, Chang-Tien² (AUTHOR) ctlu@vt.edu

Publikováno v: ACM Computing Surveys. May2024, Vol. 56 Issue 5, p1-42. 42p.

Zobrazit plný text záznamu

Vyhledávací nástroje:

Upřesnit hledání