Výsledky vyhledávání - "Marivate, Vukosi"

Report

AI and the Future of Work in Africa White Paper

Autor: O'Neill, Jacki, Marivate, Vukosi, Glover, Barbara, Karanu, Winnie, Tadesse, Girmaw Abebe, Gyekye, Akua, Makena, Anne, Rosslyn-Smith, Wesley, Grollnek, Matthew, Wayua, Charity, Baguma, Rehema, Maduke, Angel, Spencer, Sarah, Kandie, Daniel, Maari, Dennis Ndege, Mutangana, Natasha, Axmed, Maxamed, Kamau, Nyambura, Adamu, Muhammad, Swaniker, Frank, Gatuguti, Brian, Donner, Jonathan, Graham, Mark, Mumo, Janet, Mbindyo, Caroline, N'Guessan, Charlette, Githinji, Irene, Makhafola, Lesego, Kruger, Sean, Etyang, Olivia, Onando, Mulang, Sevilla, Joe, Sambuli, Nanjira, Mbaya, Martin, Breloff, Paul, Anapey, Gideon M., Mogaleemang, Tebogo L., Nghonyama, Tiyani, Wanyoike, Muthoni, Mbuli, Bhekani, Nderu, Lawrence, Nyabero, Wambui, Alam, Uzma, Olaleye, Kayode, Njenga, Caroline, Sellen, Abigail, Kairo, David, Chabikwa, Rutendo, Abdulhamid, Najeeb G., Kubasu, Ketry, Okolo, Chinasa T., Akpo, Eugenia, Budu, Joel, Karambal, Issa, Berkoh, Joseph, Wasswa, William, Njagwi, Muchai, Burnet, Rob, Ochanda, Loise, de Bod, Hanlie, Ankrah, Elizabeth, Kinyunyu, Selemani, Kariuki, Mutembei, Kiyimba, Kizito, Eleshin, Farida, Madeje, Lillian Secelela, Muraga, Catherine, Nganga, Ida, Gichoya, Judy, Maina, Tabbz, Maina, Samuel, Mercy, Muchai, Ochieng, Millicent, Nyairo, Stephanie

This white paper is the output of a multidisciplinary workshop in Nairobi (Nov 2023). Led by a cross-organisational team including Microsoft Research, NEPAD, Lelapa AI, and University of Oxford. The workshop brought together diverse thought-leaders f

Externí odkaz: http://arxiv.org/abs/2411.10091

Zobrazit plný text záznamu

Report

From N-grams to Pre-trained Multilingual Models For Language Identification

Autor: Sindane, Thapelo, Marivate, Vukosi

In this paper, we investigate the use of N-gram models and Large Pre-trained Multilingual models for Language Identification (LID) across 11 South African languages. For N-gram models, this study shows that effective data size selection remains cruci

Externí odkaz: http://arxiv.org/abs/2410.08728

Zobrazit plný text záznamu

Report

Cross-lingual transfer of multilingual models on low resource African Languages

Autor: Thangaraj, Harish, Chenat, Ananya, Walia, Jaskaran Singh, Marivate, Vukosi

Large multilingual models have significantly advanced natural language processing (NLP) research. However, their high resource demands and potential biases from diverse data sources have raised concerns about their effectiveness across low-resource l

Externí odkaz: http://arxiv.org/abs/2409.10965

Zobrazit plný text záznamu

Report

Correcting FLORES Evaluation Dataset for Four African Languages

Autor: Abdulmumin, Idris, Mkhwanazi, Sthembiso, Mbooi, Mahlatse S., Muhammad, Shamsuddeen Hassan, Ahmad, Ibrahim Said, Putini, Neo, Mathebula, Miehleketo, Shingange, Matimba, Gwadabe, Tajuddeen, Marivate, Vukosi

This paper describes the corrections made to the FLORES evaluation (dev and devtest) dataset for four African languages, namely Hausa, Northern Sotho (Sepedi), Xitsonga, and isiZulu. The original dataset, though groundbreaking in its coverage of low-

Externí odkaz: http://arxiv.org/abs/2409.00626

Zobrazit plný text záznamu

Report

InkubaLM: A small language model for low-resource African languages

Autor: Tonja, Atnafu Lambebo, Dossou, Bonaventure F. P., Ojo, Jessica, Rajab, Jenalea, Thior, Fadel, Wairagala, Eric Peter, Aremu, Anuoluwapo, Moiloa, Pelonomi, Abbott, Jade, Marivate, Vukosi, Rosman, Benjamin

High-resource language models often fall short in the African context, where there is a critical need for models that are efficient, accessible, and locally relevant, even amidst significant computing and data constraints. This paper introduces Inkub

Externí odkaz: http://arxiv.org/abs/2408.17024

Zobrazit plný text záznamu

Report

BOTS-LM: Training Large Language Models for Setswana

Autor: Brown, Nathan, Marivate, Vukosi

In this work we present BOTS-LM, a series of bilingual language models proficient in both Setswana and English. Leveraging recent advancements in data availability and efficient fine-tuning, BOTS-LM achieves performance similar to models significantl

Externí odkaz: http://arxiv.org/abs/2408.02239

Zobrazit plný text záznamu

Report

Prompting Towards Alleviating Code-Switched Data Scarcity in Under-Resourced Languages with GPT as a Pivot

Autor: Terblanche, Michelle, Olaleye, Kayode, Marivate, Vukosi

Many multilingual communities, including numerous in Africa, frequently engage in code-switching during conversations. This behaviour stresses the need for natural language processing technologies adept at processing code-switched text. However, data

Externí odkaz: http://arxiv.org/abs/2404.17216

Zobrazit plný text záznamu

Akademický článek

Monitoring Information-Seeking Patterns and Obesity Prevalence in Africa With Internet Search Data: Observational Study

Autor: Oladeji, Olubusola, Zhang, Chi, Moradi, Tiam, Tarapore, Dharmesh, Stokes, Andrew C, Marivate, Vukosi, Sengeh, Moinina D, Nsoesie, Elaine O

Publikováno v: JMIR Public Health and Surveillance, Vol 7, Iss 4, p e24348 (2021)

BackgroundThe prevalence of chronic conditions such as obesity, hypertension, and diabetes is increasing in African countries. Many chronic diseases have been linked to risk factors such as poor diet and physical inactivity. Data for these behavioral

Externí odkaz: https://doaj.org/article/db995ec35d8c4f2ba742fdb96cb7d607

Zobrazit plný text záznamu

Report

Multimodal Misinformation Detection in a South African Social Media Environment

Autor: De Jager, Amica, Marivate, Vukosi, Modupe, Abioudun

With the constant spread of misinformation on social media networks, a need has arisen to continuously assess the veracity of digital content. This need has inspired numerous research efforts on the development of misinformation detection (MD) models

Externí odkaz: http://arxiv.org/abs/2312.04052

Zobrazit plný text záznamu

Report

PuoBERTa: Training and evaluation of a curated language model for Setswana

Autor: Marivate, Vukosi, Mots'Oehli, Moseli, Wagner, Valencia, Lastrucci, Richard, Dzingirai, Isheanesu

Natural language processing (NLP) has made significant progress for well-resourced languages such as English but lagged behind for low-resource languages like Setswana. This paper addresses this gap by presenting PuoBERTa, a customised masked languag

Externí odkaz: http://arxiv.org/abs/2310.09141

Zobrazit plný text záznamu

Vyhledávací nástroje:

Upřesnit hledání