Zobrazeno 1 - 10
of 274
pro vyhledávání: '"sentence boundary"'
Autor:
Sane Yagi, Shehdeh Fareh, Ashraf Elnagar, Mariam Balajeed, Abdalla El-mneizel, Mohammad Al-Badawi
Publikováno v:
Cogent Arts & Humanities, Vol 11, Iss 1 (2024)
This paper investigates the extent to which Arabic punctuation is rule-governed, with the aim of improving text comprehension, disambiguation, and machine translation. The study highlights the lack of systematic punctuation in Arabic written discours
Externí odkaz:
https://doaj.org/article/310ef3c8c6aa494d926aee5780a1877b
Publikováno v:
Data in Brief, Vol 53, Iss , Pp 110118- (2024)
Arabic, unlike many languages, suffers from punctuation inconsistency, posing a significant obstacle for Natural Language Processing (NLP). To address this, we present the Arabic Punctuation Dataset (APD), a large collection of annotated Modern Stand
Externí odkaz:
https://doaj.org/article/5aec1c8383514c87b32b3eb8ffd3e542
Publikováno v:
Applied Sciences, Vol 14, Iss 7, p 2989 (2024)
Sentence Boundary Disambiguation (SBD) is crucial for building datasets for tasks such as machine translation, syntactic analysis, and semantic analysis. Currently, most automatic sentence segmentation in Tibetan adopts the methods of rule-based and
Externí odkaz:
https://doaj.org/article/31bd76ba7c1e479182ae5f073d76d56d
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Autor:
Andrew D. Back, Janet Wiles
Publikováno v:
Entropy, Vol 24, Iss 7, p 859 (2022)
Estimating sentence-like units and sentence boundaries in human language is an important task in the context of natural language understanding. While this topic has been considered using a range of techniques, including rule-based approaches and supe
Externí odkaz:
https://doaj.org/article/38e416e0f7e94cbd8895b20300b5ff18
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Autor:
Md. Saef Ullah Miah, Junaida Sulaiman, Talha Bin Sarwar, Ateeqa Naseer, Fasiha Ashraf, Kamal Zuhairi Zamli, Rajan Jose
Publikováno v:
Applied Sciences, Vol 12, Iss 3, p 1352 (2022)
Given the growth of scientific literature on the web, particularly material science, acquiring data precisely from the literature has become more significant. Material information systems, or chemical information systems, play an essential role in di
Externí odkaz:
https://doaj.org/article/5b85f651dbe2456995a0825c2ed05f61
Sentence segmentation that breaks textual data strings into individual sentences is an important phase in natural language processing (NLP). Each word in the string that is added a punctuation mark such as a period, question mark, or exclamation poin
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=doi_dedup___::0792593a33f84de7fecd2126e77274c5
https://zenodo.org/record/7796608
https://zenodo.org/record/7796608