Zobrazeno 1 - 10
of 14
pro vyhledávání: '"Doleschal, Johannes"'
Publikováno v:
Logical Methods in Computer Science, Volume 19, Issue 3 (August 9, 2023) lmcs:8623
Regular expressions with capture variables, also known as regex-formulas, extract relations of spans (intervals identified by their start and end indices) from text. In turn, the class of regular document spanners is the closure of the regex formulas
Externí odkaz:
http://arxiv.org/abs/2002.08828
Publikováno v:
Logical Methods in Computer Science, Volume 18, Issue 1 (January 31, 2022) lmcs:6936
The framework of document spanners abstracts the task of information extraction from text as a function that maps every document (a string) into a relation over the document's spans (intervals identified by their start and end indices). For instance,
Externí odkaz:
http://arxiv.org/abs/1908.11642
Programs for extracting structured information from text, namely information extractors, often operate separately on document segments obtained from a generic splitting operation such as sentences, paragraphs, k-grams, HTTP requests, and so on. An au
Externí odkaz:
http://arxiv.org/abs/1810.03367
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Autor:
Doleschal, Johannes
The framework of document spanners abstracts the task of information extraction from text as a function that maps every document (a string) into a relation over the document’s spans (intervals identified by their start and end indices). For instanc
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=doi_________::d4b2ea9634037d0b11d37915fd0fa2e2
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
Logical Methods in Computer Science (LMCS); 2022, Vol. 18 Issue 1, p1-39, 39p
SCULPT is a simple schema language inspired by the recent working effort towards a recommendation by the World Wide Web Consortium (W3C) for tabular data and metadata on the Web. In its core, a SCULPT schema consists of a set of rules where left-hand
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=doi_dedup___::9d16d180da9102e8cedd573f3eea3dc3
http://hdl.handle.net/1942/29006
http://hdl.handle.net/1942/29006
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
PODS
Meeting
Meeting
Programs for extracting structured information from text, namely information extractors, often operate separately on document segments obtained from a generic splitting operation such as sentences, paragraphs, k-grams, HTTP requests, and so on. An au