BUILDING A CHINESE-RUSSIAN PARALLEL DISCOURSE STRUCTURE CORPUS OF OFFICIAL TEXTS
Rok vydání: | 2016 |
---|---|
Předmět: | |
Zdroj: | Bulletin of the South Ural State University series Linguistics. 13:23-31 |
ISSN: | 2413-0532 1991-9751 |
DOI: | 10.14529/ling160404 |
Popis: | Статья посвящена проекту создания китайско-русского параллельного корпуса официально- деловых текстов с дискурсивно-структурной разметкой. Данная разметка заключается в описа- нии структуры каждого абзаца в виде сети дискурсивных единиц, соединенных дискурсивными отношениями. Основу первичного наполнения корпуса составляют доклады о работе правитель- ства КНР на китайском языке и их официальные переводы на русский. Выравнивание китайских и русских текстов в корпусе, т. е. их синтаксическое соотнесение, проводится по структуре каж- дого абзаца. В статье представлены история разработки проблемы создания синтаксических кор- пусов, общие задачи проекта, его теоретические основания и прикладные перспективы, критерии отбора текстов для корпуса, принципы разметки и выравнивания текстов, а также программное обеспечение для разметки и хранения данных (общая схема данных и интерфейс). Создаваемый корпус может быть в дальнейшем использован для решения задач машинного перевода и других алгоритмов автоматической обработки текста, обучения иностранным языкам, сопоставительной лингвистики, теории перевода и т. д.корпусная лингвистика, параллельный корпус, дискурсивно-структурная разметка, трибанк, китайско-русский корпус, дискурсивное выравнивание, автоматическая об- работка текста, машинный перевод |
Databáze: | OpenAIRE |
Externí odkaz: |