BUILDING A CHINESE-RUSSIAN PARALLEL DISCOURSE STRUCTURE CORPUS OF OFFICIAL TEXTS

Rok vydání: 2016
Předmět:
Zdroj: Bulletin of the South Ural State University series Linguistics. 13:23-31
ISSN: 2413-0532
1991-9751
DOI: 10.14529/ling160404
Popis: Статья посвящена проекту создания китайско-русского параллельного корпуса официально- деловых текстов с дискурсивно-структурной разметкой. Данная разметка заключается в описа- нии структуры каждого абзаца в виде сети дискурсивных единиц, соединенных дискурсивными отношениями. Основу первичного наполнения корпуса составляют доклады о работе правитель- ства КНР на китайском языке и их официальные переводы на русский. Выравнивание китайских и русских текстов в корпусе, т. е. их синтаксическое соотнесение, проводится по структуре каж- дого абзаца. В статье представлены история разработки проблемы создания синтаксических кор- пусов, общие задачи проекта, его теоретические основания и прикладные перспективы, критерии отбора текстов для корпуса, принципы разметки и выравнивания текстов, а также программное обеспечение для разметки и хранения данных (общая схема данных и интерфейс). Создаваемый корпус может быть в дальнейшем использован для решения задач машинного перевода и других алгоритмов автоматической обработки текста, обучения иностранным языкам, сопоставительной лингвистики, теории перевода и т. д.корпусная лингвистика, параллельный корпус, дискурсивно-структурная разметка, трибанк, китайско-русский корпус, дискурсивное выравнивание, автоматическая об- работка текста, машинный перевод
Databáze: OpenAIRE