Generation of lay summaries for scientific articles based on neural networks

Jazyk: ruština
Rok vydání: 2021
Předmět:
DOI: 10.18720/spbpu/3/2021/vr/vr21-747
Popis: В данной выпускной квалификационной работе описан процесс разработки системы для генерации Ð½ÐµÑ‚ÐµÑ Ð½Ð¸Ñ‡ÐµÑÐºÐ¾Ð³Ð¾ резюме из научно -Ð¸ÑÑÐ»ÐµÐ´Ð¾Ð²Ð°Ñ‚ÐµÐ»ÑŒÑÐºÐ¸Ñ ÑÑ‚Ð°Ñ‚ÐµÐ¹. В первом разделе изложен обзор Ð¿Ð¾Ð´Ñ Ð¾Ð´Ð¾Ð² в области обработки естественного языка. На основе выбранного Ð¿Ð¾Ð´Ñ Ð¾Ð´Ð° рассматриваются преимущества ÑÑƒÑ‰ÐµÑÑ‚Ð²ÑƒÑŽÑ‰Ð¸Ñ Ð½ÐµÐ¹Ñ€Ð¾Ð½Ð½Ñ‹Ñ Ð¼Ð¾Ð´ÐµÐ»ÐµÐ¹ и выбирается наиболее Ð¿Ð¾Ð´Ñ Ð¾Ð´ÑÑ‰Ð°Ñ в соответствии с приведенными критериями. В Ð¿Ð¾ÑÐ»ÐµÐ´ÑƒÑŽÑ‰Ð¸Ñ Ñ€Ð°Ð·Ð´ÐµÐ»Ð°Ñ Ð¾Ð¿Ð¸ÑÑ‹Ð²Ð°ÐµÑ‚ÑÑ процесс разработки системы для решения поставленной задачи. Приводится Ð°Ñ€Ñ Ð¸Ñ‚ÐµÐºÑ‚ÑƒÑ€Ð° выбранной модели, используемые алгоритмы обучения и способы предобработки Ð´Ð°Ð½Ð½Ñ‹Ñ . Далее обосновывается выбор библиотек и описываются этапы установки и настройки среды. В последнем разделе приводится описание методик оценивания и процесса изменения гиперпараметров в модели. В конце раздела приведены сгенерированные резюме и выводы сделанные, на основании оценок, Ð¿Ð¾Ð»ÑƒÑ‡ÐµÐ½Ð½Ñ‹Ñ Ð¾Ñ‚ рецензентов.
This final qualification paper describes the process of developing a system for generating lay summaries from scientific articles. The first section provides an overview of approaches to natural language processing. Based on the chosen approach, the advantages of existing neural models are considered and the most suitable one is selected in accordance with the specified criteria. The following sections describe the process of developing a system to solve this problem. The architecture of the selected model, the training algorithms used, and the data preprocessing methods are described. At the same time, the selected libraries are explained and the steps for installing and configuring the environment are described. The last section describes the evaluation methods and the process of changing the hyperparameters of the model. At the end of the section, the generated lay summaries and conclusions based on the ratings received from the reviewers are presented.
Databáze: OpenAIRE