Development of modifications of semi-template based models for predicting possible ways of synthesizing chemicals using deep neural networks

Jazyk: ruština
Rok vydání: 2022
Předmět:
DOI: 10.18720/spbpu/3/2023/vr/vr23-516
Popis: Тема выпускной квалификационной работы: «Разработка модификаций semi-template based моделей предсказания Ð²Ð¾Ð·Ð¼Ð¾Ð¶Ð½Ñ‹Ñ Ð¿ÑƒÑ‚ÐµÐ¸Ì† синтеза Ñ Ð¸Ð¼Ð¸Ñ‡ÐµÑÐºÐ¸Ñ Ð²ÐµÑ‰ÐµÑÑ‚Ð² с использованием Ð³Ð»ÑƒÐ±Ð¾ÐºÐ¸Ñ Ð½ÐµÐ¸Ì†Ñ€Ð¾Ð½Ð½Ñ‹Ñ ÑÐµÑ‚ÐµÐ¸Ì†Â».Данная работа посвящена исследованию методов Ñ€ÐµÑˆÐ°ÑŽÑ‰Ð¸Ñ Ð·Ð°Ð´Ð°Ñ‡Ñƒ предсказания Ð²Ð¾Ð·Ð¼Ð¾Ð¶Ð½Ñ‹Ñ Ð¿ÑƒÑ‚ÐµÐ¸Ì† ретросинтеза Ñ Ð¸Ð¼Ð¸Ñ‡ÐµÑÐºÐ¸Ñ ÑÐ¾ÐµÐ´Ð¸Ð½ÐµÐ½Ð¸Ð¸Ì† и разработке модификаций semi-template based методов для повышения разнообразия результатов Ð³ÐµÐ½ÐµÑ€Ð¸Ñ€ÑƒÐµÐ¼Ñ‹Ñ Ð¼Ð¾Ð´ÐµÐ»ÑŒÑŽ.Задачи, которые решались в Ñ Ð¾Ð´Ðµ работы:1. анализ ÑÑƒÑ‰ÐµÑÑ‚Ð²ÑƒÑŽÑ‰Ð¸Ñ Ð¼ÐµÑ‚Ð¾Ð´Ð¾Ð² и Ð¿Ð¾Ð´Ñ Ð¾Ð´Ð¾Ð² предиктивной Ñ Ð¸Ð¼Ð¸Ð¸ для решения задачи предсказания путей ретросинтеза;2. разработка модификаций, которые позволяют увеличить разнообразие предсказания для semi-template based методов3. исследование эффективности Ñ€ÐµÐ°Ð»Ð¸Ð·Ð¾Ð²Ð°Ð½Ð½Ñ‹Ñ Ð¼Ð¾Ð´Ð¸Ñ„Ð¸ÐºÐ°Ñ†Ð¸Ð¸Ì† методов.Работа выполнена с использование Ð¾Ñ‚ÐºÑ€Ñ‹Ñ‚Ñ‹Ñ Ð½Ð°Ð±Ð¾Ñ€Ð¾Ð² Ð´Ð°Ð½Ð½Ñ‹Ñ Â Ñ Ð¸Ð¼Ð¸Ñ‡ÐµÑÐºÐ¸Ñ Ñ€ÐµÐ°ÐºÑ†Ð¸Ð¸Ì† USPTO-50K и USPTO-full. На языке программирования Python 3.7 c использованием фрэймворков Pytorch и Open-NMT были реализованы модификации для semi-template based методов RetroXpert и GraphRetro, которые улучшают показатели Ð¿Ñ€ÐµÐ´Ð»Ð¾Ð¶ÐµÐ½Ð½Ñ‹Ñ Ð¼ÐµÑ‚Ñ€Ð¸Ðº для оценки разнообразия предсказаний, Diversity и Class Diversity.В итоге выполнено исследование Ñ€ÐµÐ°Ð»Ð¸Ð·Ð¾Ð²Ð°Ð½Ð½Ñ‹Ñ Ð¼Ð¾Ð´Ð¸Ñ„Ð¸ÐºÐ°Ñ†Ð¸Ð¸Ì† с точки зрения Ð¿Ñ€ÐµÐ´Ð»Ð¾Ð¶ÐµÐ½Ð½Ñ‹Ñ Ð¼ÐµÑ‚Ñ€Ð¸Ðº. На основании исследований можно сделать вывод,что разработанные модификации позволяют повысить значение метрики Diversity на 2% и Class Diversity 3% с помощью первой модификации и Diversity на 3% и Class Diversity 1.3% с помощью второй модификации.
The subject of the graduate qualification work: "Development of modifications of semi-template based models for predicting possible ways of synthesizing chemicals using deep neural networks."The given work is devoted to the study of methods that solve the problem of predicting possible pathways for the retrosynthesis of chemical compounds and the development of modifications of semi-template based methods to increase the diversity of results generated by the model.The research set the following goals:1. analysis of existing methods and approaches of predictive chemistry for solving the problem of predicting retrosynthesis pathways;2. development of modifications that allow increasing the variety of predictions for semi-template based methods3. research about the performance of implemented modifications of methods.The work was performed using USPTO-50K and USPTO-full open chemical reaction datasets. In the Python 3.7 programming language using the Pytorch and Open-NMT frameworks, modifications were implemented for the semi-template based methods RetroXpert and GraphRetro, which improve the performance of the proposed metrics for assessing the diversity of predictions, Diversity and Class Diversity.As a result, a research of the implemented modifications was carried out in terms of the proposed metrics. Based on the research, it can be concluded that the developed modifications allow increasing the value of the Diversity by 2% and Class Diversity 3% with the first modification and Diversity by 3% and Class Diversity 1.3% with the second modification.
Databáze: OpenAIRE