Information Technology for Detecting Fuzzy Duplicates in Source Code

Jazyk:	ukrajinština
Rok vydání:	2021
Předmět:	нечіткі дублікати коду цифровий відбиток нечеткие дубликаты кода fuzzy code duplicates абстрактне синтаксичне дерево алгоритм winnowing
Popis:	Проведено аналіз літератури, методів та інструментів, які дозволяють виявити дублікати текстів програмного забезпечення у великих проектах та у студентських роботах, що використовують різні підходи, заснованих на метриках, узгодженні шаблонів послідовності токенів, аналізі абстрактного синтаксичного дерева (AST) або графа залежностей програми (PDG). У даній роботі описано та реалізовано технологію виявлення дублікатів засновану на абстрактному синтаксичному дереві, обчислюючи хеш-значення вузлів синтаксичного дерева та порівнюючи їх. Для оптимізації використаної пам’яті було застосовано алгоритм Winnowing. Дана розробка дозволяє виявляти дублікати коду студентських робіт в автоматичному режимі, на різних мовах програмування з достатнім рівнем точності.
Databáze:	OpenAIRE
Externí odkaz:	https://explore.openaire.eu/search/publication?articleId=od______2001::fccb887f4ef529b7a173d45057b57572 https://essuir.sumdu.edu.ua/handle/123456789/86868 Zobrazit plný text záznamu