Artificial Intelligence and Machine Learning Algorithms for Assessing the Authenticity of a Scientific Article in Scopus: Translator's Experience

Rok vydání: 2022
Zdroj: University Library at a New Stage of Social Communications Development. Conference Proceedings; No. 7 (2022); 135-140
University Library at a New Stage of Social Communications Development. Conference Proceedings; № 7 (2022); 135-140
ISSN: 2707-0476
DOI: 10.15802/unilib/2022_270630
Popis: Objective. This paper examines ways to solve the problem of cross-language plagiarism in scientific works written in Ukrainian, which are to be translated and published in English. Considering that Ukrainian university libraries are directly involved in the practices of improving the level of awareness of lecturers and scientists, as well as their support of a large number of new digital tools, we draw attention to the emergence of new opportunities in the practices of supporting academic integrity. Methods. Big Data mining techniques and analysis of algorithms underlying machine translation software were employed to identify the cases of cross-language plagiarism in scientific articles originally written in the Ukrainian language. Results. Based on the analysis of 4000 translated manuscripts, it was established that the standard Microsoft Word 2022 software, typically used to write an article, identifies with a very high accuracy those parts of the text that had been earlier published and stored in a digital format. Conclusions. With the advent of Microsoft Office 365 software (released in 2022), it becomes possible to check any article originally written in Ukrainian or Russian, while being translated into English, for similarities with previously published academic papers. This allows for an instantaneous correction check that may prove useful in preventing the intended or unintended occurrence of cross-language plagiarism in scientific papers. It is advisable to more actively involve librarians of Ukrainian universities in using the powerful potential of digital support for the research activities of their users, including writing papers and checking them for signs of plagiarism.
Мета. У статті розглядаються шляхи вирішення проблеми міжмовного плагіату в наукових роботах, написаних українською мовою, які підлягають перекладу та публікації англійською мовою. Методика. Для виявлення випадків міжмовного плагіату в наукових статтях, написаних українською мовою, було використано методи опрацювання великих даних та аналіз алгоритмів програмного забезпечення машинного перекладу. Результати. На основі аналізу 4000 перекладених рукописів встановлено, що стандартне програмне забезпечення Microsoft Word 2022, яке зазвичай використовується для написання статті, з дуже високою точністю визначає ті частини тексту, які раніше були опубліковані та збережені в цифровому форматі. Висновки. З появою програмного забезпечення Microsoft Office 365 (випущеного у 2022 році) з’явилася можливість перевірити будь-яку статтю, оригінально написану українською чи російською мовою, з одночасним перекладом на англійську, на схожість із раніше опублікованими науковими статтями. Це дозволяє миттєво перевірити наукову працю, що може виявитися корисним для запобігання навмисному чи ненавмисному виникненню міжмовного плагіату в наукових статтях. Доцільно активніше залучати бібліотекарів українських університетів до використання потужного потенціалу цифрової підтримки науково-дослідницької діяльності своїх користувачів, у т.ч. написання робіт та перевірки їх на ознаки плагіату.
Databáze: OpenAIRE