Machine learning and artificial intelligence technologies application for software development project efforts (duration) estimation

Jazyk: ruština
Rok vydání: 2021
Předmět:
DOI: 10.18720/spbpu/3/2021/vr/vr21-4391
Popis: Рассмотрено применение Ñ‚ÐµÑ Ð½Ð¾Ð»Ð¾Ð³Ð¸Ð¹ машинного обучения и искусственного интеллекта к процессу предварительного прогнозирования длительности проекта по разработке программного обеспечения с целью снижения Ð¾ÑÐ½Ð¾Ð²Ð½Ñ‹Ñ Ð¿Ñ€Ð¾ÐµÐºÑ‚Ð½Ñ‹Ñ Ñ€Ð¸ÑÐºÐ¾Ð². Определены факторы, которые наиболее сильно влияют на длительность работ в Ð¿Ð¾Ð´Ð¾Ð±Ð½Ñ‹Ñ Ð¿Ñ€Ð¾ÐµÐºÑ‚Ð°Ñ . Подобраны алгоритмы для ансамблевой модели, обеспечивающие высокое качество прогнозов. С помощью языка программирования Python проведено обучение модели и произведена перекрестная проверка результатов прогнозирования с целью повышения достоверности значений метрик оценки качества. Проведена комплексная оценка качества полученной модели с использованием Ð¿Ð¾Ð»ÑƒÑ‡ÐµÐ½Ð½Ñ‹Ñ Ð´Ð»Ñ нее значений Ð¾Ð±Ñ‰ÐµÐ¿Ñ€Ð¸Ð½ÑÑ‚Ñ‹Ñ Ð¼ÐµÑ‚Ñ€Ð¸Ðº для оценки моделей машинного обучения. Модель была признана адекватной и обеспечивающей высокую точность прогнозов. Осуществлено сравнение полученной модели с аналогичными с использованием Ð¸Ð·Ð²ÐµÑÑ‚Ð½Ñ‹Ñ Ð·Ð½Ð°Ñ‡ÐµÐ½Ð¸Ð¹ метрик качества. Получены численные результаты, Ñ Ð°Ñ€Ð°ÐºÑ‚ÐµÑ€Ð¸Ð·ÑƒÑŽÑ‰Ð¸Ðµ полученный выигрыш в точности прогнозов полученной модели по сравнению с аналогами. Определены границы применимости полученной модели в Ð¾Ñ€Ð³Ð°Ð½Ð¸Ð·Ð°Ñ†Ð¸ÑÑ , Ð·Ð°Ð½Ð¸Ð¼Ð°ÑŽÑ‰Ð¸Ñ ÑÑ разработкой программного обеспечения. Даны рекомендации по внедрению и использованию предложенной модели в Ð¸Ñ Ð¿Ñ€Ð¾Ð¼Ñ‹ÑˆÐ»ÐµÐ½Ð½Ñ‹Ñ Ð¿Ñ€Ð¾Ñ†ÐµÑÑÐ°Ñ .
The application of machine learning and artificial intelligence technologies for the project duration predicting aimed to avoiding main software development project risks was considered. The factors that have huge influence on the duration of work in such projects have been identified. Algorithms for the ensemble model have been selected that provide high quality forecasts. Using the Python programming language, the model was trained, and the forecasting results were cross-validated in order to increase the reliability of the values of the quality assessment metrics. A comprehensive assessment of the quality of the model was performed using the values of conventional metrics for evaluating machine learning models obtained for it. The model was found to be adequate and fast in forecasting accuracy. A comparison to similar models using the known values of quality metrics was performed. Numerical characteristics were received that characterize the obtained gain in the accuracy of the forecasts of the model in comparison with analogs. The applicability of the model in organizations from software development domain has been determined. Recommendations are given for the implementation and use of the proposed model in their industrial processes.
Databáze: OpenAIRE