RepoDucibility Miner: Auxiliando na Seleção de Repositórios de Software para Estudos de Mineração de Repositórios de Software

Autores

  • Gleiph Ghiotto Universidade Federal de Juiz de Fora
  • Hiero Henrique Barcelos Costa da Universidade Federal de Juiz de Fora https://orcid.org/0009-0003-4352-5974
  • Victor Souza Salles Universidade Federal de Juiz de Fora https://orcid.org/0009-0005-8093-0869
  • Guilherme Marques de Oliveira Universidade Federal de Juiz de Fora

DOI:

https://doi.org/10.34019/2179-3700.2024.v24.46193

Palavras-chave:

Reprodutibilidade de Experimentos., Gerência de Configuração., Mineração de Repositórios de Software., GitHub.

Resumo

A hospedagem de repositórios Git em plataformas como o GitHub transformou-as em tesouros de informações que podem ser utilizadas por pesquisadores em experimentos de Mineração de Repositórios de Software para aprimorar o desenvolvimento de software. Assim, nesse cenário, muitas ferramentas foram criadas para dar suporte a seleção de repositórios. No entanto, elas possuem limitações, pois as abordagens tradicionais utilizadas na seleção de repositórios não apresentam um processo sistemático para escolha dos repositórios e o armazenamento do racional para a justificativa das escolhas, inviabilizando a reprodutibilidade dos experimentos. Portanto, o RepoDucibility Miner foi criado com o intuito de resolver os problemas e as limitações de ferramentas apresentadas na literatura. Esse trabalho apresenta o RepoDucibility Miner e avalia o tempo necessário para realizar diferentes buscas com alterações na configuração da pesquisa.  Os resultados demostram que as pesquisar realizadas podem ter um tempo médio de até 20:29:10 e que o aumento dos tokens para 3 pode reduzir o tempo de busca em até 85,51%.

Downloads

Biografia do Autor

Gleiph Ghiotto, Universidade Federal de Juiz de Fora

Professor orientador dos projetos de Iniciação Científica PIBITI. Professor do Departamento de Ciência da Computação da UFJF. E-mail: gleiph@ice.ufjf.br

Hiero Henrique Barcelos Costa, da Universidade Federal de Juiz de Fora

Acadêmico da Engenharia Computacional da Universidade Federal de Juiz de Fora.  Membro do grupo GET - Engenharia Computacional, bolsista do projeto “Seleção de Repositórios” de 2022 a 2023 e membro do grupo de pesquisa Homúnculos. E-mail: hiero.costa@estudante.ufjf.br

Victor Souza Salles, Universidade Federal de Juiz de Fora

Acadêmico do Curso de Ciências Exatas da Universidade Federal de Juiz de Fora. Bolsista de 2023 a 2024 do projeto “Seleção de Repositórios”. E-mail: victor.salles@estudante.ufjf.br

Referências

HASSAN, A. E. The road ahead for Mining Software Repositories. 2008 Frontiers of Software Maintenance. Anais... Em: 2008 IEEE INTERNATIONAL CONFERENCE ON SOFTWARE MAINTENANCE. Beijing, China: IEEE, set. 2008.

VIDONI, M. A systematic process for Mining Software Repositories: Results from a systematic literature review. Information and Software Technology, v. 144, p. 106791, abr. 2022.

KAGDI, H.; COLLARD, M. L.; MALETIC, J. I. A survey and taxonomy of approaches for mining software repositories in the context of software evolution. Journal of Software Maintenance and Evolution: Research and Practice, v. 19, n. 2, p. 77–131, mar. 2007.

BORGES, H.; TULIO VALENTE, M. What’s in a GitHub Star? Understanding Repository Starring Practices in a Social Coding Platform. Journal of Systems and Software, v. 146, p. 112–129, dez. 2018.

REZA, S. M.; BADREDDIN, O.; RAHAD, K. ModelMine: a tool to facilitate mining models from open source repositories. Proceedings of the 23rd ACM/IEEE International Conference on Model Driven Engineering Languages and Systems: Companion Proceedings. Anais... Em: MODELS ’20: ACM/IEEE 23RD INTERNATIONAL CONFERENCE ON MODEL DRIVEN ENGINEERING LANGUAGES AND SYSTEMS. Virtual Event Canada: ACM, 16 out. 2020.

ROMANO, S. et al. G-Repo: a Tool to Support MSR Studies on GitHub. 2021 IEEE International Conference on Software Analysis, Evolution and Reengineering (SANER). Anais... Em: 2021 IEEE INTERNATIONAL CONFERENCE ON SOFTWARE ANALYSIS, EVOLUTION AND REENGINEERING (SANER). Honolulu, HI, USA: IEEE, mar. 2021.

COSTA, H. H. B. et al. Tracking the decisions to select repositories for Mining Software Repositories experiments. Anais Estendidos do XX Simpósio Brasileiro de Sistemas de Informação (SBSI 2024). Anais... Em: ANAIS ESTENDIDOS DO SIMPÓSIO BRASILEIRO DE SISTEMAS DE INFORMAÇÃO. Brasil: Sociedade Brasileira de Computação (SBC), maio 2024.

LUZGIN, V. A.; KHOLOD, I. I. Overview of Mining Software Repositories. 2020 IEEE Conference of Russian Young Researchers in Electrical and Electronic Engineering (EIConRus). Anais... Em: 2020 IEEE CONFERENCE OF RUSSIAN YOUNG RESEARCHERS IN ELECTRICAL AND ELECTRONIC ENGINEERING (EICONRUS). St. Petersburg and Moscow, Russia: IEEE, jan. 2020.

GÜEMES-PEÑA, D. et al. Emerging topics in mining software repositories: Machine learning in software repositories and datasets. Progress in Artificial Intelligence, v. 7, n. 3, p. 237–247, set. 2018.

Downloads

Publicado

2025-04-09

Como Citar

Ghiotto, G., Barcelos Costa, H. H., Souza Salles, V. ., & Marques de Oliveira, G. (2025). RepoDucibility Miner: Auxiliando na Seleção de Repositórios de Software para Estudos de Mineração de Repositórios de Software. Principia: Caminhos Da Iniciação Científica, 24. https://doi.org/10.34019/2179-3700.2024.v24.46193

Edição

Seção

Artigos originais - Engenharias e Ciência da Computação