RepoDucibility Miner: Auxiliando na Seleção de Repositórios de Software para Estudos de Mineração de Repositórios de Software

Autores

  • Gleiph Ghiotto Universidade Federal de Juiz de Fora
  • Hiero Henrique Barcelos Costa da Universidade Federal de Juiz de Fora https://orcid.org/0009-0003-4352-5974
  • Victor Souza Salles Universidade Federal de Juiz de Fora https://orcid.org/0009-0005-8093-0869
  • Guilherme Marques de Oliveira Universidade Federal de Juiz de Fora

DOI:

https://doi.org/10.34019/2179-3700.2024.v24.46193

Palavras-chave:

Reprodutibilidade de Experimentos., Gerência de Configuração., Mineração de Repositórios de Software., GitHub.

Resumo

A hospedagem de repositórios Git em plataformas como o GitHub transformou-as em tesouros de informações que podem ser utilizadas por pesquisadores em experimentos de Mineração de Repositórios de Software para aprimorar o desenvolvimento de software. Assim, nesse cenário, muitas ferramentas foram criadas para dar suporte a seleção de repositórios. No entanto, elas possuem limitações, pois as abordagens tradicionais utilizadas na seleção de repositórios não apresentam um processo sistemático para escolha dos repositórios e o armazenamento do racional para a justificativa das escolhas, inviabilizando a reprodutibilidade dos experimentos. Portanto, o RepoDucibility Miner foi criado com o intuito de resolver os problemas e as limitações de ferramentas apresentadas na literatura. Esse trabalho apresenta o RepoDucibility Miner e avalia o tempo necessário para realizar diferentes buscas com alterações na configuração da pesquisa.  Os resultados demostram que as pesquisar realizadas podem ter um tempo médio de até 20:29:10 e que o aumento dos tokens para 3 pode reduzir o tempo de busca em até 85,51%.

Downloads

Não há dados estatísticos.

Biografia do Autor

Gleiph Ghiotto, Universidade Federal de Juiz de Fora

Professor orientador dos projetos de Iniciação Científica PIBITI. Professor do Departamento de Ciência da Computação da UFJF. E-mail: gleiph@ice.ufjf.br

Hiero Henrique Barcelos Costa, da Universidade Federal de Juiz de Fora

Acadêmico da Engenharia Computacional da Universidade Federal de Juiz de Fora.  Membro do grupo GET - Engenharia Computacional, bolsista do projeto “Seleção de Repositórios” de 2022 a 2023 e membro do grupo de pesquisa Homúnculos. E-mail: hiero.costa@estudante.ufjf.br

Victor Souza Salles, Universidade Federal de Juiz de Fora

Acadêmico do Curso de Ciências Exatas da Universidade Federal de Juiz de Fora. Bolsista de 2023 a 2024 do projeto “Seleção de Repositórios”. E-mail: victor.salles@estudante.ufjf.br

Referências

HASSAN, A. E. The road ahead for Mining Software Repositories. 2008 Frontiers of Software Maintenance. Anais... Em: 2008 IEEE INTERNATIONAL CONFERENCE ON SOFTWARE MAINTENANCE. Beijing, China: IEEE, set. 2008.

VIDONI, M. A systematic process for Mining Software Repositories: Results from a systematic literature review. Information and Software Technology, v. 144, p. 106791, abr. 2022.

KAGDI, H.; COLLARD, M. L.; MALETIC, J. I. A survey and taxonomy of approaches for mining software repositories in the context of software evolution. Journal of Software Maintenance and Evolution: Research and Practice, v. 19, n. 2, p. 77–131, mar. 2007.

BORGES, H.; TULIO VALENTE, M. What’s in a GitHub Star? Understanding Repository Starring Practices in a Social Coding Platform. Journal of Systems and Software, v. 146, p. 112–129, dez. 2018.

REZA, S. M.; BADREDDIN, O.; RAHAD, K. ModelMine: a tool to facilitate mining models from open source repositories. Proceedings of the 23rd ACM/IEEE International Conference on Model Driven Engineering Languages and Systems: Companion Proceedings. Anais... Em: MODELS ’20: ACM/IEEE 23RD INTERNATIONAL CONFERENCE ON MODEL DRIVEN ENGINEERING LANGUAGES AND SYSTEMS. Virtual Event Canada: ACM, 16 out. 2020.

ROMANO, S. et al. G-Repo: a Tool to Support MSR Studies on GitHub. 2021 IEEE International Conference on Software Analysis, Evolution and Reengineering (SANER). Anais... Em: 2021 IEEE INTERNATIONAL CONFERENCE ON SOFTWARE ANALYSIS, EVOLUTION AND REENGINEERING (SANER). Honolulu, HI, USA: IEEE, mar. 2021.

COSTA, H. H. B. et al. Tracking the decisions to select repositories for Mining Software Repositories experiments. Anais Estendidos do XX Simpósio Brasileiro de Sistemas de Informação (SBSI 2024). Anais... Em: ANAIS ESTENDIDOS DO SIMPÓSIO BRASILEIRO DE SISTEMAS DE INFORMAÇÃO. Brasil: Sociedade Brasileira de Computação (SBC), maio 2024.

LUZGIN, V. A.; KHOLOD, I. I. Overview of Mining Software Repositories. 2020 IEEE Conference of Russian Young Researchers in Electrical and Electronic Engineering (EIConRus). Anais... Em: 2020 IEEE CONFERENCE OF RUSSIAN YOUNG RESEARCHERS IN ELECTRICAL AND ELECTRONIC ENGINEERING (EICONRUS). St. Petersburg and Moscow, Russia: IEEE, jan. 2020.

GÜEMES-PEÑA, D. et al. Emerging topics in mining software repositories: Machine learning in software repositories and datasets. Progress in Artificial Intelligence, v. 7, n. 3, p. 237–247, set. 2018.

Downloads

Publicado

2025-04-09

Como Citar

Ghiotto, G., Barcelos Costa, H. H., Souza Salles, V. ., & Marques de Oliveira, G. (2025). RepoDucibility Miner: Auxiliando na Seleção de Repositórios de Software para Estudos de Mineração de Repositórios de Software. Principia: Caminhos Da Iniciação Científica, 24. https://doi.org/10.34019/2179-3700.2024.v24.46193

Edição

Seção

Artigos originais - Engenharias e Ciência da Computação