| Campo DC | Valor | Lengua/Idioma |
| dc.contributor.advisor1 | Goliatt, Priscila Vanessa Zabala Capriles | - |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/3074561832181610 | pt_BR |
| dc.contributor.advisor-co1 | Bastos, Flávia de Souza | - |
| dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/4695699230584970 | pt_BR |
| dc.contributor.referee1 | Silva, Rodrigo César Pedrosa | - |
| dc.contributor.referee1Lattes | http://lattes.cnpq.br/1368091094952755 | pt_BR |
| dc.contributor.referee2 | Werneck, Francisco Zacaron | - |
| dc.contributor.referee2Lattes | http://lattes.cnpq.br/2110472736345234 | pt_BR |
| dc.creator | Andrade, Raíla Alves de | - |
| dc.creator.Lattes | http://lattes.cnpq.br/4980237337158202 | pt_BR |
| dc.date.accessioned | 2026-07-02T11:02:44Z | - |
| dc.date.available | 2026-07-01 | - |
| dc.date.available | 2026-07-02T11:02:44Z | - |
| dc.date.issued | 2026-03-26 | - |
| dc.identifier.uri | https://repositorio.ufjf.br/jspui/handle/ufjf/20542 | - |
| dc.description.abstract | Sports talent is a complex and multifactorial construct, and its identification is fundamental for athlete development. In this context, the Projeto Atletas de Ouro (Gold Athletes Project), developed by the Laboratory for Exercise and Sport Studies and Research (LABESPEE), proposed the Gold Score, a predictive index that adopts a multidimensional approach to estimate the sports potential of young individuals. However, the current model may introduce biases and limit its applicability in certain contexts due to its reliance on subjective evaluations performed by coaches. Therefore, the aim of this dissertation was to develop and evaluate machine learning models capable of estimating the Gold Score, reducing or eliminating the reliance on subjective assessments. To achieve this, four progressive experiments were conducted wherein 13 machine learning algorithms were tested, including boosting techniques (CatBoost, XGBoost, Gradient Boosting, LightGBM), linear regression, and tree- and distance-based methods. The models were optimized using the Particle Swarm Optimization (PSO) algorithm and evaluated via 10-fold cross-validation on a dataset of over 3,000 student assessments collected between 2015 and 2023.
The results demonstrated that gradient boosting algorithms (especially CatBoost and XGBoost) exhibited the best predictive performance. In the complete scenario (including subjective variables), the models achieved an R² > 0.99 and successfully identified all medalists among the 20 students with the highest predicted potential. Even after removing the coaches subjective evaluations, the models maintained satisfactory explanatory power (R² ≈ 0.87) and preserved the ability to differentiate selected from non-selected individuals (large effect size, d > 0.88). In addition to optimizing resource allocation for in-depth individual assessments, the findings broaden the discussion on the use of computational methods as decision-support tools in sports talent identification processes. The proposed approach can be replicated in different school contexts, contributing to assessment equity by reducing reliance on subjective factors. These results point to promising directions for future research, including the prospective validation of the models, the expansion of the dataset to include other institutions, and the development of accessible computational tools (e.g., spreadsheets and web applications) for teachers and coaches. | pt_BR |
| dc.description.resumo | O talento esportivo é um constructo complexo e multifatorial, cuja identificação precoce é fundamental para o desenvolvimento de atletas. Nesse contexto, o Projeto Atletas de Ouro, desenvolvido pelo Laboratório de Estudos e Pesquisa do Exercício e Esporte (LABESPEE), propôs o Gold Score, um índice preditivo que utiliza uma abordagem multidimensional para estimar o potencial esportivo de jovens escolares. No entanto, o modelo original depende de avaliações subjetivas realizadas por treinadores, o que pode introduzir vieses e limitar sua aplicabilidade em contextos com escassez de profissionais especializados.
Diante disso, o objetivo desta dissertação foi desenvolver e avaliar modelos de aprendizado de máquina capazes de estimar o Gold Score, reduzindo a dependência de avaliações subjetivas do treinador. Para isso, foram realizados quatro experimentos progressivos, nos quais foram testados 13 algoritmos de aprendizado de máquina, incluindo técnicas de boosting (CatBoost, XGBoost, Gradient Boosting, LightGBM), regressões lineares e métodos baseados em árvores e distância. Os modelos foram otimizados por meio do algoritmo PSO (Particle Swarm Optimization) e avaliados com validação cruzada de 10 folds, utilizando uma base de dados com mais de 3.000 avaliações de escolares coletadas entre 2015 e 2023.
Os resultados demonstraram que os algoritmos baseados em gradient boosting (especialmente CatBoost e XGBoost) apresentaram o melhor desempenho preditivo. No cenário completo (com variáveis subjetivas), os modelos alcançaram R² > 0,99 e identificaram todos os medalhistas entre os 20 escolares com maior potencial previsto. Mesmo após a remoção das avaliações subjetivas do treinador, os modelos mantiveram poder explicativo satisfatório (R² ≈ 0,87) e preservaram a capacidade de diferenciar selecionados de não selecionados (tamanhos de efeito grandes, d > 0,88).
Além de otimizar o direcionamento de recursos para a avaliação aprofundada dos indivíduos, os achados ampliam a discussão sobre o uso de métodos computacionais como ferramentas de apoio à decisão em processos de identificação de talentos esportivos. A abordagem proposta pode ser replicada em diferentes contextos escolares, contribuindo para a equidade na avaliação ao reduzir a dependência de fatores subjetivos. Estes resultados apontam caminhos promissores para futuras investigações, incluindo a validação prospectiva dos modelos, a expansão da base de dados para outras instituições e o desenvolvimento de ferramentas computacionais acessíveis (planilhas, aplicativos web) para uso por professores e treinadores. | pt_BR |
| dc.description.sponsorship | CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior | pt_BR |
| dc.language | por | pt_BR |
| dc.publisher | Universidade Federal de Juiz de Fora (UFJF) | pt_BR |
| dc.publisher.country | Brasil | pt_BR |
| dc.publisher.department | Faculdade de Engenharia | pt_BR |
| dc.publisher.program | Programa de Pós-graduação em Modelagem Computacional | pt_BR |
| dc.publisher.initials | UFJF | pt_BR |
| dc.rights | Acesso Aberto | pt_BR |
| dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
| dc.subject | Talento esportivo | pt_BR |
| dc.subject | Identificação de talentos | pt_BR |
| dc.subject | Aprendizado de máquina | pt_BR |
| dc.subject | Ciência de dados | pt_BR |
| dc.subject | Desempenho esportivo | pt_BR |
| dc.subject | Gold Score | pt_BR |
| dc.subject | Sports talent | pt_BR |
| dc.subject | Talent identification | pt_BR |
| dc.subject | Machine learning | pt_BR |
| dc.subject | Data science | pt_BR |
| dc.subject | Sports performance | pt_BR |
| dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | pt_BR |
| dc.title | Ciência de Dados aplicada na sistematização da avaliação do potencial esportivo | pt_BR |
| dc.type | Dissertação | pt_BR |
| Aparece en las colecciones: | Mestrado em Modelagem Computacional (Dissertações)
|