https://repositorio.ufjf.br/jspui/handle/ufjf/19618
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
jaquelinelamasdasilva.pdf | 10.14 MB | Adobe PDF | ![]() Visualizar/Abrir |
Clase: | Trabalho de Conclusão de Curso |
Título : | Misturas finitas de modelos parcialmente lineares: uma abordagem via P-splines para estimação das componentes não paramétricas |
Autor(es): | Silva, Jaqueline Lamas |
Orientador: | Zeller, Camila Borelli |
Co-orientador: | Ferreira, Clécio da Silva |
Miembros Examinadores: | Bastos, Ronaldo Rocha |
Miembros Examinadores: | Magalhães, Tiago Maia |
Resumo: | Os modelos de regressão, consolidados ao longo do desenvolvimento estatístico, permanecem como ferramenta primordial para investigar relações entre preditores e desfechos. Em sua formulação clássica, esse tipo de modelo assume que as observações são provenientes de uma única população homogênea. No entanto, na prática, características não observadas podem gerar comportamentos distintos entre subgrupos de observações. Em tais circunstâncias, podemos utilizar modelos de mistura de regressão para incorporar essa heterogeneidade ao modelo, estimando não apenas os parâmetros específicos de cada componente da mistura (subgrupo), mas também as probabilidades a posteriori de cada observação pertencer a cada componente, as quais podem ser utilizadas em contextos de classificação e clusterização (ou agrupamento) no âmbito de aprendizagem supervisionada e não supervisionada, respectivamente. No presente trabalho, estudamos misturas de modelos parcialmente lineares com a adoção de P-splines para estimação das componentes não-paramétricas. Nossa configuração permite que diferentes covariáveis lineares e não lineares componham a estrutura semiparamétrica de cada grupo. Os estimadores de máxima verossimilhança penalizada foram obtidos através de um algoritmo do tipo EM, enquanto os erros padrão foram calculados via matriz de informação empírica. Para a seleção dos parâmetros de suavização das curvas e do número de grupos, utilizamos o critério de informação Bayesiano (BIC). A metodologia proposta foi avaliada através de estudos de simulação e por meio de aplicação a dados reais. Além disso, na aplicação a qualidade do ajuste foi verificada através da construção de envelopes simulados baseados nos resíduos quantílicos. |
Resumen : | Regression models, well-established in statistical development, remain a primary tool for investigating relationships between predictors and outcomes. In their classical formulation, these models assume that observations come from a single homogeneous population. However, in practice, unobserved characteristics may lead to distinct behaviors among observation subgroups. In such circumstances, we can employ regression mixture models to incorporate this heterogeneity, estimating not only the specific parameters of each mixture component (subgroup) but also the posterior probabilities of each observation belonging to each component - which can be used in classification and clustering contexts, in the framework of supervised and unsupervised learning, respectively. In this work, we study mixtures of partially linear models using P-splines for estimating the nonparametric components. Our configuration allows different linear and nonlinear covariates to composse the semiparametric structure of each group. The penalized maximum likelihood estimators were obtained through an EM-type algorithm, while standard errors were calculated via the empirical information matrix. For selecting the curve smoothing parameters and the number of groups, we used the Bayesian Information Criterion (BIC). The proposed methodology was evaluated through simulation studies and real data applications. Furthermore, in the application, the goodness-of-fit was verified by constructing simulated envelopes based on randomized quantile residuals. |
Palabras clave : | Misturas finitas Modelos parcialmente lineares P-splines Algoritmo EM Finite mixtures Partially linear models P-splines EM algorithm |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA |
Idioma: | por |
País: | Brasil |
Editorial : | Universidade Federal de Juiz de Fora (UFJF) |
Sigla de la Instituición: | UFJF |
Departamento: | ICE – Instituto de Ciências Exatas |
Clase de Acesso: | Acesso Aberto |
URI : | https://repositorio.ufjf.br/jspui/handle/ufjf/19618 |
Fecha de publicación : | 25-ago-2025 |
Aparece en las colecciones: | Estatística - TCC Graduação |
Los ítems de DSpace están protegidos por licencias Creative Commons, con todos los derechos reservados, a menos que se indique lo contrario.