Compartilhamento |
|
Use este identificador para citar ou linkar para este item:
https://bdtd.unifal-mg.edu.br:8443/handle/tede/1419
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.creator | PALA, Luiz Otávio de Oliveira | - |
dc.contributor.advisor1 | FERREIRA, Eric Batista | - |
dc.contributor.advisor-co1 | GOMES, Davi Butturi | - |
dc.contributor.referee1 | PEREIRA, Gislene Araújo | - |
dc.contributor.referee2 | SILVA, Washington Santos da | - |
dc.contributor.referee3 | PASCOA, Marcelino Alves Rosa de | - |
dc.date.accessioned | 2019-09-20T19:28:42Z | - |
dc.date.issued | 2019-09-06 | - |
dc.identifier.citation | PALA, Luiz Otávio de Oliveira. Revisitando a estimação de coeficiente de determinação. 2019. 112 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Alfenas, Alfenas, MG, 2019. | por |
dc.identifier.uri | https://bdtd.unifal-mg.edu.br:8443/handle/tede/1419 | - |
dc.description.resumo | O coeficiente de determinação (R2) é uma métrica muito utilizada para a análise de qualidade de ajuste de modelos lineares. Este coeficiente assume valores no intervalo entre 0 e 1, de modo que quanto mais próximo de 1, maior parte da variação da variável resposta está sendo explicada pelo modelo. Há outras métricas com o mesmo objetivo, como o coeficiente de determinação ajustado, o erro absoluto e erro quadrático médio, por exemplo. Mesmo sendo muito utilizado, o R2 é tratado com cautela na literatura, pois este pode ser viesado em modelos com poucas observações ou inflacionado quando se acrescentam covariáveis ao modelo. Neste sentido, autores sugerem tratá-lo como uma estatística que estima um parâmetro populacional ( 2), sendo este entendido como a qualidade de ajuste que um modelo possuiria se as infinitas observações do fenômeno viessem a ser coletadas. Desta forma, sendo 2 um parâmetro e R2 um estimador pontual, é natural pensar em estimação intervalar e testes de hipóteses para possibilitar a tomada de decisão sobre a adequação do modelo candidato ao fenômeno no qual deseja-se descrever. Entretanto, essa questão inferencial ainda não é considerada fechada na literatura, pois autores discutem distribuições de probabilidade para a modelagem deste em diferentes cenários e regiões do espaço paramétrico. Desta forma, este trabalho estudou a estimação do coeficiente de determinação paramétrico ( 2) a partir de cinco estimadores intervalares paramétricos. Para compará-los, foi realizado um estudo de simulação Monte Carlo, computando precisão e acurácia em diferentes cenários compostos pela combinação do número de covariáveis do modelo (k), tamanho amostral (n) e o verdadeiro valor paramétrico ( 2). Em conjunto a isso, elaborouse um índice de desempenho de estimação intervalar que valoriza simultaneamente precisão e acurácia com importâncias relativas previamente fixadas. Os resultados permitiram a recomendação do melhor estimador para cada região do espaço paramétrico. Com isso, verificou-se que os estimadores propostos apresentaram qualidade similar aos indicados na literatura ao longo do espaço paramétrico. Por fim, foi construído um pacote R, possibilitando que o usuário estime de forma intervalar a qualidade do ajuste utilizando o estimador com melhor desempenho. | por |
dc.description.abstract | The coefficient of determination (R2) is a widely used metric to analyze the quality of adjustment of linear models. This coefficient assumes values in the range between 0 and 1, so that the closer to 1, most of the capacity variation is being explained by the model. R2 is treated with caution in the literature, as it can be biased in models with few observations or inflated when covariates are added to the model. In this sense, authors suggest treating it as a statistic that estimates a population parameter ( 2), which is understood as the quality of fit that a model would have if the infinite observations of the phenomenon were to be collected. Thus, we study the estimation of the parametric coefficient of determination ( 2) from five parametric interval estimators. For comparison, a Monte Carlo simulation study was performed, computing precision and accuracy in the different combinations to model the number of model variables (k), sample size (n) and the value of the parameter ( 2). The results allowed the recommendation of the best estimator for each region of the parametric space. Thus, it was found that the proposed estimators presented similar quality to those indicated in the literature in the parametric space. Finally, an R package was built, allowing the user to estimate the quality of the model using the best performing estimator. | eng |
dc.description.provenance | Submitted by Marlom César da Silva (marlom.silva@unifal-mg.edu.br) on 2019-09-20T19:27:32Z No. of bitstreams: 2 Dissertação de Luiz Otávio de Oliveira Pala.pdf: 3367699 bytes, checksum: 1329671f744993dd24088e6f2d279057 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) | eng |
dc.description.provenance | Approved for entry into archive by Marlom César da Silva (marlom.silva@unifal-mg.edu.br) on 2019-09-20T19:28:09Z (GMT) No. of bitstreams: 2 Dissertação de Luiz Otávio de Oliveira Pala.pdf: 3367699 bytes, checksum: 1329671f744993dd24088e6f2d279057 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) | eng |
dc.description.provenance | Approved for entry into archive by Marlom César da Silva (marlom.silva@unifal-mg.edu.br) on 2019-09-20T19:28:20Z (GMT) No. of bitstreams: 2 Dissertação de Luiz Otávio de Oliveira Pala.pdf: 3367699 bytes, checksum: 1329671f744993dd24088e6f2d279057 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) | eng |
dc.description.provenance | Made available in DSpace on 2019-09-20T19:28:42Z (GMT). No. of bitstreams: 2 Dissertação de Luiz Otávio de Oliveira Pala.pdf: 3367699 bytes, checksum: 1329671f744993dd24088e6f2d279057 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2019-09-06 | eng |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES | por |
dc.format | application/pdf | * |
dc.language | por | por |
dc.publisher | Universidade Federal de Alfenas | por |
dc.publisher.department | Instituto de Ciências Exatas | por |
dc.publisher.country | Brasil | por |
dc.publisher.initials | UNIFAL-MG | por |
dc.publisher.program | Programa de Pós-Graduação em Estatística Aplicada e Biometria | por |
dc.rights | Acesso Aberto | por |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | - |
dc.subject | Intervalos de Confiança | por |
dc.subject | Estatística como Assunto | por |
dc.subject | Método de Monte Carlo | por |
dc.subject.cnpq | PROBABILIDADE E ESTATISTICA::PROBABILIDADE E ESTATISTICA APLICADAS | por |
dc.title | Revisitando a estimação de coeficiente de determinação | por |
dc.type | Dissertação | por |
Aparece nas coleções: | Mestrado |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Dissertação de Luiz Otávio de Oliveira Pala.pdf | 3,29 MB | Adobe PDF | Baixar/Abrir Pré-Visualizar |
Este item está licenciada sob uma Licença Creative Commons