Compartilhamento |
|
Use este identificador para citar ou linkar para este item:
https://bdtd.unifal-mg.edu.br:8443/handle/tede/1193
Tipo do documento: | Dissertação |
Título: | Nova formulação de ferramentas de estatística multivariada com incertezas experimentais |
Título(s) alternativo(s): | New formulation of multivariate statistical analysis with experimental errors |
Autor: | FLAUSINO, Farley Silva |
Primeiro orientador: | MELO, Cássius Anderson Miquele de |
Primeiro membro da banca: | VALDIVIESSO, Gustavo do Amaral |
Segundo membro da banca: | HELENE, Otaviano |
Resumo: | Quando se deseja analisar um conjunto de dados medidos, assumindo a aleatóriadade das medições, levando em conta os erros estatísticos e instrumentais envolvidos no processo, as incertezas experimentais exercem um papel fundamental nos resultados de algumas análises estatísticas. Entretanto, muitas ferramentas estatísticas não as levam em conta em seus cálculos e, por isso, este estudo tem como objetivo inseri-las nos cálculos das análises de Componentes Principais, Discriminante Linear de Fisher e de Correlação Canônica, bem como analisar o impacto no resultado final destas técnicas. Como as três análises têm em comum o fato de seus resultados estarem ligados à matriz de covariância dos dados, o procedimento metodológico deste estudo consistiu em utilizar a média ponderada das variáveis, por suas incertezas experimentais, para construir as matrizes de covariância. Já para propagar esses erros para os resultados das três análises, optou-se por utilizar um método numérico a la Monte Carlo, através de algoritmos desenvolvidos para gerar resultados aleatórios a partir da flutuação da média ponderada dos dados. A fim de demonstrar a aplicabilidade do novo modelo de componentes principais, foram refeitas as análises de componentes principais, das variáveis que caracterizam o meio interestelar difuso, realizadas porEnsor et al. (2017) e comparados os resultados com a abordagem tradicional que não leva em conta as incertezas experimentais. Este novo modelo de componentes principais propiciou uma forma alternativa de escolher o número de componentes a ser utilizado, através dos valores obtidos para as incertezas relativas às proporções explicativas acumuladas. Já para as outras duas análises foram realizadas simulações para avaliar a aplicabilidade do método em exemplos desenvolvidos pelo autor. A análise discriminante foi a única ferramenta que apresentou uma mudança na sua interpretação, fornecendo como resposta a probabilidade de novas observações pertencerem a cada um dos grupos e não uma classificação determinística. Já a análise de correlações canônicas permitiu uma avaliação dos dados mais próximo da realidade do experimento, uma vez que tanto as variáveis canônicas e vetores de transformação quanto as correlações canônicas, possuem incertezas. Portanto, pôde-se concluir que nas três análises a inserção das incertezas experimentais possibilitou ao pesquisador uma interpretação dos resultados mais condizente com a realidade do experimento, podendo evitar uma super ou subestimação de parâmetros na análise dos dados. |
Abstract: | When a researcher wants to analyze a set of data, assuming the randomness of the measurements, taking into account the statistical and instrumental errors involved in the process, experimental errors have a key role in the results of some statistical analysis. However, many statistical tools do not take them into account in their calculations and, therefore, this study proposes new formulations for the Principal Components, Fisher Linear Discriminant and Canonical Correlation analysis which take the experimental errors into account, and also proposes to evaluate the impact on the results of these new techniques. Since the three analysis have in common the fact that their results are tied to the data covariance matrix, the methodological procedure of this study consisted of using the weighted average of the variables by their experimental errors, in order to construct the covariance matrices. For purposes of propagating these errors to the results of the three analysis, it was chosen to use a numerical method similar to Monte Carlo, through algorithms developed to generate random results from the fluctuation of the data weighted average. In order to demonstrate the applicability of the new principal components model, it was reconstructed the principal components analysis of the variables for the diffuse interstellar band performed by Ensor et al. (2017) and the results were compared with the traditional approach that does not take into account the experimental errors. This new model of principal components provided an alternative way to choose the number of components to be used, through the values obtained for the relative errors concerning to the accumulated proportion of variance explained. For the other two analysis, simulations were performed to evaluate the applicability of the method in examples developed by the author. The discriminant analysis was the only technique that presented a change in its interpretation, providing as answer the probability of new observations belonging to each group and not a deterministic classification. The analysis of canonical correlations allowed for an evaluation of the data closer to the reality of the experiment, once both canonical variables and transformation vectors as well as canonical correlations have available now error bars. Therefore, it was possible to conclude that in the three analysis the insertion of the experimental errors enabled the researcher an interpretation of the results faithful to the real experiment, which may avoid a super or underestimation of parameters in the data analysis. |
Palavras-chave: | Incerteza experimental. Análise multivariada. Análise discriminante. Análise de componentes principais. Correlação canônica (Estatística). |
Área(s) do CNPq: | ESTATISTICA::ANALISE MULTIVARIADA |
Idioma: | por |
País: | Brasil |
Instituição: | Universidade Federal de Alfenas |
Sigla da instituição: | UNIFAL-MG |
Departamento: | Instituto de Ciência e Tecnologia |
Programa: | Programa de Pós-graduação em Física |
Citação: | FLAUSINO, Farley Silva. Nova formulação de ferramentas de estatística multivariada com incertezas experimentais. 2018. 110 f. Dissertação (Mestrado em Física) - Universidade Federal de Alfenas, Poços de Caldas, 2018. |
Tipo de acesso: | Acesso Aberto |
Endereço da licença: | http://creativecommons.org/licenses/by-nc-nd/4.0/ |
URI: | https://bdtd.unifal-mg.edu.br:8443/handle/tede/1193 |
Data de defesa: | 16-Mar-2018 |
Aparece nas coleções: | Mestrado |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Dissertação_FarleySilvaFlausino_2018_PPGF.pdf | Nova formulação de ferramentas de estatística multivariada com incertezas experimentais | 2,95 MB | Adobe PDF | Baixar/Abrir Pré-Visualizar |
Este item está licenciada sob uma Licença Creative Commons