Repository logo
 

MTI - Actas de reuniões cientificas

Permanent URI for this collection

Browse

Recent Submissions

Now showing 1 - 5 of 5
  • Regressão linear com erros-nas-variáveis: Comparação dos estimadores de mínimos quadrados com os estimadores de 3 modelos de tipo II e de máxima verosimilhança
    Publication . Maroco, João
    Os modelos de regressão linear de tipo I, que consideram erros de medição e/ou variabilidade natural apenas na variável dependente, são frequentemente utiliza¬dos em investigação e modelação nas Ciências Exactas e nas Ciências Sociais. Apesar de, com frequência, quer a variável dependente quer as variáveis independentes serem medidas com erros e apresentarem variabilidade natural, os modelos de tipo II, que considerem este tipo de erros, são raramente utilizados. Neste estudo avaliou-se, via simulação de Monte-Carlo, a consistência e eficiência de três modelos de tipo II (Eixo Principal reduzido, Método robusto de Kendall, Método dos 3 grupos de Bartlett) e o Método da Máxima Verosimilhança com rácio de variâncias-dos-erros conhecido, comparativamente ao método de tipo I dos mínimos quadrados comuns. Quando a variável independente é medida com erro, as estimativas do declive obtidas pelo método dos mínimos quadrados são enviesadas para 0, e o mesmo enviesamento foi observado com os métodos de Kendall e de Bartlett. O método do eixo principal reduzido produziu estimativas centradas no parâmetro a estimar quando a variabilidade da variável inde¬pendente é da mesma magnitude da variabilidade da variável dependente. Contudo, este método produz sub- ou sobre estimativas do declive quando a variabilidade da var¬iável independente é, respectivamente, superior ou inferior à variabilidade da variável dependente. Finalmente, o método da máxima verosimilhança com racio de variâncias conhecido produz estimativas do declive erróneas para amostras de pequena dimen¬são, convergindo para os valores esperados de forma eficiente e consistente, quando as dimensões das amostras são superiores a 30. ------ ABSTRACT ------ Type I regression models that allow for measurement error in the criterion only are used ubiquitously in the exact and social sciences. Although, more often than not, the predictor variable is also affected by natural variability and measurement errors, type II or error-in-variables regression models that account for these errors are seldom used. This is due in part to a lack of knowledge on the consistency and efficiency of type II estimators. In this paper, I present Monte-Carlo simulations, to study the consistency and efficiency of 3 type II linear regression models (Bartletts 3 group method; Reduced Principal Axis and Kendall Robust method) as compared with max-imum likelihood with errors-variance ratio known, and ordinary least squares. When only the criterion variable is affected by measurement errors, the methods evaluated, with the exception of the Reduced Principal Axis, gave consistent estimates with OLS showing the highest efficiency. When errors in the predictor are as large as the errors in the criterion, only the Reduced Principal Axis and the Maximum Likelihood methods produced consistent and efíicient estimates for the slope and the intercept. The other methods produced estimates for the slope biased towards 0. Finally, when the errors in the predictor were larger than the errors in the criterion (in this study, twice as large), only Maximum likelihood produced consistent estimates for large sample sizes (30 or more). The Reduced principal axis produced under- or over-estimates of the true positive slope when the errors in the predictors were larger or smaller, respectively, than the errors in the criterion. If the slope being estimated was negative, than one obtains over- and underestimates whenever the errors in X were larger or smailer than errors in Y respectively. For smaller sample sizes, Maximum Likelihood behaved erroneously, with large variance.
  • Consistency and efficiency of ordinary least squares, maximum likelihood, and three type II linear regression models: A Monte-Carlo simulation study
    Publication . Maroco, João
    Type I linear regression models, which allow for measurement errors only in the criterion variable, are frequently used in modeling research in psychology and the social sciences. Although there are frequently measurement errors and large natural variation both in the criterion and predictor variables, type II regression methods that account for these errors are seldom used in these fields of study. The consistency and efficiency of three type II regression methods (reduced major axis, Kendall’s robust line-fit and Bartlett’s three-group) were evaluated in comparison to ordinary least squares (OLS) and the maximum likelihood with known variance ratio used frequently in biometrics and econometrics. When predictors are measured with error, OLS slope estimates are biased toward zero, and the same bias was observed with both Kendall’s and Bartlett’s methods. Reduced major axis produced consistent estimates even for small sample sizes, whenever the measurement errors in X are similar in magnitude to measurement errors in Y, but there was a consistent bias when the measurement error in X was smaller/greater than in Y. Maximum likelihood estimates behaved erroneously for small sample sizes, but for larger sample sizes they converged to the expected values.
  • Integração do R nos menus do PASW Statistics: Um exemplo de aplicação com o package 'polycor' do R
    Publication . Maroco, João
    O Coeficiente de correlação policórica tem, recentemente, vindo a ter utilização crescente na estimação da associação entre variáveis de natureza ordinal (e.g. níveis sócio-económicos; severidade de diagnóstico médico; itens de tipo Likert em escalas psicométricas, etc...). Contudo, este tipo de correlação não está ainda disponível nos principais softwares user-friendly de análise estatística, nomeadamente no PASW Statistics (até à v. 18, inclusive). Neste artigo será apresentado o coeficiente de correlação policórica, a sua implementação no package „Polycor‟ do sistema R e a sua integração nos menus do PASW Statistics por recurso ao „PASW Custom Dialog Builder‟. Este aplicativo permite disponibilizar as bibliotecas do R nos menus do PASW, libertando assim o utilizador final da necessidade de dominar a programação em R.
  • Prediction of dementia patients: A comparative approach using parametric vs. non parametric classifiers
    Publication . Maroco, João; Silva, Dina Lúcia Gomes da; Guerreiro, Manuela; Mendonça, Alexandre de; Santana, Isabel
    In this paper, we report a comparison study of 7 non parametric classifiers (Multilayer perceptron Neural Networks, Radial Basis Function Neural Networks, SupportVectorMachines, CART, CHAID and QUEST Classification trees and Random Forests) as compared to Linear Discriminant Analysis, Quadratic Discriminant Analysis and Logistic Regression tested in a real data application of mild cognitive impaired elderly patients conversion to dementia. When classification results are compared both on overall accuracy, specificity and sensitivity, Linear Discriminant Analysis and Random Forests rank first among all the classifiers.
  • Escala de Atitudes em relação à Estatística: Estudo de validação.
    Publication . Campos, Juliana Alvares Duarte Bonini; Dovigo, Lívia Nordi; Bonafé, Fernanda Salloumé Sampaio; Maroco, João
    O objetivo do estudo foi estimar a confiabilidade e a validade da Escala de atitudes em relação à Estatística (EAE). A amostra, composta por 355 alunos do curso de Ciências Farmacêuticas, foi subdividida em 2 partes iguais: a primeira foi utilizada para explorar a estrutura fatorial da EAE e a segunda para confirmá-la. A Escala foi aplicada a 40 alunos em dois momentos distintos para verificar sua reprodutibilidade. Aplicou-se o Teste de esfericidade de Bartlett e o índice Kaiser-Meyer-Olkin (KMO). A extração dos fatores foi realizada pela Análise de Componentes Principais. Realizou-se rotação ortogonal Varimax. Foram calculados o Coeficiente alfa de Cronbach e o Coeficiente de Correlação Intraclasse. Para verificar o grau com que as dimensões satisfazem a estrutura esperada realizou-se análise fatorial confirmatória. O teste de esfericidade de Bartlett e o índice KMO foram excelentes (χ2= 2057,973, p=0,000; KMO=0,929). A maior parte dos itens apresentou fração de variância explicada pelos fatores comuns superiores a 0,50. Na distribuição dos itens verificou-se dois fatores com autovalores acima de 1 (λ=9,099; λ =2,789) explicando 59,44% da variância total. A questão 2 saturou-se em mais que um fator. Observou-se excelente consistência interna e reprodutibilidade da EAE. Todos os itens da escala apresentaram pesos fatoriais (λ ≥0,5) e de confiabilidade individuais adequados (R2≥0,25) e o modelo fatorial apresentou índices de qualidade de ajustamento bons (χ2/df=1,909, CFI=0,923, GFI=0,837, RMSEA: 0,075) com adequada validade convergente (VEMj≥0,5; CCj≥0,7) e discriminante (VMEi e VMEj≥ρij2). A Escala de atitudes em relação à Estatística apresenta estrutura bidimensional com níveis de validade e confiabilidade adequados.