Otimalidade de Testes Monte Carlo

Ivair Ramos Silva

A operacionalização de um teste de hipóteses é condicionada ao conhecimento da distribuição de probabilidade da estatística de teste sob a hipótese nula H0. Caso não se conheça a distribuição da estatística de teste sob H0, sua distribuição assintótica pode ser usada para que a decisão sobre a rejeição ou não de H0 possa ser feita, o que exige o estudo dos tamanhos amostrais para os quais tal distribuição assintótica se verifica. Quando a distribuição assintótica também não pode ser deduzida analiticamente, métodos de reamostragem podem ser aplicados para a construção de um critério alternativo de decisão, tais como reamostragem Bootstrap, testes de permutação e simulação Monte Carlo (MC), sendo este último o objeto de estudo deste trabalho. Os testes de hipóteses montados pela utilização de simulações Monte Carlo podem ser divididos em dois tipos: os que se baseiam em um número m fixo de simulações, que é a estratégia convencional; e os procedimentos sequenciais, com os quais o número de simulações a serem geradas não é previamente fxado. Apesar de atualmente contarmos com recursos computacionais que favorecem o processamento de grandes bases de dados de forma extremamente veloz, ainda existem situações em que o tempo de processamento de uma estatística de teste é longo, o que motiva o desenvolvimento e utilização dos procedimentos sequenciais. Os aspectos que recebem forte atenção na literatura sobre testes MC são: a busca por procedimentos que apresentem reduzido tempo médio de simulação até que a decisão sobre H0 seja efetuada; a estipulação de cotas para a probabilidade da decisão quanto à rejeição de H0 ser diferente da que se tomaria com o teste exato (risco de reamostragem); a estimação do valor-p; e a estipulação de cotas para as possíveis perdas de poder do teste MC sequencial em relação ao teste MC convencional ou em relação ao respectivo teste exato. Usando certas suposições sobre a distribuição de probabilidade e a função poder associadas à estatística de teste, a literatura mostra que o poder do teste MC convencional é praticamente igual ao poder do teste exato. Um dos objetivos desta tese é demonstrar que é possível obter cotas para a diferença de poder entre o teste MC convencional e o teste exato que valem para qualquer estatística de teste, ou seja, a validade de tais cotas não depende de suposições além das necessárias à existência de um teste exato. Besag and Clifford (1991) propuseram um procedimento de teste MC sequencial que, sob H0, apresenta baixo tempo de execução. bjetivamos mostrar aqui como deve ser feita a escolha dos parâmetros de operacionalização deste procedimento sequencial. Primeiramente, mostramos como otimizar a escolha do número máximo de simulações sem afetar seu poder e, em seguida, demonstramos a forma de aplicar a regra de interrupção das simulações de modo a garantir um mesmo poder que o teste convencional. O procedimento sequencial de Besag and Clifford (1991) só apresenta redução no tempo de execução nos casos em que H0 é verdadeira. Com a principal finalidade de tornar o teste MC sequencial mais veloz que o MC convencional também quando a hipótese nula é falsa, procedimentos sequenciais alternativos tem sido propostos na literatura. O cálculo analítico exato do poder de tais procedimentos sequenciais, bem como do valor esperado do número de simulações, são intratáveis para o caso geral, pois envolve o conhecimento da distribuição de probabilidade do valor-p, que por sua vez depende de cada aplicação específica. Pelo uso de algumas restrições ao comportamento da distribuição de probabilidade do valor-p, alguns autores obtiveram cotas para o risco de reamostragem e para a esperança do número de simulações para procedimentos sequenciais para os quais, em cada tempo t de simulação, a regra de iinterrupção das simulações é dada por uma função linear em t. Nesta tese, construimos um procedimento sequencial que permite um formato geral para a regra de interrupção das simulações, o qual chamaremos de teste MC sequencial generalizado. Esta construção absorve as principais propostas apresentadas na literatura e permite um tratamento analítico do poder e do número esperado de simulações para uma estatística de teste qualquer. Isto é feito pela elaboração de cotas superiores para a perda de poder e para a esperança do número de simulações. Com base em conceitos desenvolvidos nesta tese, apresentamos a construção do procedimento ótimo em termos do número esperado de simulações. Nós também cotamos o risco de reamostragem dentro de uma extensa classe de distribuições de probabilidade para o valor-p.

Otimalidade de Testes Monte Carlo

AUTOR(ES)

FONTE

DATA DE PUBLICAÇÃO

RESUMO

ASSUNTO(S)

ACESSO AO ARTIGO

Documentos Relacionados