Uncategorized

Momento R do Dia – preços livres e monitorados (a dica de hoje é sobre correlações…)

Lembra dos gráficos abaixo? Falávamos deles outro dia, no blog (faz a busca aí em cima depois). Eles mostram a correlação da variável do eixo vertical com a do eixo horizontal sendo que, no caso desta última, consideramos defasagens no tempo.

Por exemplo, no gráfico da primeira linha, segunda coluna da figura seguinte, vemos que a variação percentual do IPCA dos preços monitorados em “t” tem uma correlação de 0.25 com a variação percentual do IPCA dos preços livres em “t-1”. Ou seja, em termos de uma relação linear, os dados apontam para uma relação em torno de 1/4 das observações.

A mesma leitura pode ser feita para o restante desta e da outra figura.

monitorados_setembro monitorados_set

Entretanto, há uma questão relevante aqui. O fato de existir uma correlação não significa que ela seja estatisticamente diferente de zero, certo? Bem, então vamos ao momento R do dia. Hoje, usaremos o pacote psych que nos dá, de forma conveniente, tanto a correlação quanto o p-valor da mesma. Eis os comandos.

library("psych") # para as tabelas de testes de correlação

monitoradoslivres<-ts.intersect(monitorados, lag(monitorados,-1), lag(monitorados, -2),
                                lag(monitorados, -3), lag(monitorados,-4), lag(monitorados, -5),
                                lag(monitorados, -6), livres, lag(livres,-1),
                                lag(livres,-2), lag(livres,-3), lag(livres,-4),
                                lag(livres,-5), lag(livres,-6))
corr1<-corr.test(monitoradoslivres)
cor2latex(monitoradoslivres)

Repare que criei a interseção de 14 séries de tempo: a inflação dos preços livres, dos monitorados e as seis séries defasadas para cada uma delas. A partir daí, usei o comando corr.test para gerar as correlações e os p-valores. Como bônus, há também um comando para enviar a tabela de correlações para o LaTex. As correlações estão aqui (repare que nem editei o título da tabela):

correlation

Há, quando se compara a tabela com as figuras, diferenças que provavelmente são de arredondamento e/ou de correção no cálculo da correlação amostral. Meu palpite inicial é de que o autor da rotina que gera as figuras deve ter simplesmente reduzido o número de casas decimais na imagem sem arredondar. Não reproduzi estes comandos porque o leitor, com um pouco de esforço, vai encontrar, em textos anteriores deste blog, como gerar as figuras, ok?

Finalmente, mas sem muito ânimo para gerar tabelas formatadas (outro dia eu mostro isto), eis o resultado para os p-valores das correlações acima

Quanto aos p-valores, bem, você pode seguir o comando para obter uma tabela com os mesmos. Agora, bem, este eu não vou explicar como fazer (este eu não vou contar…quero ver você pesquisar), mas é uma boa forma de se visualizar as correlações. Sim, isso mesmo, é a matriz de correlação vista graficamente.

tchutchuca

O que você vê aí em cima são correlações mais ou menos intensas. Os que estão com “X” não foram significantes a 5%. Bonito, heim? Pois é. Deu trabalho.

Mas isso tudo começou hoje porque o meu amigo Ari me desafiou a fazer uma aplicação de correlações em R para ele. Posso descansar agora e deixar por conta de vocês? Então tá. Fui.

 

Anúncios