Momento R do Dia – Ainda o aborto na Wikipedia

Lembra do que falei há uns dois ou três posts atrás (na verdade, aqui)? Pois é. Eu estava em busca de um jeito de transformar os dados diários em mensais para ver a sazonalidade das consultas ao verbete “Aborto” citado. Tá, eu sei que talvez esta agregação não seja a melhor, mas, ei, é um exercício de R, né?

Mas, vamos lá: que inferno este negócio de mudar a frequência dos dados, não é não? Não sei você, mas acho isso bem chato. Para minha sorte, veja só, não é que descobri uma função simples e ótima para isto?

Ela está no pacote hydroTSM e se chama daily2monthly. Conferi e funcionou direitinho. Só para você entender, eu havia transferido os dados diários do R para o Excel. Pois, após importá-los para o R novamente, eu apliquei facilmente a função e pedi que a agregação me desse a soma mensal. Fácil.

library(zoo)
base <- read.zoo("C:/Users/cdshi_000/Documents/Meus Documentos/Meus Documentos/aborto1.csv",header=TRUE,sep=",",format = "%m/%d/%Y")
head(base)
summary(base)
plot(base, main="Pageviews do artigo 'Aborto' na Wikipedia em língua portuguesa", ylab="Aborto", xlab="dias")

# Aqui vem a parte legal!
library(hydroTSM)
## Daily to monthly
m <- daily2monthly(base, FUN=sum, na.rm=TRUE)
head(m)
m
plot(m)

# para buscar o padrão sazonal...

library(forecast)
monthplot(m)

Olha aí o dito cujo.
abortosazonal

Interessante, não? Digo, além do fato de termos encontrado um jeito fácil de calcular as somas mensais, ainda conseguimos verificar uma clara mudança no padrão da média mensal das consultas ao verbete “Aborto” da Wikipedia (em língua portuguesa, claro).

Não, não sei se há algum sentido nesta aparente sazonalidade, mas, quem sabe? Comentários são bem-vindos.

Ainda o Numerário (continuação)

Só para brincar com os dados, peguei uma das rendas nominais do IBGE. Seguindo a lógica do texto anterior – mas limitando a amostra (por conta da série de rendimento nominal, que começa em 2002) para 2002.02 – 2014.12 – obtemos os seguintes gráficos (para preços de boate e motel, só para exemplificar).

boate

motel

Então, explicando: eu gerei a série dividindo o valor do rendimento médio nominal (R$) pelo índice de preços do item que pesquisei (lembre-se do post anterior). Assim, vemos que a vida do brasileiro medido na amostragem do IBGE, grosso modo, melhorou em termos do poder real de compra para estas opções de lazer.

Mas, espere aí!!

Entretanto, está claro que ambas as séries possuem dois aspectos marcantes: tendência e sazonalidade. Obviamente, o efeito que aprendemos em Microeconomia não está sozinho nesta história. Não aprendemos, na teoria microeconômica (básica, de graduação, e mesmo na avançada, exceto em cursos bem específicos, creio) a lidar com variações de preços relativos que não estejam limpas de efeitos de mudanças na média (a tal tendência) e sazonais (que são específicos).

Por isso, prezados, é que a galera adora ver gráficos de taxas de variações, já descontadas de impactos sazonais. Assim podemos identificar rapidamente o efeito teórico (supondo, claro, que não ocorram mais outros efeitos não previstos pelo nosso modelo básico) nos dados. Só de curiosidade, então, as fórmulas, no R, para construir as variáveis:

renda_real_motel<-((rend_nominal)/(1+motel/100))
renda_real_boate<-((rend_nominal)/(1+boate/100))

E, finalmente, vamos fazer o seguinte para tirar a tendência (há vários métodos): vou calcular a taxa de variação da variável e depois vou aplicar um destes métodos simples de dessazonalização. Aí podemos nos voltar para o gráfico. Façamos apenas com o rendimento real em termos do preço da boate.

drenda_real_boate<-diff(log(renda_real_boate))

sazon<-decompose(drenda_real_boate)

plot(drenda_real_boate-sazon$seasonal)

renda_sem_sazonal_correto

A diferença dos logaritmos, como sabemos, é uma aproximação da taxa de variação de uma variável (e se você multiplicar por 100% terá a variação percentual, ok?). Sobre esta série apliquei um método simples de decomposição (um que citei no blog do Nepom, acho) e, assim, obtive o gráfico acima tirando da variação da renda real em termos do preço da boate seu efeito sazonal.

Agora, veja, você pode fazer a mesma coisa com os outros dados e, aí, eu diria, poderá comparar a diferença que um ou outro numerário faz na análise. Neste breve texto, o que fizemos foi ver a renda média real em termos do preço da boate. Quem quiser brincar mais com os dados, recomendo replicar o exercício com outros sub-índices do IPCA, só para pegar o jeito da coisa, ok?

Avançando mais…

Para os leitores mais familiarizados com a função de autocorrelação, fica aqui o gráfico da mesma.

acf_pre

Não vou discutir muito este gráfico, mas ele certamente poderá suscitar comentários dos leitores.

A sazonalidade como choque de produtividade

É, eu sei. Você já ouviu aquele papo econométrico sobre ciclos reais e raízes unitárias. Não é uma conversa fácil, pois técnica. Mas vamos ilustrar o choque de produtividade usando a história. Em particular, alguns trechos do The Rational Optimist (P.S.) do Matt Ridley.

Primeiro, o bom e velho camelo.

Thanks to a newly perfected technology, the camel, the people of the Arabian Peninsula found themselves well placed to profit from trade between East and West. The camel caravans of Arabia were the source of the wealth that carried Muhammad and his followers to power. The camel had been domesticated several thousand years earlier, but it was in the early centuries AD that it was at last made into a reliable beast of burden. It could carry far more than a donkey could, go to places a wheeled bullock cart could not, and because it could find its own forage en route, its fuel costs were essentially zero – like a sailing ship.

Sensacional, não? O camelo foi um fator de produção importante em uma época em que conflito e comércio eram muito frequentes na história. Camelo também é choque real, cara!
Quanto à sazonalidade, muitos livros de Estatística dão uma definição (ou várias) bem técnicas e alguns de nós, professores, falamos de exemplos relacionados a preços da arroba do boi gordo ou épocas de colheita. Mas o que dizer da sazonalidade como um choque de produtividade? Aí vai o outro trecho:
Thanks to the discovery of the monsoon, which reliably blew ships eastward in summer and back westward in winter, the journey across the Arabian Sea was cut from years to months.
Pois é, gente. Eu não acredito que eram os deuses astronautas. Pode até ser que alguém, um dia, consiga encontrar evidências disto, mas eu aposto que não. A genialidade humana não deve ser menosprezada (lembra do meu papo, há uns dias atrás, sobre Julian Simon?).
Estamos muito (mal) acostumados a pensar na sazonalidade como um fator aditivo que, em um estudo de ciclos econômicos, deve ser modelada (ou extirpada, em exercícios simples) para que possamos detectar o “sinal” e não o ruído (um problema que Lucas, inteligentemente, importou para a Ciência Econômica).
Mas veja o exemplo acima. Como é que alguém teve a idéia de usar a sazonalidade das monções? Provavelmente, claro, alguém queria maximizar seus ganhos e descobriu esta simples característica da natureza com potencial para economizar custos. Aliás, esta questão da navegação na história é um tópico que não é estranho aos da área de História Econômica, basta ver o antigo artigo do Douglass North sobre o tema.
Então, veja, existem sazonalidades que nos chegam por conta da natureza. Nem todas são usadas a nosso favor. Algumas economias lutam para controlarem os ciclos naturais de alguns produtos. Outras sociedades já aproveitaram a sazonalidade a seu favor, como no exemplo acima.
O pesquisador, entretanto, geralmente segue o seguinte lema: “vamos filtrar as séries e/ou modelar a sazonalidade. O que sobrar é nosso produto cujos ciclos reais vou estudar”.
Agora, na perspectiva deste meu exemplo, a sazonalidade em si merece um estudo do tipo “sinal-ruído” porque parte dela pode ser devido aos choques de produtividade como no caso do transporte marítimo dos árabes em nosso passado distante. Não creio que estou falando nenhuma novidade e sabemos que há quem goste de falar de raízes unitárias sazonais. Provavelmente alguém já disse algo parecido (gentileza me enviar referências nos comentários). Mas, não sei. Usando camelos como exemplo, isto nunca me ocorreu.

Recessão? O IBC-Br

PaperArtist_2014-02-15_09-43-20O que vem a ser o IBC-Br? Diz o Estadão:

Chamado de ‘PIB do BC’ e considerado um termômetro para o resultado do Produto Interno Bruto (PIB), o Índice de Atividade Econômica do Banco Central (IBC-Br), divulgado nesta sexta-feira, 14, aponta para um crescimento de 2,52% da economia brasileira em 2013.

Ele é chamado de ‘PIB do BC’ porque, supostamente, tem uma forte aderência com o PIB. Isto é verdade? O Vitor Wilher mostrou que evidências de que, sim, é (neste post).

Para saber o que é o IBC-Br, bem, a gente vai até a fonte. Eis a definição:

Índice de Atividade Econômica do Banco Central – Brasil. Desde 2010, retroagindo a janeiro de 2003, o BC divulga o IBC-Br. Esse índice, de periodicidade mensal, é uma medida antecedente da evolução da atividade econômica. Incorpora estimativas para a agropecuária, a indústria e o setor de serviços, assim como os impostos sobre os produtos. É, portanto, um indicador que incorpora a trajetória de variáveis consideradas como proxies (medidas aproximadas de outras) para o desempenho dos três principais setores da economia.

Ninguém sabe exatamente porque o índice parou em 2003, se por motivos políticos ou técnicos (metodologia de cálculo aqui, ainda que pouco detalhada). Vamos dar uma olhada na série sem aplicação de métodos de dessazonalização (para facilitar a visualização, dividi em dois períodos a amostra, só para os movimentos da série ficarem mais óbvios).

IBC_Br1

O leitor pode observar que o índice tem uma suave tendência de crescimento desde o início da série, além de movimentos sazonais bem marcados. As causas destes movimentos sazonais, claro, devem ser buscadas nas séries que compõem o indicador (olhe lá na metodologia).

Uma série sazonal?

Para aqueles mais aficcionados da Econometria, eis como fica a série quando lhe aplicamos um filtro de decomposição para separar, especificamente o efeito sazonal.

exemplo_sazonal

Você percebe que a série dessazonalizada é mais “suave” do que a série original (em azul), não? Obviamente, eu não apliquei o mesmo método de dessazonalização do pessoal do Banco Central (um X-12, se entendi corretamente a nota de rodapé do texto explicativo), mas dá para se ter uma idéia de para onde vai a série, não?

Mesmo usando um método de dessazonalização diferente, podemos ver que o mesmo faz efeito. Por exemplo, considere o gráfico das médias mensais que já usamos em outros posts.

ibc_br_sazonal

No primeiro gráfico temos a série original e, no segundo, a série dessazonalizada. Percebe-se que o efeito sazonal na média diminuiu consideravelmente. Isso mostra porque analistas gostam de divulgar séries dessazonalizadas: eles têm um problema a menos para explicar que são os ciclos sazonais.

Alguns pontos para se lembrar (se você gosta de detalhes)

Pois é. Agora, vamos nos ater a uma questão que o Vitor citou no seu post (citado acima). Ele se perguntou o que acontecia com a relação entre o IBC-Br e o PIB. Bem, ele tem, na verdade, dois problemas. O primeiro pertence à literatura dos chamados indicadores antecedentes. Ele quer saber, por exemplo, se uma série antecipa os movimentos da outra. Esta é uma questão.

Mas ele tem um segundo problema: como comparar dados em frequências distintas? Afinal, o PIB é trimestral e o IBC-Br é mensal, certo? Neste caso, você não pode comparar as séries. Claro que alguém pode querer fazer como aprendeu lá no 1o ano da faculdade e calcular uma média móvel. Não está errado, mas não é a única forma. Por exemplo, neste texto, você encontra dicas de como fazer para converter dados trimestrais em mensais (algo mais aqui e aqui). Ah sim, e é bom lembrar que é melhor não criar pseudo-ciclos com a conversão (não me lembro onde li isto, mas algo me diz que não estou errado). De qualquer forma, esta história de mudar a frequência de uma série pode ser tão complicada quanto se queira.

Aos que gostam de análise de regressão, eu já não recomendo que se faça uma regressão destes dados com a PIM-PF, por exemplo. Afinal, o IBC-BR já é construído a partir da PIM-PF e, portanto, a regressão não vai dizer muita coisa. Muito mais razoável é pensar em ambas como proxies uma da outra. Na verdade, o pessoal, em geral, usa o IBC-BR como proxy do PIB como explicado pelo Vitor e pelo pessoal do Banco Central.

Recessão? 

Não sei se vamos para uma recessão e nem vou fazer um ajuste de um modelo ARIMA aqui. Mas sei que, quando eu disse ao pessoal do Nepom que eu queria de algum deles um comentário sobre o IBC-Br, eu tinha em mente algo similar ao que fiz neste breve texto.

Para se analisar a questão da recessão, creio, o melhor é conjugar a análise destes dados com outras séries importantes. Acho que o pessoal do Nepom vai mostrar um pouco deste tipo de trabalho na próxima apresentação (sim, é aberta ao público), dia 25 de Fevereiro, lá na faculdade. Geralmente começa às 16:00 horas.

Consumo e Renda no Japão (2004-2010) – outra discussão de Econometria Aplicada

Vamos falar de consumo e renda hoje. Aliás, vamos falar de função consumo. Vamos aproveitar a boa vontade do Statistics Bureau do governo japonês e aproveitar a oportunidade para fazer uma reflexão sobre a mais famosa das funções em Ciências Econômicas desde Keynes: a função consumo. Para os aficcionados do gênero, nada mais importa na vida se você não observar esta coisinha aqui: Ct = a + bYt + εt, no qual nosso último termo é o famoso erro aleatório lá dos livros de Econometria.

Então segura que vem mais Econometria!

Os dados, da tabela 20-6, são referentes aos gastos e renda das famílias (Average of Monthly Income and Expenditures per Household (Workers’ Households) de todo o país. A série só é contínua (dados mensais) a partir de 2004. Assim, nossa análise se inicia neste ano. Antes de mais nada, vejamos o gráfico de nossas séries (trabalharei com apenas duas delas).

japao_consumo_Familias

Nada como uma economia estagnada, não? Sem muito rigor, percebe-se que as séries todas giram em torno das respectivas médias que, por sinal, parecem relativamente constantes (alguém diria: a série parece ser estacionária). A economia japonesa, aliás, está estagnada? Julgue você mesmo pelo gráfico abaixo (gerado com os dados do FED).

Embora os dados sejam distintos, dá para se ter uma idéia de como a vida de uma família mediana tem sofrido em termos de consumo. Não daria mesmo para esperar uma renda média crescente ao longo do tempo. Eis aí um aspecto qualitativo da estacionariedade de uma série: ninguém gosta de renda estacionária, mas sim de renda com tendência de aumento. Enfim, vamos em frente.

Olha a sazonalidade….será?

Os dados aparentam ter algum aspecto sazonal? É difícil ver pelos seis gráficos anteriores. Então, novamente, façamos uso do bom e velho gráfico da sazonalidade, intuitivo e simples. Neste post farei uso de duas das variáveis acima: gastos em consumo e salários. Eis os gráficos pertinentes.

wage_sazonal cons_sazonal

A evidência de que há sazonalidade parece ser justificada (alguém poderia querer usar os famosos gráficos das funções de autocorrelação e autocorrelação parcial e, creio, é uma boa idéia).

Então veio a hora: vamos ver a função consumo? Consumo em função da renda. A teoria me diz que devo considerar apenas as duas variáveis, mas minha análise dos dados da amostra me diz que devo olhar para a sazonalidade. Uma forma simplificada – e nem sempre correta – de analisar a sazonalidade é usar dummies sazonais. Bem, no quadro abaixo, a coluna (2) nos dá os resultados da regressão linear incluindo as dummies.

sazonalidade_e_tendencia_fazem_falta

Bom, eu sei que há várias observações – e não me refiro ao número de observações da amostra – a serem feitas aqui. Primeiro, para os que adoram um R ao quadrado, bem, reparem como a sazonalidade não pode ser desprezada. A regressão sem as dummies sazonais tem um R ao quadrado bem baixo (ajustado por graus de liberdade ou não).

Mas este ajuste não nos diz muita coisa se os resíduos da regressão não se aproximarem de algumas hipóteses, uma delas, a de normalidade. Abaixo, vemos como os resíduos das duas regressões se comportam com respeito a uma distribuição Normal teórica (os famosos gráficos Q-Q).

residuos_r

residuos_r2

Pode não ser a distribuição mais normal do mundo, não é? Em termos de autocorrelação dos resíduos, sob a hipótese nula de que a mesma é de primeira ordem, aplicando um teste de Breusch-Godfrey, obtemos um resultado que diferencia mais ainda as duas regressões. No primeiro caso, temos uma alta probabilidade de se rejeitar esta hipótese, ao contrário da segunda regressão (a que inclui as dummies sazonais).

Então, à primeira vista, parece haver um trade-off entre os modelos. No primeiro caso, não se consegue captar os efeitos sazonais com exatidão. No segundo, temos um padrão de autocorrelação que não deveria estar nos resíduos. Você pode visualizar isto nas funções de autocorrelação dos resíduos das respectivas regressões. Eles estão a seguir.

acf_residinicial

acf_resid2

Viu só como estas coisas não são assim tão simples? Veja só o aspecto da sazonalidade. Uma coisa que fizemos foi supor que ela é aditiva. Cada efeito mensal se soma ao anterior. Entretanto, ela não precisa ser assim, como nos ensinam lá nas aulas sobre modelos ARIMA com sazonalidade (SARIMA).

Então, uma opção seria estimar uma espécie de função consumo dentro deste arcabouço (as chamadas funções de transferência). De certa forma, isto equivale a estimar um modelo autoregressivo com defasagens distribuídas (ADL). Para mais detalhes, veja o que se diz aqui: um modelo ADL com uma suposta estrutura racional para as defasagens equivaleria a uma função de transferência. Caso você não queira detalhes técnicos, apenas imagine que estou, pragmaticamente, tentando captar a autoregressão incluindo-a como uma variável defasada na minha equação estimada (2) da tabela acima.

Fazendo isto, obtenho uma nova função consumo e os erros parecem não possuir autocorrelação de primeira ordem. A regressão é esta:

consumo_japao_com_ar

Repare que, neste modelo, a propensão marginal a consumir no longo prazo é bem baixa (0.167/(1-0.408)) = 0.28. Assim, um aumento de 1 Yen no salário geraria um aumento de consumo de 0.28 centavos de Yen.

A volta da prática para a teoria…e vice-versa

Ok, estimamos a função e, pensando apenas no problema de auto-correlação, incluímos a variável dependente defasada. O leitor mais chegado na teoria vai me perguntar: mas e agora? Isto aí “representa” alguma teoria sobre o consumo?

Para nossa sorte, sim. Esta função consumo pode ser encarada como a contrapartida empírica do modelo da função consumo sujeito à existência de hábito (inércia no consumo). Charemza & Deadman (2002) mostram que este modelo é derivado a partir da seguinte estrutura:

Cdt = a + bYt

Ct – Ct-1 = (1-γ)(Cdt – Ct-1) + ut

Cd é o consumo desejado, ut é um erro aleatório e, claro, 0 < γ <1 é um parâmetro que ilustra o “hábito”. Em outras palavras, a variação do consumo é uma função da diferença do consumo desejado e do consumo efetivo passado sujeito, obviamente, a um erro aleatório aditivo.

Quando você resolve este sistema – você tem que fazer isto para fazer com que a variável não-observável, Cd, desapareça (por que? Porque você não tem dados da mesma para estimar) – você encontra a seguinte função consumo:

Ct = (1- γ)a + γCt-1 + (1- γ)bYt + ut.

Não é preciso pensar muito para ver que a inclusão das dummies sazonais apenas controlam o efeito da sazonalidade e nossos parâmetros seriam:

(1- γ)a = 45.217

γ = 0.408

(1- γ)b = 0.167

Logo, a = 76.38 e b = 0.28. Note que a propensão marginal a consumir, no curto prazo, não é tão diferente daquela de nossa equação (2). Também observe que só conseguimos obter os parâmetros estruturais porque estimamos a sua forma reduzida (em português: estimamos a forma reduzida da função consumo algebricamente obtida a partir das duas equações estruturais deste modelo e, com os parâmetros estimados desta forma, conseguimos obter os parâmetros da forma estrutural).

Aliás, um modelo estrutural bem maior e mais complicado, para a economia japonesa é este.

Bom, mas o que dizer de nossos resultados? Longe de mim reinvindicar algo além de um exercício para discussão de econometria aplicada. Mas considere este texto para discussão Carroll (2000), em sua versão preliminar, no mesmo ano, no NBER. Digo, considere o resumo.

‘Risky Habits’ and the Marginal Propensity to Consume Out of Permanent Income, or, How Much Would a Permanent Tax Cut Boost Japanese Consumption?
Christopher D. Carroll
NBER Working Paper No. 7839
Issued in August 2000
NBER Program(s): ME PE
Papers in variety of disparate literatures have recently suggested that habit formation in consumption may explain several empirical puzzles, ranging from the level and cyclical variability of the equity premium (Abel (1990,1999); Constantinides (1990); Jermann (1998); Campbell and Cochrane (1999)) to the excess smoothness’ of aggregate consumption (Fuhrer (2000)) to the apparent fact that increases in economic growth cause subsequent increases in aggregate saving rates (Carroll and Weil (1994); Bosworth (1993); Attanasio, Picci, and Scorcu (2000); Rodrik (1999); Loayza, Schmidt-Hebbel, and Serv‚n (2000)). This paper examines an implication of these models that has mostly been overlooked: Habits strong enough to solve these puzzles imply an immediate marginal propensity to consume out of permanent shocks of much less than one. When the model is calibrated to roughly match the rise in the Japanese saving rate over the postwar period, it implies that the immediate MPC out of permanent tax cuts may be as low as 30 percent, suggesting that calls for permanent income tax cut as a quick means of stimulating aggregate demand in Japan may be misguided.

Ou seja, o autor diz que a propensão marginal a consumir em modelos com “hábito”, neste caso, pode ser bem baixa e ainda faz uma ligação muito simples e interessante com o que falo sobre mudanças permanentes e temporárias nas aulas de Análise Macroeconômica IV.

Coincidência ou não, nosso exercício também nos deu uma propensão marginal a consumir baixa. Legal, não? Torço sempre para que estas coisas não sejam coincidências…

Tá, e agora?

Agora o negócio é trabalhar. Bom, para quem é novo por aqui, eu usei o R, meu programa econométrico favorito (inclusive, usei o pacote do R, stargazer, que gera as tabelas automaticamente, o que me poupa um bocado de trabalho). Caso você queira uma sugestão, eu lhe sugiro o R.

A idéia deste post gigante surgiu, simplesmente, do desejo de gerar um material didático que fosse de fácil acesso para aqueles que já ouviram falar de Econometria (minha definição de “ouviram falar”, claro, é bem específica…). A discussão do consumo unifica três das quatro disciplinas que tenho que lecionar na faculdade. Não é tão ruim quando você pensa que está ao lado de gente como Milton Friedman ou Robert Hall, ensinando suas teorias, dando notícia das mesmas ou, sei lá, simplesmente ilustrando alguns modelos.

Como sempre, deixamos de lado muita coisa porque senão teríamos um post gigante sobre o tema. Ah, o leitor pode ver que tenho tratado do tema “economia japonesa” com alguma frequência por aqui (por um motivo muito óbvio, creio).

No final disto tudo, talvez a melhor coisa seja pensar no Japão com uma bela imagem.

Totoro

Até a próxima!

Bibliografia

Carroll, Christopher D. “Risks Habits’ And The Marginal Propensity To Consume Out Of Permanent Income, Or, How Much Would A Permanent Tax Cut Boost Japanese Consumption?,” International Economic Journal, 2000, v14(4,Winter), 1-40

Charemza, W.W. & Deadman, D.F. New Directions in Econometric Practice, Edward Elgar, 1997 (2nd edition).

Confiante em seu futuro?

Gallup acabou de divulgar o índice de confiança econômica dos EUA, estado por estado. A boa notícia é que a notícia poderia ser pior. Em outras palavras, negativo, mas menos. Você pode visualizar o mapa aqui.

Confiança na economia, eu sei, é algo meio etéreo. Do que depende a confiança econômica? Em princípio, de uma infinidade – literalmente – de variáveis. Entretanto, é fácil ver que, com um pouco de correlação, descobre-se que a confiança nas condições econômicas, geralmente, tem a ver com…as condições econômicas, ora bolas! Eu diria que depende do que tem ocorrido e também do que se espera do futuro. Aliás, é assim que boa parte – senão todos – os índices de confiança do consumidor é feita.

Lá vamos nós!

A confiança do consumidor (ou do empresário, ou de um amostra de pessoas) na economia é o que podemos chamar de um índice antecedente no sentido de que ele antecede movimentos da economia. Agora, como a correlação nem sempre é bonita, com um ajuste de 100%, isto significa que a previsão que busca anteceder movimentos dos ciclos econômicos, supostamente dada pelo grau de confiança (ou por sua variação) também não é perfeita (leia o texto do Mark Thoma que citei acima). Veja, por exemplo, o caso do índice de confiança do consumidor da Fecomércio-SP (dados do IPEADATA).

confianca

Quando observamos as variações deste índice em conjunto com as variações do IBC-Br (aquele índice de atividade econômica do Banco Central que, supostamente, é uma proxy do PIB), o que encontramos?

correlacao_conf_ibc

Na melhor das hipóteses, a correlação é muito baixa. Mas, antes de jogar fora o bebê junto com a água, lembre-se que os dados podem conter movimentos sazonais que podem mascarar a relação (ou, para os mais próximos, o sinal) da correlação, caso haja alguma. Aliás, em nosso caso, veja o que acontece quando fazemos um exercício simples, supondo, ora que a confiança é exógena, ora endógena (respectivamente, colunas 1 e 2).

correlacao2

Ok, percebemos que a sazonalidade existe (as variáveis SEASON…) e é significativa, mas a correlação entre as variações da confiança e da atividade econômica desaparecem (ah, depois que publiquei o texto: viu que a sazonalidade nem sempre parece importante quando você muda a variável dependente da regressão? Pois é, não é nenhum teste de exogeneidade, mas é uma boa dica de por onde você deve começar a se preocupar…). Você, com razão, vai me perguntar sobre o porquê disto. Bem, eu diria que há um problema básico nesta tabela que é a de que estamos ignorando a possível autocorrelação que cada uma destas séries, independentemente, pode possuir. Em outras palavras, é possível que o humor do consumidor, neste mês, seja fortemente relacionado com o próprio humor, no mês anterior. O mesmo vale para a atividade econômica.

Acabou a história? Posso entregar o relatório e ganhar nota alta?

Não tão rápido. Uma breve olhadela nas funções de autocorrelação destas variáveis nos diz que pode ser que este seja o caso.

confianca3

A atividade econômica, destacadamente, apresenta um padrão sazonal ainda, mesmo quando observamos a variações da atividade e não seu nível (veja lá a autocorrelação significativa existente nos dados na frequência de doze em doze meses). Algo mais fraco parece existir na confiança, de sete em sete meses.

Pausa para o lanche

Creio que se restou algum leitor por aqui, deve estar já com sono. Mas eis aí uma dica: neste exercício, simples, uma extensão é fazer um modelo ADL com estas duas variáveis. Claro, existe o problema de saber quem (variável exógena) causa quem (variável endógena). Quem conhece mais de séries de tempo poderá sugerir que você saia deste dilema usando uma abordagem de vetores autoregressivos e, bem, a conversa poderia ir mais longe, conforme sua curiosidade quanto à suposta existência de relação entre a confiança do consumidor – note bem, a confiança, não o consumo em si – e a atividade econômica do país.

Certamente, outras perguntas surgirão. Por exemplo: que confiança é esta? A confiança dos empresários é mais importante? O IBC-Br é, de fato, uma proxy da atividade econômica? Eu não deveria olhar os estoques, faturamento ou produção? E esta coisa toda de relacionar variáveis? Não deveríamos incluir mais algumas como a taxa de câmbio, a taxa de juros, etc?

Todas estas perguntas são legítimas, mas significam estender a idéia inicial em direções distintas. Meu objetivo aqui era só falar um pouco da relação entre confiança do consumidor e atividade econômica (e eu nem me aprofundei na metodologia de construção destas variáveis, note bem). Aproveitei para discutir um pouco de econometria aplicada e de que, como sempre, não se deve ser apressado em tirar conclusões com correlações. Aliás, correlação é coisa de aluno de 1o ou 2o ano de uma faculdade que leva 4 anos para se completar e, ainda assim, você sai com o diploma e não pode se arrogar conhecer todos os métodos econométricos.

No final disto tudo, paradoxalmente, talvez você fique mais confiante em seu futuro como economista. Afinal, reconhecer a humildade é, sim, botar os pés no chão. Olhando sempre para o alto e avante, mas com os pés no chão.

E a inflação, heim?

Pois é. O IBGE nos deu a má notícia. O IPCA contém vários sub-índices (preços), mas o que faz com que os preços subam não é…o próprio preço. Então, fuja de análises erradas que dizem que o IPCA subiu porque o preço do alimento subiu. Digo, o erro está no “porque”. Claro que se 2 + 2 = 4 e se eu digo que agora é 3 + 2, não podemos ter 4. Mas o ‘3’ só apareceu porque eu o coloquei lá.

Então, vamos separar as coisas: não vou falar do que causou o aumento no IPCA, mas sim, tão somente, do próprio. Vejamos como vem evoluindo a variação do IPCA nos anos recentes (Jan/99 – Jan-14).

O monstro está solto?

As variações no IPCA estão no gráfico abaixo (note que, embora o nome do eixo vertical seja “ipca”, o que temos são as variações mensais do IPCA). Os dados está em percentual e, portanto, a má notícia que estamos com 0.55% no último resultado.

ipca4

 

O monstro está solto? Parece que já tivemos melhores dias ali nos idos de 2006, 2007. Mas o problema da inflação não foi resolvido. Lembre-se que o governo deixou o monstro bater nas grades (teto da meta) e, no acumulado, ficamos em quase 6% (ou algo assim) no ano passado.

 

Entendendo o monstro com mais detalhes

Bem, uma forma diferente de observar este mesmo dado é olhar sua propriedade temporal básica: a sua correlação com ele mesmo em diferentes períodos de tempo, portanto, sua autocorrelação. O gráfico abaixo ilustra a autocorrelação acumulada entre variações do IPCA conforme estas variações estão distantes no tempo. Antes de dar os números, veja, se tenho 15 no eixo horizontal, então estou dizendo que existe uma distância de 15 meses. Aí olho para a barra vertical, que ilustra o valor da autocorrelação da variação do IPCA com ele mesmo 15 meses distante. Sacou? Vamos lá.

Por exemplo, no gráfico, com um mês de diferença, há uma fortíssima influência do passado sobre o presente (cerca de 60%). Quando olhamos a influência conjunta de dois meses, a influência cai para algo um pouco abaixo de 40%. E assim por diante. Natural, não? Você esperaria, digamos, que a inflação deste mês fosse fortemente influenciada pela do mês passado, não? Claro. Mas também é verdade que a inflação de dois meses atrás deve influenciar a deste mês, mas menos. Na soma, por assim dizer, a influência dos dois meses passados só é forte porque a do mês imediatamente anterior é muito forte. 

Pensando assim, você percebe que, no gráfico abaixo, a inflação tem aí um movimento quadrimensal forte (as linhas azuis são os intervalos de confiança…logo, barras que estejam entre as linhas nos dizem que os efeitos são estatisticamente iguais a zero) e, note lá na frente, o 12o mês também é importante. Isto significa que existe algum efeito de doze em doze meses, cíclico (sazonal) na inflação. 

Razoável, não? Geralmente, espera-se que, em qualquer ano, a inflação de um mês seja fortemente influenciada pela do mês anterior e, claro, muito menos pela de 333 meses atrás. Isto nos ajuda a entender porque este gráfico aí é razoável, mesmo que eu não entre em detalhes técnicos.

ipca2

 

Agora, no próximo gráfico, em contraste ao primeiro, temos o efeito isolado da distância entre meses, a chamada autocorrelação parcial.

Então, a forte influência do mês passado está aí, firme e forte. Mas a influência isolada da inflação de dois meses anteriores sobre o mês seguinte é praticamente zero (as linhas pontilhadas azuis são os intervalos de confiança, lembra?). Isto é exatamente o que tínhamos no gráfico anterior. Por que? Porque lá, acumulávamos o efeito das duas primeiras distâncias. Então, mesmo com o segundo efeito sendo praticamente zero, a força, por assim dizer, descomunal, da primeira, na soma, prevalecia.

Repare que este gráfico nos mostra um possível segundo ciclo, lá na distância (defasagem) de número oito. Vale dizer, pode ser que exista um ciclo na inflação de oito meses. Ou talvez seja uma questão trimestral, já que, em doze (na verdade, treze) existe outro indício de influência defasada forte. Algo para se pensar, eu sei.

ipca3

Para identificar isto melhor, é necessário explicitar os processos de autocorrelação teóricos que podem gerar gráficos simulados de comportamento similar ao do IPCA. Ou você pode tentar estimar um modelo autoregressivo (na verdade, vários).  Mas vamos em frente.

O monstro do eterno retorno ou “porque minha mulher odeia os finais de ano na feira”

No gráfico seguinte, percebemos a existência de sazonalidade. Repare que cada ponto no eixo horizontal é um mês. Sobre o mesmo, as observações deste mesmo mês ao longo da amostra e a barra horizontal é a média. 

Bem, se não houvesse efeito sazonal, eu esperaria que a média de Janeiro fosse igual à de Fevereiro que fosse igual….etc. Mas as médias são diferentes. Ok, eu não fiz um teste de médias, mas é fácil fazer isto e eu garanto para você (tenho bons motivos, acredite) que exite efeito sazonal. Ah sim, donas-de-casa geralmente odeiam o final e o começo do ano. Ou deveriam. Veja só as médias (e repare em Julho).

 

ipca1

Pensando bem, dá quase para ver um sorriso diabólico juntando estas barrinhas…

O monstro antecipado

Muito bem. Um modelo estimado me diz que a previsão para Fev/2014 é de que a inflação fique em 0.51%, mas o intervalo de confiança ainda não é o que eu gostaria de obter. O ajuste do modelo (um modelo ARIMA, destes que ensino em Econometria) pode ser ilustrado facilmente. Eis o gráfico.

ajuste_ipca

 

Nada mau, eu sei. Mas ocorre que este tipo de modelo é bem a-teórico, no sentido de que você pode se sair bem apenas com a Estatística para fazer a previsão. Mesmo que não continuemos nesta linha de argumentação, existem os modelos da família GARCH, os ARFIMA, os modelos de alisamento exponencial, etc. Ou seja, mesmo que ignoremos o problema da pouca teoria econômica na estimação de modelos como este, ainda assim existe uma variedade imensa de modelos que podem ser usados para prever o IPCA.

Quanto à teoria, claro, eu imagino que, como eu, você também ache que a inflação é um fenômeno monetário (ok, eu também gosto de ciclos reais e também entendo o problema da política fiscal corroendo a saúde da moeda). Então, em um outro contexto, eu gostaria de ver uma previsão do IPCA que levasse em conta esta relação sistêmica entre as variáveis. Bom, esta fica para depois mas eu te garanto que você que quem conhece Economia tem bons motivos para ficar pensando nisto pelo resto do Sábado.

Previsão do IPCA

Os alunos do Nepom, mais recentemente, têm se dedicado a tentar prever o comportamento do IPCA. Infelizmente, dada nossa rotatividade de membros encarregados da Econometria, este é um conhecimento que se desenvolve pouco. Um ou outro busca avançar mais o modelo ou testar especificações alternativas. Falta um pouco mais de análise, creio, paciência, enfim, investimento, no bom e velho tempo de reflexão sobre os dados. Eu recomendo chá verde com doce de feijão ao lado de uma janela aberta com uma bela paisagem (serve a bandeira do time na janela do vizinho fanático, em casos menos felizes…). Os familiares reclamam, eu sei, querem que você participe do almoço e tal. Mas estes momentos de paz e reflexão nos ajudam a pensar e modelar não apenas o IPCA, mas outras séries econômicas.

Ou talvez seja só um chá verde o suficiente para despertar seu lado econometrista. Vai saber.