Quebras estruturais e preços do boi gordo: mais um artigo publicado

Acabo de ser informado – não pela revista, mas por um colega – que meu artigo com o Ari e com o Guilherme (meu ex-aluno) foi finalmente publicado na Economia Aplicada. Eis o endereço e eis o resumo:

O objetivo deste artigo é analisar a existência de quebras estruturais na série do preço do boi gordo (por arroba) no estado de São Paulo entre 1954 e 2012. Devido às especificidades do preço do boi gordo (sazonalidade e ciclos) e também à importância da bovinocultura na agropecuária brasileira, a série foi anteriormente utilizada para discussão e estudo de testes econométricos, como análise de raiz unitária sazonal, modelos de transferência e cointegração. Neste trabalho, testam-se se quebras estruturais apresentam origem em determinados eventos históricos, inclusive intervenções governamentais. A principal metodologia utilizada para identificação e estimação das quebras é a desenvolvida por Bai & Perron (1998, 2003). Os resultados sugerem que as intervenções governamentais, especialmente os planos de estabilização, levaram a mudanças significativas no comportamento do preço do boi gordo.

Meus co-autores ajudaram um bocado, mas destaco o empenho do Guilherme em estudar um assunto que, na época, era-lhe novo. Sobre o Ari, não preciso comentar, é um dos melhores co-autores que tenho em várias empreitadas científicas.

Anúncios

Momento R do Dia – A volta de Lady Gaga e a Wikipedia…agora exclusivamente em R!

A Econometria da Lady Gaga na Wikipedia é um arquivo em formato pdf gerado completamente no RStudio, por meio da linguagem R Markdown (*). Eu poderia ter salvado o arquivo em formato html, mas queria deixar o documento em um formato que muitos acham mais confortável.

Trata-se de uma nota de aula sobre séries de tempo que seria um complemento para uma aula teórica de Cointegração (pelo método simples, ou seja, de Engle-Granger) e com causalidade de Granger.

Por que eu fiz esta nota? Porque queria mostrar ao leitor que não é preciso usar nada além do próprio R para gerar relatórios de pesquisa, notas de aula, slides (sim, eu poderia ter gerado slides!) ou um documento de Word com toda a minha pesquisa. Em outras palavras, até um artigo poderia ser totalmente gerado dentro do R.

Digamos que você usou o Gretl ou o Stata para alguns itens. Não tem problema. Os resultados poderiam ser importados para dentro do R e utilizados no relatório. O mesmo vale para imagens ou vídeos.

Espero que curta o exercício. Ele é completamente auto-explicativo e facilmente reproduzível (bem, mais ou menos porque não delimitei a data final da amostra no meu comando e, na prática, o relatório pode ser replicado a cada dia com a amostra aumentando a cada dia adicional…) por qualquer um que saiba copiar e colar comandos do relatório (ou, para ser mais estudioso, copiar manualmente) na janela de comandos do R.

Não é um exercício completo como eu gostaria, mas é bastante ilustrativo. O leitor com um pouco mais de criatividade pode mudar o meu exemplo e fazer um breve artigo mais interessante. Aliás, acho que esta foi a idéia original do autor do pacote, eu diria, mais charmoso desta nota, o wikipediatrend.

Ah sim, antes que você pergunte, eu só escolhi a Lady Gaga porque ela é pop, vai chamar a atenção do leitor (suponho) e porque ela atuou em Machete Kills. (**)

(*) Minto apenas porque inseri números de páginas no arquivo posteriormente usando um editor de arquivos pdf. Fora isto, é tudo verdade!

(**) Caso você pesquise este blog, encontrará alguns Momentos R do Dia anteriores em que eu fazia este mesmo exercício.

Belo Horizonte continua muito pouco eficiente: o caso da lei do preço único

Fullscreen capture 9302015 51536 PM-001

Carlos Góes, que também é do ótimo Mercado Popular, tem um trabalho interessante (é um working paper do FMI). A idéia é bem simples (o que não quer dizer que o trabalho seja fácil): testar a famosa lei do preço único para as regiões metropolitanas brasileiras.

Na figura acima, um de seus achados. Ele mesmo, e seu co-autor, explicam:

Figure 3 shows how the persistence of price level deviations varies across cities. Tradable price divergences range from a maximum of 17 months in Belo Horizonte to a minimum of 10.8 months in Curitiba. By contrast, non-tradable price divergences vary from 23.8 months in Salvador to 15.5 months in Belem. The standard deviation of half lives averages between cities is and months for tradables and non-tradables, respectively. There seems to be no overarching pattern in the distribution of half lives, suggesting a potential avenue for further research.

Como você pode imaginar, leitor, quanto mais lenta a convergência, maiores as suspeitas de que os mercados não funcionam de forma eficiente. Belo Horizonte – meu local de nascimento – aparece em primeiro lugar. Por conta de todas as anedotas que me passam pela cabeça (sem falar no path dependence detectado no importante artigo do Rodrigo Soares, Juliano Assunção e Joana Naritomi), eu não consigo imaginar como isso não estaria uma evidência da pouca eficácia do funcionamento dos mercados na capital da terra do pão de queijo. ^_^

A taxa de câmbio mais sem sal do mundo

Qual é? Claro, a do dólar canadense em relação ao dólar dos EUA. Recentemente, um amigo, vamos chamá-lo de Lucas para preservá-lo, perguntou-me sobre o que eu achava desta série de tempo. Tive que lhe dizer: nunca vi mais gorda.

Mas eis que a curiosidade bateu. Por meio do R, consegui baixar dados diários (no limite de cinco anos) da taxa e fiz uns testes básicos para, claro, verificar que a série é, essencialmente, imprevisível (usei a escala logaritmica para fazer a rápida checagem do número de raízes unitárias…o leitor mais estudioso entenderá o porquê).

Eis os comandos.

library("forecast")
library("quantmod")
getFX("CAD/USD", from="2010-08-01")
par(mfrow=c(2,1))
plot(CADUSD)
ndiffs(log(CADUSD), test=c("kpss"))
plot(diff(log(CADUSD)))

Faça o exercício, leitor: replique isto em casa.

lucascambio

O teste de raiz unitária no logaritmo da série parece indicar que a mesma seja um passeio aletório em torno de uma tendência determinista (o drift foi fracamente significativo, em termos estatísticos).

O que será que Lucas deveria fazer diante disto? Comprar? Vender? Tem como prever a taxa de câmbio? Pergunte ao seu livro de Econometria, claro!

Claro, você pode se divertir mais pesquisando a relação entre estas duas moedas. Uma boa dica é brincar com os modelos básicos de séries univariadas como os modelos ARIMA. Outra, claro, é partir para estratégias multivariadas.

Mais raiz unitária

Novamente, vou apenas deixar o link. Quem quiser, pode tentar fazer um exemplo e fazer uma aplicação didática. Ou pode simplesmente ler o ótimo post. Tivesse o dia um pouco mais de horas, faríamos um exemplo em R para os leitores que, obviamente, não são os meus alunos de Econometria, né, Thomaz?

Raiz unitária – dica

Dica simples e importante aqui. Notadamente:

One characteristic of a spurious regression is highly variable regression coefficients as additional data points are added.

Por que? Fácil. A regressão, sendo espúria, deve apresentar uma tendência estocástica em ao menos uma das variáveis envolvidas. Preciso dizer mais?

Quem quiser fazer um exemplo como o do autor é bem-vindo a reportar os resultados por aqui (ou nos comentários). Creio que, agora, o Vitor tem mais um teste para seu problema.

IBC-Br e um Momento R do Dia: o teste ADF

Acabo de ler sobre o IBC-Br que, é bom lembrar, não capta as novas e tristes notícias sobre o setor elétrico. Aliás, cá para nós, quando Sarney descongelou depois da esmagadora vitória do PMDB em 1986, o nome que deram ao fato foi “estelionado eleitoral”. Que nome merece o anúncio de que o aumento da conta de energia só vem em 2015 (sem falar nos boatos de que vem aí mais uma prática kirchneriana de “contabilidade criativa”)?

Ah, pois é. Não busque o IBC-Br no Ipeadata porque a última revisão deles, da série, foi de fevereiro e a notícia fala em revisões do Banco Central. Logo, o melhor, como sempre, é ir direto à fonte sempre que possível.

ibc_br11

Podemos ver que há motivos para otimismo, no longo prazo, como sempre digo. Entretanto, no curto prazo, a história não é tão bonita assim. Vamos dar uma olhada na “janela” mais recente.

ibc-br_recente

Dá para ver que o índice anda “patinando” para lá e para cá ultimamente, não? Além da desaceleração, fica a preocupação sobre se vamos ou não voltar a uma trajetória de crescimento como a que tínhamos anteriormente.

E o PIB? Bem, é legal dar uma olhada nas diferenças entre este indicador e o PIB. Segundo a mesma matéria do Estadão (citada no início):

O IBC-Br serve como parâmetro para avaliar o ritmo da economia brasileira ao longo dos meses. Entre os indicadores está a Pesquisa Mensal de Comércio (PMC) do Instituto Brasileiro de Geografia e Estatística (IBGE), que mostrou alta de 0,4% em janeiro ante dezembro na série com ajuste sazonal e 6,2% na comparação entre os primeiros meses do ano de 2014 e 2013. Outro dado importante é a produção industrial, que em janeiro cresceu 2,9% na comparação com o mês anterior, mas caiu 2,4% em relação a janeiro de 2013.

A estimativa do IBC-Br incorpora a produção estimada para os três setores da economia acrescida dos impostos sobre produtos. Já o PIB do IBGE é a soma de todos os bens e serviços produzidos no país durante certo período. Pelo IBC-Br, a economia brasileira cresceu 2,52% em 2013 na comparação com 2012, nos dados sem ajustes sazonais. O PIB calculado pelo IBGE, no entanto, revelou expansão de 2,3% no ano passado.

Pois é. O IBC-Br é tido pelo mercado como uma proxy do PIB, no sentido de que se pudéssemos obter medidas mensais do PIB, estas seriam fortemente correlacionadas com o IBC-Br.

Agora, o momento R do dia!

A idéia é aplicar um teste de raiz unitária comum, o ADF. Para isto, vamos usar o pacote urca. O leitor pode ver mais sobre o teste no bom e velho Enders (1995) ou em Gujarati & Porter (2009), mais recente. Vou seguir com a intuição do livro-texto de graduação, que nos diz que o gráfico da série sugere um teste com o modelo mais completo, com intercepto e tendência determinista.

Os comandos abaixo, respectivamente, carregam o pacote e calculam o teste ADF para o IBC-Br (logaritmizado) em nível e na primeira diferença.

library(urca)
summary(ur.df(log(ibc_br), type=c("trend"),lags=13,selectlags=c("BIC")))
summary(ur.df(diff(log(ibc_br)), type=c("trend"),lags=13,selectlags=c("BIC")))

E então, temos:

> summary(ur.df(log(ibc_br), type=c(“trend”),lags=13,selectlags=c(“BIC”)))

###############################################
# Augmented Dickey-Fuller Test Unit Root Test #
###############################################

Test regression trend
Call:
lm(formula = z.diff ~ z.lag.1 + 1 + tt + z.diff.lag)

Residuals:
Min 1Q Median 3Q Max
-0.043644 -0.003613 0.001186 0.004800 0.030823

Coefficients:
Estimate   Std. Error   t value   Pr(>|t|)
(Intercept)             0.3666494  0.1770436  2.071   0.0406 *
z.lag.1                 -0.0781832  0.0382658  -2.043  0.0433 *
tt                           0.0002038  0.0001157  1.761   0.0809 .
z.diff.lag               0.0195693  0.0949619  0.206   0.8371

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.008717 on 115 degrees of freedom
Multiple R-squared: 0.04641, Adjusted R-squared: 0.02153
F-statistic: 1.865 on 3 and 115 DF, p-value: 0.1393
Value of test-statistic is: -2.0432 5.7813 2.7886

Critical values for test statistics:
1pct 5pct 10pct
tau3 -3.99 -3.43 -3.13
phi2 6.22 4.75 4.07
phi3 8.43 6.49 5.47

O teste para se saber se há ou não raiz unitária é dado pela estatística tau3. O valor calculado é -2.0432 que é, em valor absoluto, menor que o valor absoluto de qualquer um dos valores críticos (a 1% é -3.99, a 5% é -3.43 e a 10%, -3.13). Logo, diríamos que há evidências de que exista uma raiz unitária na série.

A equação estimada (sem a parte aumentada) pode ser expressa da seguinte forma:

Δlog(IBC)t = 0.37 – 0.078logIBCt-1 _ 0.0002tendência_determinista

Repare que a tendência determinista tem uma significância estatística bem menor que os outros termos. De qualquer forma, repare que o lado esquerdo da equação nos diz que, caso alguém resolva reescrever a equação em termos do nível do logaritmo da variável, o coeficiente de logIBCt-1 seria (1 – 0.078) que é algo realmente próximo da unidade.

O segundo comando apenas faz a mesma coisa, mas para a primeira diferença da série, usando o modelo sem tendência determinista. Observando a série em diferenças, não vi evidências de que a tendência determinista seria importante e, assim, escolhi esta equação de teste. Veja o gráfico da primeira diferença do logaritmo da série e, em seguida, os resultados do teste ADF apenas com drift, sem tendência determinista.

diff_ibcbr
###############################################
# Augmented Dickey-Fuller Test Unit Root Test #
###############################################

Test regression drift
Call:
lm(formula = z.diff ~ z.lag.1 + 1 + z.diff.lag)

Residuals:
Min 1Q Median 3Q Max
-0.042180 -0.002883 0.001351 0.004770 0.028825

Coefficients:
Estimate      Std. Error   t value   Pr(>|t|)
(Intercept)     0.0024775   0.0008971   2.762   0.0067 **
z.lag.1         -0.8865066   0.1320898   -6.711   7.65e-10 ***
z.diff.lag       -0.1279585   0.0943900   -1.356   0.1779

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.008849 on 115 degrees of freedom
Multiple R-squared: 0.5124, Adjusted R-squared: 0.5039
F-statistic: 60.42 on 2 and 115 DF, p-value: < 2.2e-16
Value of test-statistic is: -6.7114 22.5228

Critical values for test statistics:
1pct 5pct 10pct
tau2 -3.46 -2.88 -2.57
phi1 6.52 4.63 3.81

A mesma análise mostra que |-6.7114| > |-3.46| a 1%. A evidência, neste caso, seria contrária a não-rejeição da hipótese nula de existência de raiz unitária.

Então, em resumo, log(IBC) ~ I(1). Certo?

Observações

O protocolo de realização de testes que segui é o que está em Gujarati & Porter (2009) e também em Elder & Kennedy (2001). Claro, alguém poderia querer seguir o de Enders (1995), mas Elder e Kennedy mostram que, além de pouco didático, aquele protocolo pode gerar resultados estranhos.

De qualquer forma, um outro ponto que não comentei diz respeito às outras estatísticas de teste. A bibliografia indicada é suficiente para você discutir mais sobre as mesmas.

Não apenas isto, mas veja que alguém poderia dizer que há uma quebra na série, em 2008. Digo, seria uma quebra ou seria apenas uma trajetória deste passeio aleatório que supomos existir? Não sabemos e nem tratamos disto aqui, embora existam testes para isto facilmente implementáveis em R.

Última observação: Gujarati & Porter (2009) é a referência do livro-texto em inglês. Minha edição em português não está aqui perto e eu desconfio que é 2011 o ano do lançamento.

Correlações? Causalidades?

Para onde vai a economia brasileira? Não sei. Mas sei que você já tem trabalho para pensar e trabalho, produtividade e prosperidade têm uma relação interessante. Assim, mãos à obra!

Passeios Aleatórios em Salvador

Alá-lá-ô-ô-ô!

Carnaval é época de se fazer passeios em Salvador, segundo alguns foliões. Bem, por que não um passeio aleatório? Antes que você imagine que estou bêbado, talvez seja legal dar uma olhada nesta video-aula que fiz ano passado (é a primeira desta pequena série). Façamos uma pausa para você se inteirar do tema.

Pronto. Agora que você já sabe o básico, vamos falar do livro de Richard Graham (Graham, R. (2013). Alimentar a Cidade – das vendedoras de rua à reforma liberal (Salvador, 1780-1860), Companhia das Letras). O autor explorar a Salvador do final do século XVIII sob a ótica do funcionamento do mercado de alimentos. Bem, a leitura do livro está em andamento, então não posso falar muito. Mas posso dizer que o autor construiu um interessante índice de custo de vida para a cidade.

Segundo ele, os principais elementos da cesta de consumo do cidadão (escravo, livre, rico, pobre, etc) consistiam de eram: farinha de mandioca e carne (quase posso visualizar uma tradicional carne de sol com mandioca no meu prato…mas são apenas 8:57 da manhã). Além disso, diz o autor, havia outros itens, importados, mas estes eram mais comuns aos mais ricos.

Seu índice do custo de vida, no Apêndice A do livro, inclui os preços de farinha de mandioca, carne fresca, escravos (custo) e a taxa de câmbio (em relação à libra esterlina). Arbitrariamente, ele deu o mesmo peso aos quatro fatores (se você não gostou…construa seu índice antes de criticar o trabalho do autor).

A partir daí, temos o belo gráfico que se segue (base: 1824 = 100).

salvador1

 

Dados anuais, como se vê. É uma série relativamente curta, eu sei. Mas serve para ajudar o leitor a praticar no R, não é? Pois bem. Visualizar esta série é quase a mesma coisa de dizer: há uma tendência de alta no custo de vida durante a amostra. Há lá uma ou outra interrupção, notadamente no início dos 40 (1845, para ser exato), mas nada que tenha interrompido a trajetória ascendente.

Podemos pensar na “inflação”, verificando a taxa de variação deste índice.

inflacao_salvador

 

Os dados mostram uma inflação mais ou menos estacionária em torno da média? Eu diria que sim, mas a queda em 1845 ainda é um efeito marcante. Como a série é curta, esta queda bem pode ser pensada como uma variação aleatória – mas eu sei que muitos gostariam de ver uma quebra estrutural e, claro, teríamos que ter um teste robusto a pequenos tamanhos de amostra – e assim seguirei.

Agora sim, passeios aleatórios! E em R!!!

O leitor que já assistiu a video-aula acima e/ou que já estudou um pouco de econometria de séries de tempo, tem aqui uma oportunidade de fazer um exercício simples: aplicar testes de raiz unitária sobre a série. Especificamente, vamos aplicar o teste ADF. Utilizaremos o pacote urca, que é um paraíso para os que gostam de testes de raiz unitária.

Inicialmente, copiei e colei a série no R. Pedi para ver as primeiras observações para conferir se estava tudo ok.

historia<-read.table(file=”clipboard”,sep=”\t”,header=TRUE)
head(historia)

Nomear a variável e dizer que é uma série de tempo é algo que o leitor deste blog já sabe fazer. Mas aí vai. De quebra, os comandos que geraram os dois gráficos acima.

custo_de_vida_Salvador<-ts(historia$custo_de_vida_Salvador, start=c(1791),freq=1)
plot(custo_de_vida_Salvador)
plot(diff(log(custo_de_vida_Salvador)))

Vou trabalhar em escala logaritmica e, assim, é mais fácil renomear a variável, embora isso não seja necessário.

lcv<-log(custo_de_vida_Salvador)
plot(lcv)

Chamando o pacote urca (lembre-se que se você não o instalou, precisa fazê-lo antes).

library(urca)

Caso você seja novo nisto, e se está em dúvida, veja a sintaxe do comando que vou usar, “ur.df”, digitando (e executando) a linha de comando abaixo.

?ur.df

O teste ADF (Augmented Dickey-Fuller) pode ser feito sob três especificações. Há dois protocolos básicose para tal. Você pode seguir um fluxograma (como nos ensina o livro-texto básico do Walter Enders) ou escapar de inconsistências do mesmo usando uma abordagem mais pragmática como a exposta no livro-texto do Gujarati (mais simples de todos do mercado, acho).

Para fins didáticos, faço as três especificações, mas adianto que o eyeballmetrics diz-nos que o modelo a ser testado deveria incluir tendência e intercepto, vale dizer, deveríamos olhar para a especificação mais geral:

Fonte: Wikipedia

Muito bem. A idéia do teste é melhor entendida se pensarmos no mesmo sem a parte extendida (que lá está apenas para evitar problemas de auto-correlação na equação do teste). Para detalhes, dê uma rápida olhada aqui (ou vai estudar, né, meu filho!). Repare que usei o critério AIC para selecionar o número de termos defasados da parte “aumentada”. Você pode mudar este critério se quiser.

Os comandos:

adf_lcv<-ur.df(lcv,type=c(“trend”), selectlags=c(“AIC”))
summary(adf_lcv)
adf_lcvd<-ur.df(lcv,type=c(“drift”), selectlags=c(“AIC”))
summary(adf_lcvd)
adf_lcvn<-ur.df(lcv,type=c(“none”), selectlags=c(“AIC”))
summary(adf_lcvn)

Vou olhar para os resultados. Primeiro deles, com constante e tendência.

> summary(adf_lcv)

###############################################
# Augmented Dickey-Fuller Test Unit Root Test #
###############################################

Test regression trend
Call:
lm(formula = z.diff ~ z.lag.1 + 1 + tt + z.diff.lag)

Residuals:
Min 1Q Median 3Q Max
-0.308055 -0.033710 0.004324 0.032329 0.266900

Coefficients:
Estimate     Std. Error   t value   Pr(>|t|)
(Intercept)       0.431004   0.207669   2.075   0.0420 *
z.lag.1            -0.112944   0.056872   -1.986  0.0513 .
tt                      0.003504   0.001703   2.057   0.0437 *
z.diff.lag           0.072480   0.125376   0.578   0.5652

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.0704 on 64 degrees of freedom
Multiple R-squared: 0.06238, Adjusted R-squared: 0.01843
F-statistic: 1.419 on 3 and 64 DF, p-value: 0.2453
Value of test-statistic is: -1.9859 4.5111 2.1167

Critical values for test statistics:
1pct 5pct 10pct
tau3 -4.04 -3.45 -3.15
phi2 6.50 4.88 4.16
phi3 8.73 6.49 5.47

Antes de qualquer coisa, repare que o AIC nos retornou uma equação para o teste ADF com apenas uma defasagem da variável dependente ΔLcvt. A tendência determinista é denominada “tt” e seu coeficiente é próximo de zero, embora estatisticamente significativo a 5%. O coeficiente de Lcvt-1, central para nosso teste de hipóteses, é fracamente diferente de zero, no sentido de ser estatisticamente significativo a 10%.

Caso você queira dar uma olhada na tabela, repare que -1.9859 diz respeito ao tau3 estimado, 4.5111 ao phi2 estimado e, finalmente, 2.1167 é análogo para phi3. Em outras palavras, a 1%, você olharia -1.9859 comparativamente a -4.04, para tau3 (qual é a hipótese nula?). Para phi2, você compara o phi2 calculado, 4.5111 com 6.50, a 1% (qual é a hipótese nula?). Não preciso dizer como fazer com phi3, certo?

Mas, que hipótese nula você está analisando? Em cada caso você testa uma variante de processos com raiz unitária. A análise é sempre com o módulo dos valores (calculados e tabelados). Então, voltando ao parágrafo anterior, se 1.9859 < 4.04, não rejeitamos a hipótese nula do teste tau3. Esta é a hipótese de que existe raiz unitária.

No caso de phi3, testa-se se há raiz unitária e se a tendência determinista (“tt”, na saída do teste) tem coeficiente nulo. Finalmente, phi2 testa se há raiz unitária, se o coeficiente da tendência determinista é nulo e se o intercepto também é nulo.

A 1%, em qualquer um dos testes, temos como resultado a existência de raiz unitária (lembre-se de olhar os valores em módulo!). Os testes phi2 e phi3 parecem indicar a ausência de intercepto e tendência no teste conjunto com a existência de raiz unitária. Assim, a especificação do processo estocástico do índice de custo de vida seria algo assim:

Lcvt – Lcvt-1 = -0.112944Lcvt-1 + erro aleatório         ou seja,

Lcvt = (1 – 0.112944)Lcvt-1 + erro aleatório -> aproximadamente ->

Lcvt = 0.99Lcvt-1 + erro aleatório

Claro, você pode fazer os outros testes. Vou apenas resumir agora. Com a especificação que exclui a tendência determinista, o teste de raiz unitária (tau2) continua nos confirmando a raiz unitária e o teste de que há raiz unitária e não há constante, phi1, também (4.4297 < 6.70 a 1%).

Coefficients:
Estimate     Std. Error    t value Pr(>|t|)
(Intercept)       0.0275203   0.0700130   0.393  0.696
z.lag.1             0.0001639   0.0149285   0.011  0.991
z.diff.lag          0.0187893   0.1256437   0.150  0.882

Residual standard error: 0.07212 on 65 degrees of freedom
Multiple R-squared: 0.0003596, Adjusted R-squared: -0.0304
F-statistic: 0.01169 on 2 and 65 DF, p-value: 0.9884

Value of test-statistic is: 0.011 4.4297

Critical values for test statistics:
1pct 5pct 10pct
tau2 -3.51 -2.89 -2.58
phi1  6.70 4.71 3.86

Para a última especificação, rejeita-se a existência de raiz unitária, mas o resultado da equação de teste nos dá um resultado que não faz sentido, pois o coeficiente Lcvt-1 é positivo, o que significaria que o processo seria explosivo! Reproduzo parcialmente a saída:

                   Estimate Std. Error t value Pr(>|t|) 

z.lag.1        0.005978 0.002013 2.969 0.00416 **
z.diff.lag     0.014636 0.124394 0.118 0.90669

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.07166 on 66 degrees of freedom
Multiple R-squared: 0.1416, Adjusted R-squared: 0.1156
F-statistic: 5.443 on 2 and 66 DF, p-value: 0.006484

Value of test-statistic is: 2.9695

Critical values for test statistics:
1pct 5pct 10pct
tau1 -2.6 -1.95 -1.61

Conclusão: segundo o ADF, teríamos que o logaritmo do índice do custo de vida em Salvador seria um passeio aleatório puro. Claro, você pode ler e estudar sobre as limitações deste teste, mas vamos explorar um pouco o tema. Ou seja, suponha que este resultado está ok. O que isto significa?

O custo de vida é um passeio aleatório!

O exercício acima nos deu como resultado que o custo de vida levantado por Graham (2013) seria um passeio aleatório. Isto significa que as variações no custo de vida – que poderíamos chamar de “inflação” seriam aleatórias (ou um ruído branco, para os que apreciam um pouco mais de exatidão).

Isto significa que choques no custo de vida de Salvador seriam persistentes. Digamos, um choque no preço dos escravos, na época (um aumento de custos, digamos, por conta de bloqueios britâncios aos navios negreiros brasileiros) seria incorporado ao custo de vida de Salvador. Não é a mesma coisa de um choque que se dissipa rapidamente – que poderíamos chamar de temporário – mas sim um que incorpora permanentemente no custo de vida. Isto significa que até a tendência do custo de vida muda (no choque temporário, o desvio seria…temporário e, portanto, logo você voltaria à tendência original).

O autor do interessante livro relata um debate sobre a adoção de um livre mercado para a farinha de trigo e o uso de estoques reguladores por parte do governo municipal e seu “celeiro público”. Com uma breve discussão sobre um breve surto de liberalismo em Salvador, o autor parece tomar partido dos adversários do livre mercado. O problema é que ele não faz qualquer análise de custo-benefício e, quando se refere a um liberal, chama-o de “empedernido”, o que não é exatamente um adjetivo positivo e nem nos ajuda muito a entender o impacto do liberalismo em Salvador, o que empobrece um pouco a análise do livro, creio eu.

A persistência no custo de vida em Salvador, detectada pelos dados, pode nos ajudar a entender o que ocorreu na história? Não sei. Mas o exercício em R é este e, goste-se ou não do livro, você tem que lê-lo para tirar suas próprias conclusões.

Uma correlação não faz verão: o caso do Japão e dos EUA

Uma boa fonte de dados para estudantes de Economia é a base do FED. A regional de Saint Louis tem o FRED. O exemplo acima nos dá a série de tempo das importações dos EUA (em US$ milhões) de bens importados do Japão. Nada mal para um gráfico gerado em pouco mais de dois ou três cliques, não?

Percebe-se ali, por volta de 2010, uma recuperação das importações seguida de uma nova – mas menos perceptível – queda que poderia ser efeito de alguma mudança no câmbio. Então, lá mesmo na página do FRED, adicionei a série do câmbio, mudei a escala da mesma (no eixo vertical direito) e, olhe aí:

Você pode se perguntar: como é que a taxa de câmbio menos desvalorizada do Japão estimula as importações de produtos japoneses pelos EUA? Muita calma nesta hora, pois temos que observar diversos pontos antes:

a) Tendências – As duas séries apresentam (mais as importações do que a taxa de câmbio) tendência e, sabe, isto atrapalha um bocado a análise dos impactos de uma variável sobre a outra (digamos que a correlação pode ser espúria).

b) Sazonalidade – As importações dos EUA apresentam uns ciclos bem marcados, né? Eu não fiz a decomposição sazonal, mas a visualização acima não nos dá motivo para ignorar a possibilidade de que estejamos com um forte ciclo sazonal.

Além destes itens, típicos de um estudo puro das propriedades estatísticas das duas séries, eu acrescentaria um de ordem teórica.

c) Omissão de variáveis relevantes – Mesmo no mais simples sistema do mundo, o de demanda, existem, pelo menos, quatro variáveis. Relembrando: a demanda de Z é função do preço de Z, do preço do bem substituto/complementar, e da renda. Isto supondo que só há dois bens. Podemos até dizer que são três variáveis: a demanda, o preço relativo e a renda. Então, na pior das hipóteses, falta em nossa análise alguma “renda”. Assim, digamos, se a taxa de câmbio incentiva o Japão a exportar menos, mas se a renda dos EUA estimula o aumento das importações de produtos do Japão, a pergunta sobre qual efeito prevalecerá nos dá margem a pensar que o comportamento das importações, no gráfico acima, deve sofrer forte impacto do crescimento da economia norte-americana.

Ok, eu sei que não é muito, mas veja como fica o gráfico com a produção industrial dos EUA (já ajustada para variações sazonais):

Pois é. A suposição simplificadora – e não verificada por este blogueiro – é a de que boa parte do estímulo às importações de produtos japoneses pelos EUA pode ser captada pela produção industrial daquele país. Pode ser, pode não ser. De qualquer forma, a história de que a renda pode ter algum impacto talvez possa ser captada pela variável.

Ah sim, note que eu nem falei de outras variáveis importantes na determinação de produtos importados japoneses pelos EUA. 

O que fazer? Chorar?

Não. Nem precisa ligar para sua mãe e dizer que o sentido de sua vida terminou. Há muito o que fazer. Ora, vamos lá. Você acabou de conhecer uma base de dados super-legal. Além disso, você entendeu que pode fazer gráficos bonitos com relativamente pouco trabalho. Mas não se deixe levar pela beleza dos gráficos.

Há 10 anos atrás, fazer gráficos era difícil e sobrava pouco tempo para a análise estatística dos mesmos. Então, aí vão minhas sugestões:

(a) o que a teoria econômica nos diz é que variações na taxa de câmbio e no PIB dos EUA (e no PIB do Japão?) teriam algum impacto na variação das importações norte-americanas de produtos japoneses. Já fez esta matriz de correlação?;

(b) tem uma sazonalidade forte aí nas importações. Eu fiz uma estimativa preliminar com dummies sazonais entre a variação das importações e a variação do câmbio e guess what?, a relação estatística entre estas variações desaparece, o que é um sintoma de que a questão da tendência (sobre a qual falei pouco, confesso) pode ser importante. Logo, leia sobre o problema de tendências em dados macroeconômicos.

(c) pense no problema de especificação do modelo que você deseja estudar antes de se encantar com os belos gráficos (eu adorei a indicação das recessões dos EUA lá neles, ajuda um bocado a pensar nos problemas). Qual é o seu sistema de variáveis? Quanto dele você conseguirá estudar e quanto deixará para a famosa cláusula ceteris paribus? Nem tudo pode ser compreendido de uma rodada só. Qualquer economista que te diga o contrário, pode ter certeza, está mentindo.

À guisa de conclusão

Espero que tenha gostado destas poucas reflexões sobre dados e teoria. Você certamente encontrará blogueiros mais organizados, ou com dados mais interessantes (aqui, você já viu, tem papel higiênico, macarrão instantâneo, restaurantes, índices de liberdade, coisas meio diferentes do salame diário que você digere no bar). Bem, é assim que as coisas funcionam por aqui.

Até a próxima.

História Econômica na manhã de sexta: o PIB brasileiro no longo prazo

O PIB do Brasil tem raiz unitária? Estive tabulando dados históricos e resolvi brincar um pouco com a série do PIB. Em resumo, consegui um esboço de “PIB de longo prazo” (1862-2010) para o Brasil.

Bem, aí surgiu a pergunta: o PIB tem raiz unitária? Para efeitos de diversão, fiz o ADF, o ADF-GLS e o KPSS (de quebra, ajudei a detectar um “bug” no gretl…). Eis os resultados. Para o ADF, temos:

 test with constant
   model: (1-L)y = b0 + (a-1)*y(-1) + ... + e
   1st-order autocorrelation coeff. for e: 0.015
   lagged differences: F(9, 128) = 13.517 [0.0000]
   estimated value of (a - 1): 0.000838294
   test statistic: tau_c(1) = 0.389209
   asymptotic p-value 0.9826

   with constant and trend
   model: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e
   1st-order autocorrelation coeff. for e: 0.017
   lagged differences: F(9, 127) = 13.480 [0.0000]
   estimated value of (a - 1): -0.0347951
   test statistic: tau_ct(1) = -2.38959
   asymptotic p-value 0.385

Note que a não-rejeição da hipótese nula parece maior no caso em que o teste tem como termos deterministas a constante e a tendência na equação. Aparentemente, a série é um passeio aleatório com drift em torno de uma tendência determinista.

No teste do ADF-GLS:

Augmented Dickey-Fuller (GLS) test for l_PIB_LP_inde
including 9 lags of (1-L)l_PIB_LP_inde (max was 13)
sample size 139
unit-root null hypothesis: a = 1

   with constant and trend
   model: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e
   1st-order autocorrelation coeff. for e: 0.013
   lagged differences: F(9, 129) = 13.910 [0.0000]
   estimated value of (a - 1): -0.0128951
   test statistic: tau = -1.26888

                      10%     5%     2.5%     1%
   Critical values: -2.64   -2.93   -3.18   -3.46

Aqui a hipótese de raiz unitária ganha um pouco mais de força. Vejamos o KPSS:

KPSS regression
OLS, using observations 1862-2010 (T = 149)
Dependent variable: l_PIB_LP_inde

             coefficient   std. error    t-ratio    p-value
  ----------------------------------------------------------
  const       2.09506      0.0734929      28.51    9.24e-062 ***
  time        0.0453337    0.000598572    75.74    1.14e-119 ***

  AIC: 79.8893   BIC: 85.8972   HQC: 82.3302

  Robust estimate of variance: 0.450189
  Sum of squares of cumulated residuals: 4512.94

KPSS test for l_PIB_LP_inde (including trend)

T = 149
Lag truncation parameter = 4
Test statistic = 0.451537

                   10%      5%      1%
Critical values: 0.120   0.148   0.216

A hipótese nula é de estacionaridade da série mas a estatística de teste, novamente, favorece a hipótese de não-estacionaridade da série.

Bem, as saídas acima são todas do Gretl (hoje não temos o “momento R do dia” e sim o “momento Gretl do dia”, he he he) e, caso alguém que saiba de uma série de população para todo o período (ou pelo menos para depois de 1913, para que eu possa usar a série de população do Leff até esta data), eu agradeceria. Neste caso eu teria uma boa aproximação da evolução da renda per capita ao longo de quase dois séculos…

Pesquisas interessantes

O último número da Revista de Economia e Administração (vol.10, n.1, em breve já disponível na página da revista) tem alguns artigos que me chamaram a atenção (sem falar no meu próprio, com Ari e Juliana). Vamos a eles:

1. “Sistema financeiro, segurança jurídica e crescimento econômico” – Este é um excelente exemplo de artigo que procura fazer com que o leitor entenda o que os autores fazem. A explicação dos procedimentos (que culminam em um VECM e nos testes de causalidade) está ótima. Não chequei se o teste de causalidade foi feito sobre o VECM ou não, mas é um belo artigo.

2. “Industrialização do Brasil na década de 1930: uma análise com teoria dos jogos” – O autor é da área de história econômica e, de certa forma, a parte da história ocupa 2/3 do artigo. Sempre é bom contextualizar, mas o bacana do artigo é a modelagem do autor. Mais uma vez, alguns aspectos das hipóteses que Furtado criou (e nunca testou) são refutados, neste caso, pelo modelo do autor.

3. “Persistência inflacionária: comparações entre três economias emergentes” – Vamos falar sério. A última coisa que me interessou no artigo foram as três economias emergentes. Ok, é o tema principal, mas os autores foram muito bem-sucedidos na parte mais difícil do artigo que foi a de explicar os modelos ARFIMA. Até eu que sou burrinho consegui pegar a idéia.

Assim, meus parabéns aos autores destes artigos. Há tempos eu não via artigos que eram realmente “bens públicos”. Aprendi algo novo com cada um deles. Seja na forma de explicar um tópico, seja no aprender um novo método, ou admirar um artigo bem escrito.

O versátil Erik

Erik – meu co-autor em um recente artigo – tem um belo artigo aqui. Aqueles que temem a concorrência de um inteligente e versátil usuário de econometria aplicada já devem estar preocupados.

Mas não adianta tentar desencorajar um bom pesquisador. Gente assim, esteja onde estiver publica (bem).

Note que o artigo não é de desigualdade – área mais tradicional do Erik – mas sim de econometria aplicada. Em outras palavras, se você não disser nada sobre sua área, sempre haverá um econometrista aplicado pronto para fazê-lo. Aliás, sobre a econometria, eis uma polêmica opinião.

Aula de economia (nível intermediário)

Esta aqui é só para quem já leu ao menos um livro-texto de Macroeconomia do início ao fim (e não parou no meio por preguiça e passou a criticar a teoria sem entendê-la). O talento do Alex para destruir argumentos falacioso-fantasiosos é assustador.

Conceitos pterodoxos – I: “déficit técnico”

Ilan fala sobre a economia brasileira e sobre o bizarro termo acima citado. Termina seu artigo assim:

Em suma, a economia brasileira não conseguiu desacoplar-se do resto do mundo. A queda do PIB do final do ano passado foi severa e tem implicações sobre o crescimento deste ano. A “herança estatística” é uma queda adicional do PIB neste primeiro trimestre do ano e um carry negativo de 1,5% para o ano. Mesmo com uma recuperação saudável no segundo semestre deste ano, prevemos que a economia deva ainda retrair-se em 2009 um pouco além de 1%.

Será que ele tem razão? Tudo depende de como o PIB reage às crises e às políticas econômicas de curto prazo. Conversamos eu e o Erik (Moral Hazard) por alguns dias sobre o tema. Além disso, tenho feito várias observações aqui sobre o tema. Procure aí na caixa de buscas por “raiz unitária”. O debate, nos EUA, é bem mais rico do que aqui (basta acompanhar os blogs de acadêmicos de lá). Tem nosso PIB tal propriedade? Tentamos pensar sobre o tema, mas acho que o trabalho dele (citado aí em cima) parece ser o estudo mais atual sobre o problema. 

De qualquer forma, meus alunos de Econometria certamente ganharão muito se analisarem o problema. Eu, aliás, tenho pensado muito nisto.

O debate da raiz unitária…no Brasil

Prometi um texto maior sobre a – obviamente – relevância do debate da existência de raiz unitária no PIB. Chamei a atenção, anteriormente, do leitor do blog para o debate nos EUA. Erik, por sua vez, resumiu bem a intuição neste texto. Leia as cinco primeiras páginas deste artigo e você entenderá o debate. Aliás, Erik encontrou fortes evidências favoráveis à existência de raiz unitária no PIB brasileiro.

Significa isto (a existência de raiz unitária no PIB), basicamente, que políticas econômicas podem alterar a trajetória de longo prazo da economia de uma forma bastante séria. A visão antiga – muito comum em capítulos iniciais de livros de macroeconomia – é a de que uma recessão no curto prazo seria apenas um desvio de uma tendência fortíssima de crescimento gerada pelos fatores reais da economia (estoque de capital físico, quantidade de trabalhadores, capital humano, etc). 

Em síntese: se o PIB tem raiz unitária, políticas econômicas desastrosas podem nos condenar a uma trajetória de longo prazo pior. Nada desta história maravilhosa de voltar à tendência de longo prazo. Em verdade, há quem diga que a política econômica “não teria importância no curto prazo”, neste caso. Não sei se esta é uma boa interpretação da hipótese de existência de raiz unitária. Basta lembrar que existem muitos outros aspectos de política econômica do que apenas a política fiscal ou monetária.

Mas voltemos ao problema. Já citei aqui que o debate, lá fora, está em outro nível (mesmo). Mas o que dizem autores brasileiros sobre nosso PIB? Há ou não raiz unitária?

Fava & Cati (1995) encontraram evidências mistas para o Brasil. Mas o trabalho – clássico – estaciona o estado das artes em mais de dez anos. Lima, Lopes, Moreira & Pereira (1995) encontram evidências favoráveis à hipótese de raiz unitária na série do PIB. Aguirre & Ferreira (2001), por sua vez, não encontram evidências de raiz unitária. Finalmente, o já citado Erik, Figueiredo (2006), com um teste diferente, encontra resultado favorável à existência de raiz unitária.

Poderíamos continuar indefinidamente (realmente esta era minha intenção ao iniciar este texto), mas eu teria que detalhar aspectos de cada artigo. De qualquer forma, só posso dizer uma coisa: aguardem que vem novidade aí.

p.s. ver também Figueiredo & Leite Filho (2005).

A raiz unitária, cada vez mais, na blogosfera, dentre outras coisas…

O leitor deste blog já viu que não vamos nos livrar desta discussão tão cedo. Pois eis mais duas discussões: DeLong e Boldrini e DeLong. Ontem eu coloquei aqui o link para um post do Erik, sobre o mesmo tema. Creio que é um bom resumo do que DeLong gostaria de entender melhor e, sim, ainda há mais para se fazer nesta área.

Pergunta para o leitor: o que a raiz unitária e a discussão macroeconômica têm em comum? Dica: procure no seu livro de econometria.

Raiz unitária – novamente

Erik contribui no debate sobre o tipo de tendência do PIB norte-americano. Por que este debate é importante? Bem, se você acha que esta briga de economistas sobre o pacote de Obama é só retórica (bem, há os que realmente ficam só na retórica, mas não dá para dialogar com estes…), está enganado. Qualquer economista sério sabe que as prescrições de política econômica têm tudo a ver com o tipo de tendência do PIB. 

Um pouco de econometria não faz mal. Dê uma olhada no artigo dele. Se eu tiver tempo, farei um artigo pequeno, no blog do NEPOM, sobre o tema. Mas só se tiver tempo.

A raiz unitária

Chinn entrou na discussão de Mankiw e DeLong sobre a natureza da tendência do PIB norte-americano. As discussões são interessantes porque quem aprende econometria de séries de tempo não tem como não perceber que a discussão da crise atual tem muito a ver com o tema. Não que toda a crise se resuma nisto, mas sem entender os conceitos de trend-stationary e difference-stationary, você fica só no feijão com arroz…

Mankiw ensina economia para leigos

Sim, sim. Ele faz isto com seu excelente livro-texto. Mas, no caso, eu falo da ajuda que ele acaba de me dar para meu curso de Econometria II. Onde? Aqui. Os alunos reconhecerão a matéria recém-ensinada (ahã, antes do carnaval) neste pequeno texto.