Uncategorized

Outra dica de R e uma observação

O Cinelli, como sempre, dá-nos uma ótima dica de R. Desta vez, o assunto é a PNAD. Devemos agradecer ao Flavio Barros por isso. Ele, aliás, inicia seu texto nos lembrando do problema recente pelo qual passou o IBGE.

Com o erro recente na divulgação dos resultados da PNAD 2013, o nome do IBGE e também os resultados dessa pesquisa, chegaram na grande mídia de um forma muito negativa. Ainda assim, a maioria das pessoas desconhece o que é a PNAD, como esses dados são obtidos e como eles podem ser baixados e utilizados. Neste post vou fornecer uma breve explicação do que é PNAD, como esses dados são distribuídos (na forma de microdados) e como você pode facilmente obtê-los e utiliza-los a partir de ferramentas gratuitas como o R.

Veja como são as coisas. Como foi descoberto o erro da PNAD? Segundo consta, alguns pesquisadores estranharam os dados (gente que se especializou em certos assuntos, como nos ensina Adam Smith, pega estas coisas bem rápido). O uso do R, neste sentido, e a transparência na divulgação dos dados – que é uma característica do IBGE, vale dizer – só ajudam neste processo.

Ao longo da semana eu vi, com tristeza, o governo tentar fazer disso um ponto na campanha eleitoral. Um desrespeito, na minha opinião, ao trabalho de gente séria que existe no setor público, notadamente no IBGE. A imprensa, inclusive, tem sido muito tímida, quase medrosa, na cobertura dos fatos que lá se desenrolam desde então. Há um problema sério quando o governo tenta intimidar pesquisadores por meios burocráticos e isso sinaliza para uma argentinização indesejável em órgãos geradores de dados públicos tão importantes para análises de políticas públicas. Gostaria de ver mais discussões sobre isto na blogosfera.

Por outro lado, novamente, como é maravilhosa a liberdade e o seu bom uso por parte dos indivíduos. Caso existam erros, pesquisadores poderão encontrar rapidamente o erro e ajudar a corrigí-los se os dados são disponibilizados sem burocracias, sem véus autoritários, etc. Esta é a tecnologia de auto-correção que a própria internet e os avanços computacionais nos permitem hoje em dia.

Fica aqui meu desejo de boa sorte às pessoas não apenas do IBGE, mas de todos os órgãos públicos (em todos os níveis da federação e também em qualquer lugar do mundo), que valorizam seus currículos e não querem ser conhecidas por aí como funcionários de órgãos aparelhados que fazem maquiagem de dados, escondem pesquisas, etc. Torço por vocês, amigos!

Uncategorized

Sobre o erro do IBGE: dois pontos breves

Eu poderia falar um pouco sobre a virtude da concorrência, quando o próprio IBGE reconhece que chegou ao erro por comentários de outros pesquisadores, que estranharam os resultados. Também poderia falar do problema que a chefe do Mantega criou para si mesmo ao afirmar, peremptoriamente, que o papel da imprensa não é o de investigar, o que significa que ela quer que erros do IBGE ou de outros órgãos públicos jamais sejam alvo de investigação pela imprensa, indo na contramão do que eu disse três linhas acima.

É, eu poderia falar disso tudo. Eu sei. Mas eu prefiro falar de um outro aspecto importante: dados. Há muito o que falar sobre isso, mas eu nunca me esqueci das aulas que assisti na UCLA com o prof. Jean-Laurent Rosenthal. Em uma ocasião, ele falou mais ou menos com estas palavras, em sala que: quando usamos apenas dados públicos oficiais (obrigado, Monasterio, pela correção!), fazemos apenas as pesquisas que o governo quer que façamos, não as que queremos (ou poderíamos) fazer. O ponto, simples, é que você deveria dar mais atenção às suas aulas de Estatística, estudar um pouco e coletar seus dados quando esta coleta se encaixa mais na sua hipótese de trabalho.

O povo da História Econômica que não tem medo de calculadora sabe disto, pois coletam dados em fontes as mais inusitadas porque não podem esperar encontrar o que precisam nos arquivos do IBGE apenas.

No final do dia, o erro do IBGE não é tão diferente do erro de Rogoff e Reinhart, não é? O erro ocorreu e foi rapidamente corrigido, o que é um mérito. Isso me leva a um segundo ponto: a velocidade em que a informação circula hoje em dia. Os chamados dados em tempo real são uma realidade (estive na banca de doutorado de uma tese sobre o assunto há alguns anos) e, junto com ela vem a comunidade de economistas que publicam comentários na internet. Por enquanto, esta comunidade é livre, embora uma das candidatas esteja quase explicitamente fazendo uma propaganda enganosa contra a liberdade de expressão sempre que a “expressão” é contrária ao que ela acha bom para ela mesma.

O que acontece quando esta comunidade recebe o dado e o comenta em tempo real? Simples. Caso haja um erro, como este do IBGE, o comentário passa de alguma coisa (certa ou errada) para, definitivamente, errado. Claro, podemos discutir isso em graus, mas o fato é que não se pode analisar uma foto da realidade – a que nos é dada pelos dados (sic) – se a mesma está errada.

São dois pontos sobre os quais vale a pena pensar tomando um café. Dados que eu mesmo coleto (e como lidar com os erros de medida – sobre isto, veja o ótimo livro de Econometria – nível graduação – de Stock e Watson, em sua 3a edição) e a pressa em se analisar dados porque, no mundo atual, a disseminação de dados é muito rápida.

Uncategorized

Existem certas verdades…

verdades
“Ah, IBGE, vamos esquecer estes gráficos…abandonemos estes números frios dos economistas…a sociedade é paixão, amor, ternura…”.

Existem certas coisas que não mudam com o tempo. Uma delas é a discussão de metas e instrumentos de política econômica. Desde que William Poole publicou seu clássico artigo em 1970, muita coisa aconteceu: a discussão original de Friedman sobre regras foi aperfeiçoada, as expectativas racionais trouxeram muitas inovações tecnológicas na forma de se fazer política econômica e, claro, a Teoria dos Jogos mudou a visão, digamos assim, de engenharia para uma abordagem microfundamentada. De certa forma, aquela história de Hayek sobre o individualismo falso e verdadeiro (um ensaio famoso dele) teve um final feliz: a visão dos microfundamentos prevaleceu (embora nem tudo o que Hayek quisesse dizer com o artigo se transformasse em realidade).

Mas existe o lado político…

Parece um tanto quanto óbvio que fazer política econômica é um problema no qual não se pode ignorar nem o “política” e nem o “econômica”. Quanto ao segundo, estamos tranquilos. Mas quanto ao primeiro, a administração Yousseff, Rousseff não tem se mostrado lá muito virtuosa e seus apoiadores, inclusive, parecem descomprometidos com a verdade (basta ouvir o rosnar dos lobos em comentários agressivos, ameaçadores e violentos na rede, acompanhados de pedidos para demissões de jornalistas, etc).

O caso do IPEA e o do IBGE mostra que há um problema com o “política” acima citado. Não se quer fazer o dever de casa ilustrado pelo gráfico acima e se pretende roubar nas regras do jogo. Pressões políticas em órgãos públicos que coletam dados? Cerceamento dos mesmos via cortes orçamentários (enquanto outros gastos bem menos nobres continuam?).

O que as autoridades acham disto tudo?

Bem, não acham nada. Ou acham, mas não falam. Ou mentem. Até agora, não vi um único membro da administração atual chamar a imprensa e fazer uma barulhenta declaração de apoio ao IBGE ou contra pesquisas técnicas de baixa qualidade do IPEA. Vejo, sim, muito diversionismo e oportunismo com tentativas de bloquear uma CPI (fazia tempo que não via esta galera, que sempre pediu CPI em outros governos, fugir assim, de forma bem covarde, da briga) e muito rosnado contra inimigos imaginários.

Manifestações insanas…e o que você acha disto tudo?

Pois é. Até o tomate virou inimigo do socialismo bolivariano brasileiro. “Amarrem o tomate ao poste!”, pedem os militantes que ganham R$ 150,00 para quebrar propriedades privadas nas ruas. “Estuprem o tomate!, diz um professor de filosofia de uma universidade federal carioca. “Julguem o tomate, mas só se ele estiver verde ainda!”, berra o cronista gaúcho enquanto saboreia sua salada.

Já a boa Ciência Econômica…

Notem como, sutilmente, estão tentando desmoralizar a pobre Ciência Econômica. Querem espalhar por aí que o IPEA é um lixo, que o IBGE é tucano e que o bom mesmo é ensinar ideologia nas faculdades de Economia. A permissividade disfarçada de pragmatismo é a regra: deixa para lá, defender a lógica dá dor de cabeça. Daqui a pouco vão promover queima de livros de Adam Smith e David Ricardo e os chefes de departamento aplaudirão.

“Queimem os livros-texto de Economia! Queimem! Mais amor! Mais emoção! Menos números frios e sem coração!” Palmas! Palmas!
Uncategorized

O viés dos progressistas: lamentação pelo IBGE

Tanto no episódio do IPEA como neste péssimo episódio da PNAD do IBGE, o que não me espanta mais é o silêncio dos auto-denominados (e supostos) progressistas. Geralmente se dizem tolerantes com a divergência, mas não perdem a oportunidade de de cobrar, daqueles que deles discordam, uma suposta neutralidade porque, conforme dizem: sua opinião é viesada porque ideológica e a minha não. Cadê a neutralidade?

Pois é. Agora entendo a neutralidade deles: significa neutralidade de ação. Eles preferem se calar nestes episódios. Ou tentam arrumar uma desculpa para continuar sua agenda política como se a mesma fosse neutra (ou, como dizem: a sua é que não é neutra, logo…).

O ocaso do IBGE é perigoso. Repare que, mesmo para os admiradores do nacional-inflacionismo (nacional-desenvolvimentismo para alguns), que adoram o governo Médici (e também o do general Geisel), este é um péssimo precedente. Nem nos anos da ditadura houve tamanha interferência no órgão. Em democracias sérias, no outro extremo, isto também não ocorre.

O viés dos auto-denominados progressistas, para mim, está claro: além de carregarem a bandeira de neutralidade e diversidade enquanto praticam o oposto, eles se calam diante de perigosas interferências como estas.

Em ano eleitoral, com a credibilidade econômica reduziada a zero – e não falo do setor financeiro que, como o Ellery mostrou, é otimista e não pessimista, como afirma o “nervosinho” Mantega –  agora o governo começa a destruir a credibilidade daqueles que fornecem dados públicos. Combine a isto os poderosos interesses contrários a um bom desempenho no PISA e você terá um bando de gente analfabeta funcional que serve de massa de manobra ou para ações páramilitares no estilo black bloc contra os que discordam de você.

No final, você ainda vai achar que isto tudo é democracia, tolerância e diversidade, com o aval de alguns auto-denominados (e supostos) intelectuais que nunca perdem a oportunidade de ganhar um dinheiro governamental (= vindo do seu bolso) para divulgar suas idéias bovinas e dóceis ao governante da hora enquanto também achincalham adversários sérios ou não, imaginários ou não. Falam de “observar” (= vigiar e eliminar a divergência?) de imprensa, de democracia, mas o fato é que ninguém quer aprender sobre anos e anos de pesquisas sobre instituições e resultados econômicos ou políticos.

Pobres técnicos do IBGE. Passaram anos fazendo um trabalho sério, acreditando pessoalmente em alguns políticos ou partidos, obviamente, mas sempre separando o lado pessoal do profissional e, agora, isto. Não é só perigoso e triste: é frustrante.

Uncategorized

Função de Correlação Cruzada e a Galinha Pintadinha (Pópópó!)

Como é que é? Função de Correlação Cruzada? Quem aprendeu modelos ARIMA na graduação não deve ter ouvido falar dela. Só quando a turma acompanha a literatura, adianta-se ao material e aprofunda nos estudos é que o conceito surge. Ou seja, não é para todas as turmas que você tem a oportunidade de conversar sobre o tema (eventualmente, ex-alunos que leram o livro do Walter Enders saberão que o conceito está lá, explicado, em algum lugar…).

A melhor explicação rápida que já vi é a deste post. Citando:

The CCF is defined as the set of correlations (height of the vertical line segments in Fig. 2) between two time series xt+h and yt for lags h=0,±1,±2,. A negative value for h represents a correlation between the x-series at a time before t and the y-series at time t. If, for example, the lag h=3, then the cross correlation value would give the correlation between xt3 and yt. Negative line segments correspond to events that are anti-correlated.

The CCF helps to identify lags of xt that could be predictors of the yt series.

  1. When h<0 (left side of plots in Fig. 2), x leads y.

  2. When h>0 (right side of plots in Fig. 2), x lags y.

Pois é. Você entendeu. É fácil de fazer algo rápido.

Bom, se você leu o texto deve ter notado que o autor analisa temperaturas em algumas cidades da Austrália. Eu, como me preocupo com problemas mais relevantes para a filosofia, gosto de pensar em questões como esta (baseado no original de 1988).

Pois é. Ovo ou galinha? Quem vem primeiro? A pergunta geralmente é estudada com testes de causalidade de Granger (leia o artigo, ora bolas…), mas podemos dar uma olhada nas correlações cruzadas (estou olhando os níveis das séries: número de galinhas e mil dúzias de ovos). Os dados são relativos ao Brasil (a fonte é o IBGE e as séries foram construídas a partir de uma amostra original mensal no intervalo delimitado entre Jan/1987 e Dez/2013).

ovos6

Repare que há uma simetria e, portanto, basta olhar para um dos dois gráficos. A maior correlação cruzada ocorre em h = 0, que mostraria que não há precedência temporal de uma série sobre a outra. Aparentemente, as duas caminham juntas (a correlação é contemporânea, nem defasada, nem antecipada).

Acha que é assim em qualquer amostra? Não para os EUA (dados anuais, 1930-1983).

ovos_eua

Neste caso, a correlação é negativa e olhamos para o valor mínimo. em h = 13 e 14. Há precedência temporal entre as séries? Há e o pessoal que gosta do teste de Granger já deve estar retornando ao início deste texto. Para ser mais preciso, a gente tinha que ter os dados na mesma frequência. Aí a brincadeira ficaria mais interessante. Mas já é tarde e meus leitores (boa parte deles) está estudando para as provas. Então, fica para outro dia.

Os comandos em R são fáceis. Você pode replicar o que o blogueiro citado fez. É exatamente o que eu fiz aqui. Vou ajudar você com a base de dados original (embora os dados não sejam exatamente os mesmos, como se elucida aqui).

library(lmtest)
data(ChickEgg)
summary(ChickEgg)
plot(ChickEgg)
?ChickEgg
series<-ts(ChickEgg, start=c(1930), freq=1)
plot(series)
head(series)
chicken<-series[,c(1)]
eggs<-series[,c(2)]
head(chicken)
ccf(chicken,eggs, plot=FALSE)
pm<-ccf(eggs,chicken)
max.pmc <- max(pm$acf)
max.pmc
pm$lag[which(pm$acf > max.pmc-0.01 & pm$acf < max.pmc+0.01)]

Ok, não fizemos o teste de causalidade de Granger hoje, mas as dicas ao longo deste post já são suficientes para você tentar em casa, sem a supervisão de adultos.

Faz um teste de causalidade de Granger, faz! Pópópó!
Uncategorized

Datagerais e IBGE – pesquisando cidades lendárias. Episódio de hoje: Campo Belo

Não atualizam o site do Datagerais? O PIB dos municípios parou em 2009 lá no portal que agrega informações (não todas, mas algumas) sobre Minas Gerais. Ou é isto mesmo? Estamos sem medidas de PIB mais recentes?

Ah sim, eis a dica para se pesquisar, por exemplo, Campo Belo (para alguns, da faculdade, conhecido como Campoh Beloh) lá no Datagerais.

Para os fanáticos por imagens:

campohbeloh

É, eu sei, mas não é minha culpa. É a tal Campo Belo mesmo.

Outra opção é usar um pouco mais o Tico e o Teco (e o Google) e ir ao IBGE. Dentre outras, descubro que os casamentos e divórcios ainda preservam as famílias por lá. Obviamente, eu duvido que você sabia que esta cidade tinha mais de 14 mil automóveis registrados, heim? Você sabia? Claro que não!

Ok, embora a Wikipedia me informe que desconhece a bandeira de valoroso bastião da resistência bandeirante no interior destas Minas Gerais, não podemos deixar de admirar o brasão da patota.

Ok. Gostou? Quer que o professor comente sobre sua cidade aqui usando um pouco de estatística, gráficos e outros brinquedos legais? Deixe um comentário. Quem sabe você é agraciado na próxima, né?