Ciência e resultados que podem ser reproduzidos ou “civilização vs barbárie”

Sua empresa quer saber o que afeta a demanda pelo produto. Aí ela contrata um consultor que pega os dados e entrega um resultado que não consegue ser replicado usando todos os passos que o próprio consultor lhe fornece no relatório final.

Chato? Totalmente.

Seu aluno diz que fez uma regressão e achou um resultado interessante, mas não quer mostrar a base de dados. Aí você descobre que ela nunca existiu.

Chato? Totalmente.

Seu conhecido leu um artigo com implicações políticas importantes e pesquisadores tentam replicar o resultado usando os dados originais e descobrem que os dados originais não eram o que os autores do artigo disseram ser.

Chato? Totalmente.

Muita gente não aprecia e/ou não entende a importância de se fazer pesquisas que sejam reproduzíveis. Há alunos que me olham com uma cara de sono ou indiferença. Eles pensam que o problema é só “acadêmico” (aliás, o cara que mais separa a pesquisa acadêmica do mundo real é o aluno que não quer estudar. O segundo cara é o picareta que não quer concorrência de alto nível e inventa esta separação para proteger sua fatia de mercado…).

Os exemplos acima mostram que o problema é muito mais sério. A cultura de “feudalização” de bases de dados não sobrevive ao teste da academia. No longo prazo, a reprodução dos resultados é inevitável. Há tempos que bons journals norte-americanos exigem que a base de dados seja entregue junto com o artigo submetido. Faz todo sentido, não?

Colonização e História Econômica

A colonização se paga?

Colonial adventures in tropical agriculture: new estimates of returns to investment in the Netherlands Indies, 1919–1938

Frans Buelens and Ewout Frankema
Abstract
How profitable were foreign investments in plantation agriculture in the Netherlands Indies during the late colonial era? We use a new dataset of monthly quoted stock prices and dividends of international companies at the Brussels stock exchange to estimate the returns to investment in tropical agriculture (1919–1938). We adopt the Dimson–March–Staunton method to compute real geometric annual average rates of return and assess our estimates in an international comparative perspective. We find that returns to colonial FDI in the Netherlands Indies during 1919–1928 were impressive (14.3 %), being almost 3 percentage points higher than the world average. In the following decade 1929–1938 fortunes reversed, with a rate of return of −2.8 % compared to a world average of 2.2 %. Over the entire period the returns to colonial FDI (5.4 % in 1919–1938) were about a factor 2.5 higher than returns to investment in the Dutch domestic economy (2.1 % in 1920–1939). We argue that these returns should be interpreted in a colonial context of systematic labour repression, but that they may also partly reflect a higher risk-premium of investments in colonial commodities.

História econômica é legal, né?

Conspirações derrubadas: o caso dos malvados bancos que comandam a política de juros

Vitor Wilher faz outro exercício interessante, aqui. Note que ele faz uma aplicação criativa de uma regressão que só contém o intercepto como variável exógena (algo bem exemplificado aqui).

Mais uma dica sobre gráficos

Todo mundo adora o Wickham. A admiração não é gratuita: ele é um dos maiores especialistas em visualização de informações (que eu já vi? Do mundo?).

Eu já dei outras dicas de como (não) se deve fazer gráficos por aqui, neste blog (use a caixa de busca aí no alto). Acho que esta é mais uma (e uma boa dica). Especial atenção à teoria da abóbora que ele usa em sua explicação. O curso completo está aqui.

Momento R do Dia – organizando dados

Um dos méritos do R é a facilidade em analisar bases de dados. Na prática (não na vida boa da sala de aula, na qual o professor geralmente te dá uma base de dados razoavelmente arrumada), as bases de dados nos chegam de uma forma bem bagunçada.

O exemplo de hoje usa o pacote plyr e o comando ddply. Baseado nestes ótimos exemplos, resolvi fazer uma aplicação com os dados do relatório de transparência do Google (ver post anterior).

Para você ter uma idéia da base, eis uma rápida visualização da mesma.

google_transp

Repare que a mesma está ordenada por países (embora isso não faça a menor diferença para o que farei a seguir). Outra coisa: os dados são semestrais, por isso os dados são sempre em junho ou dezembro. Nosso exemplo usará apenas a variável “Court Orders”, calculando estatísticas básicas para a mesma, por países e anos.

Eis as duas linhas de comando (uma para invocar o pacote e outra para fazer o que estamos nos propondo).

library(plyr)
ddply(dados, c("Period.Ending", "Country"), summarize, 
      N=sum(!is.na(Court.Orders)),
      mean=mean(Court.Orders,na.rm=TRUE),
      sd=sd(Court.Orders,na.rm=TRUE),
      se=sd/sqrt(N))

Bastante sintético, não? Veja o resultado no corte da tela de resultados abaixo.

google_transp2

Legal, não? Na próxima versão da minha apostila (iniciada há algum tempo para um seminário no PPGOM-UFPel, agora com mais co-autores) incluirei um pouco mais de “argamassa” na parte de organização dos dados.

Liberdade de imprensa…

Lembra deste texto? O que mudou desde então, nos itens dos últimos parágrafos, aqueles que falam do Google? Primeiro, a maneira como eles divulgam o relatório mudou. Em segundo lugar, nosso governo continua muito ocupado reclamando do conteúdo publicado sobre ele mesmo ao invés de cuidando da inflação, crimes, etc.

Arrisco quase a dizer que há uma tendência – extremamente preocupante – crescente nos dados, a despeito do pico no final de 2012. Será? Bem, há várias organizações que se dizem “liberais” (ou “libertárias”) no Brasil. Eles devem ter gente qualificada para uma análise mais fundamentada dos dados. Fica a dica.

censura_governoUPDATE: A tendência não é clara, mas eis os dados anuais para o Brasil:

liberdadedeimprensa2

Em termos mundiais, as médias do país estão mais ou menos assim:

liberdadedeimprensa1

Repare que “court_orders” e “exec_police_etc” são os itens considerados pelo Google ao fazer os gráficos que apresentam em no link da imagem inicial deste post. Infelizmente, eles só têm dados semestrais, o que limita bastante o escopo da análise.

De qualquer forma, vale a pena trabalhar mais nestes dados, não?

O multiplicador fiscal keynesiano no Brasil é de…

…0.5 ou menos. Eis o trecho:

We find historical fiscal multipliers for Brazil around 0.5, larger than what existing literature typically identifies for the average emerging market. However, spending and public credit multipliers seem to have dropped to near zero since the global financial crisis, as the estimate for the whole sample period (1999−2014) is about ½ of that for pre-crisis years. By contrast, revenue multipliers have remained broadly stable. We conclude that fiscal consolidations based on expenditure and public credit retrenchment are likely to entail a modest drag on growth in the near term.

Na literatura, para os EUA, há o artigo da Valerie Ramey (Ramey, Valerie A. 2011. “Can Government Purchases Stimulate the Economy?” Journal of Economic Literature, 49(3): 673-85) em que encontramos:

This essay briefly reviews the state of knowledge about the government spending multiplier. Drawing on theoretical work, aggregate empirical estimates from the United States, as well as cross-locality estimates, I assess the likely range of multiplier values for the experiment most relevant to the stimulus package debate: a temporary, deficit-financed increase in government purchases. I conclude that the multiplier for this type of spending is probably between 0.8 and 1.5.

Ou seja, nossa tão festejada política fiscal espansionista anda bem menos eficaz do que pensávamos. Até nosso parceiro comercial que, supostamente, está em crise (não é o que parece, ultimamente…) está melhor do que a gente e olha que o multiplicador é baixo. Afinal, o que você aprendeu no livro-texto é que o multiplicador é maior do que 1 (um).

Ficou mais interessante agora, né?

Tudo o que você queria saber sobre o AIC mas nunca te contaram

Prof. Akaike, falecido em 2009.

Rob Hyndman, autor de um ótimo livro de previsão (e de um dos melhores pacotes para R, em termos de séries de tempo univariadas), tem dez fatos sobre o AIC que geralmente a gente nunca sabe. Gosto, principalmente, do último:

The AIC is not a con­sis­tent model selec­tion method. That does not bother me as I don’t believe there is a true model to be selected. The AIC is opti­mal (in some senses) for fore­cast­ing, and that is much more impor­tant in my opinion.

Não sei se eu acho que previsão é mais importante sempre, mas, sim, não devemos nos prender à fantasia de que existe um modelo verdadeiro. Diversos alunos olham para mim como se eu fosse um vendedor de falsos remédios porque eu digo que modelagem econométrica é difícil. Alguns são preguiçosos mas, outros, claro, acham que eu sou idiota e que um dia encontrarão um professor que lhes mostrará a pedra filosofal.

Eles não fazem idéia do quanto estão errados. Eu sei disso, você, creio, também, e mais um monte de gente também. Mas vai falar isso para o aluno que não quer acreditar na inexistência do modelo ‘verdadeiro’…

Só o amor incondicional salva ou “Love is all we need”

Muita gente se queixa da falta de amor na teoria econômica. Não mais. Neste texto para discussão de Bhatt, Ogaki & Yaguchi (2014), temos, finalmente, o amor. Eis o básico do modelo.

love_is_all_we_need

A primeira equação é a restrição (tempo gasto em trabalho (L) mais o restante do tempo gasto em atividades altruístas (R1…RN)) totaliza, por normalização, a unidade. Em seguida, a função de utilidade diz respeito ao bem-estar derivado do próprio consumo e ao derivado do consumo dos outros.

Mas o melhor é a definição, não é? Ah sim, da conclusão temos:

In behavioral economics, there are some important difficulties with this ethical evaluation system, because preferences change endogenouslyin most models. There are many possible preferences for each individual in these models, and some preferences may be viewed as ethically better than others. This causes difficulties in taking welfare as the highest value. This paper proposed to use a different ethical evaluation system in which unconditional love is taken as the highest value. [p.36]

Teoria econômica é bacana, né? Ah sim, tem lá uma discussão sobre aquela coisa engraçada, o tal paternalismo libertário do Susstein.

Momento R do Dia – Meta de inflação e Selic

Meta de inflação, Selic e um exercício do livro-texto

O Rodrigo de Losso Bueno, na segunda edição do seu livro, incrementou a econometria com exercícios não apenas teóricos, mas empíricos. Lá na p.224, ele tem uma nota importante, a nota 6.10, na qual chama a atenção para a importância de se diferenciar um teste de causalidade de Granger de um teste de exogeneidade. Diz ele:

Teste de causalidade de Granger não é a mesma coisa que teste de exogeneidade. Para que zt seja exógeno a yt, é preciso que zt não seja afetado contemporaneamente por yt. A forma reduzida do VAR não permite que se faça esse tipo de teste. O teste de causalidade de Granger inclui, pois, valores correntes e passados de yt sobre zt. [op. cit, p.224]

Creio que a interpretação do trecho acima é a seguinte: você pode estimar um VAR e testar a causalidade (efeitos das defasagens de uma variável em outra) e, ao mesmo tempo, fazer um teste de causalidade instantânea (embora o nome “causalidade”, neste caso, seja inadequado como apontado por Bueno e também por Lütkepohl (2006)).

Ao R!

No R, podemos utilizar  um comando para verificar a causalidade instantânea (que na verdade não seria uma “causalidade”, mas a “exogeneidade”) e, também a causalidade de Granger.

Antes de começar, vamos seguir o autor e considerar que as séries devam ser estacionarizadas (cada uma apresenta exatamente uma raiz unitária, por hipótese porque…estou com preguiça de fazer os testes novamente, já fiz isto em outros Momentos R neste blog, anteriormente, ok?).

Eis os gráficos das duas séries, para você ter uma idéia superficial das mesmas.

plots_meta_efetiva

De posse dos dados, criei a matriz com duas variáveis e fiz os testes. Eis o script:

library(vars)
var<-cbind(meta, efetiva)
dmeta<-diff(meta)
defetiva<-diff(efetiva)
dvar<-cbind(dmeta, defetiva)
head(dvar)

dvar2<-VAR(dvar, p=20,type="const")

causality(dvar2, cause = "defetiva", vcov.=vcovHC(dvar2))
causality(dvar2, cause = "dmeta", vcov.=vcovHC(dvar2))

O VAR foi feito com os dados diários e com vinte defasagens, tal e qual no exemplo de Bueno. Vejamos os resultados do comando causality (repare que usamos erros-padrão robustos). Primeiro, a hipótese de que variações na Selic causam variações na Meta.

> causality(dvar2, cause = “defetiva”, vcov.=vcovHC(dvar2))
$Granger

Granger causality H0: defetiva do not Granger-cause dmeta

data: VAR object dvar2
F-Test = 0.25895, df1 = 20, df2 = 3654, p-value = 0.9996

O resultado nos diz que dificilmente rejeitaremos a hipótese nula de que a Selic não Granger-causa a meta de inflação, o que é razoável, na lógica do sistema de metas, não? Mas há outro resultado para se analisar.

$Instant

H0: No instantaneous causality between: defetiva and dmeta

data: VAR object dvar2
Chi-squared = 881.7, df = 1, p-value < 2.2e-16

A segunda parte dos resultados é um teste de “causalidade instantânea”. Na verdade, é um teste para ver se há dependência contemporânea entre as variáveis. As evidências são favoráveis à existência da mesma. Vale ressaltar que Lütkepohl (2006) chama a atenção para o caráter problemático de se querer interpretar este teste de “causalidade instantânea” como um teste de “causalidade” de fato (um ponto que também é levantado por Bueno na nota citada).

Agora, vejamos a outra parte da resposta.

> causality(dvar2, cause = “dmeta”, vcov.=vcovHC(dvar2))
$Granger

Granger causality H0: dmeta do not Granger-cause defetiva

data: VAR object dvar2
F-Test = 2.2395, df1 = 20, df2 = 3654, p-value = 0.00124

Neste caso, dificilmente deixaremos de rejeitar que a meta não-Granger cause a Selic. Isto reforça a causalidade unilateral da Selic para meta, que é o que geralmente imaginamos ser o que ocorre quando se usa a taxa de juros nominal como instrumento no arcabouço do sistema de metas.

$Instant

H0: No instantaneous causality between: dmeta and defetiva

data: VAR object dvar2
Chi-squared = 881.7, df = 1, p-value < 2.2e-16

Novamente, encontramos evidências de causalidade instantânea (endogeneidade) entre as variáveis.

Veja, os resultados podem estar ligeiramente diferentes dos de Bueno. Bem, estamos usando pacotes econométricos distintos, algoritmos distintos e ainda estou com erros-padrão robustos. Mesmo assim, o que é interessante, os resultados principais são os mesmos: a causalidade é unilateral mas encontramos também evidências de que ambas as variáveis são endógenas no sentido de que há efeitos contemporâneos da meta sobre a Selic e vice-versa.

Comentários?

Para entender mais e melhor

Bueno, Rodrigo De Losso da Silveira. Econometria de Séries Temporais. Editora Cengage, 2a edição. 2012.

Lütkepohl, H. New Introduction to Multiple Time Series Analysis. Springer Verlag, 2006.

Econometria e hipóteses

David Friedman tem um belo texto, aqui. O tema? Avaliações de professores. O legal é que os pesquisadores fizeram algo realmente relevante agora:

It judged the quality of teachers by how well their students did in later courses,  compared the result to student evaluations of teaching quality, and found that the two anti-correlated. On average, good teachers get bad ratings, bad teachers get good ratings.

As avaliações que já vi sofrem de todo tipo de problema e um deles é que não se olha para o futuro, apenas para o passado. Então, o estudo citado por Friedman já ganhou minha atenção e boa vontade.

Além disso, há aspectos que são importantes para gerar viés nas respostas. O primeiro deles, comum em alunos pelo mundo todo:

The most obvious one is that many students don’t like to work hard. A professor who does not assign much homework or reading and grades easily might get better ratings, from many although not all students, than one with the opposite pattern. My daughter, as a student at Oberlin, was struck by the fact that most of the other students in a class were happy when, for some reason, it didn’t meet. The same pattern—study seen as a cost, not a benefit—might well apply here.

Em segundo lugar, a dificuldade de se lidar com idéias difíceis de serem apre(e)ndidas:

There is a second and less obvious possible reason. Correct ideas are frequently hard. Easy ideas are frequently wrong. My standard example is from popular discussions of foreign trade issues. Most of them take for granted a view of the economics of trade, the view implicit in terms such as “unfavorable balance of trade,” that  economists refer to as the theory of absolute advantage. That particular view of the subject has been obsolete for about two hundred years. But while the theory of absolute advantage does not make sense if you think about it carefully, it is considerably easier to understand than the theory of comparative advantage, which does. That is why the former was worked out first and why it has had such a successful postmortem career.

David Friedman foi ao ponto: (a) falta de vontade estudar e (b) tópicos difíceis de serem entendidos combinam-se de forma a gerar uma tendência em jogar a culpa em terceiros (sociedades mais emporiofóbicas, acredito, possuem esta característica, pois reputam o sucesso individual muito mais às conexões com terceiros ou sorte do que com o esforço próprio, mas isto é uma hipótese para discutirmos outro dia).

Aplicações de R e econometria que nos alegram: o dia em que o passeio aleatório foi à Nasdaq

Eis um, envolvendo o Nasdaq. O bacana deste post é que o autor motiva o uso da econometria com uma pergunta bem simples.

Analyzing the evolution of NASDAQ-100 stock prices can discover some interesting couples of companies which share a strong common trend despite of belonging to very different sectors.

Obviamente, a pergunta de se as séries seguem uma tendência comum é conhecida entre nós, economistas, em termos técnicos como: as séries cointegram? Há vários jeitos de se estudar a cointegração sendo que o mais simples é conhecido como o procedimento de dois passos de Engle e Granger.

O legal é o que o autor encontra pares que reputa como “estranhos”.

Claro que são estranhos, mas será que esta “estranha” manter-se-ia no caso de utilizarmos uma metodologia de investigação de cointegração que não fosse apenas bivariada? Como exemplo para sala de aula, este pequeno texto é ótimo (vale a pena explorar os comentários também). Fica a dica.

Quanto mais longe…mais caro

O Leo Monasterio me deu a dica: Orbis, de Stanford. Ainda por cima vem com pesquisas (working papers) que aplicam o interessantíssimo Orbis como, por exemplo, esta. Veja que interessante o resumo:

Explaining the maritime freight charges in Diocletian’s Price Edict
Walter Scheidel
Abstract: Geospatial modeling enables us to relate the maritime freight charges imposed by the tetrarchic price controls of 301 CE to simulated sailing time. This exercise demonstrates that price variation is to a large extent a function of variation in sailing time and suggests that the published rates are more realistic than previously assumed.

Pois é. Império romano, frete marítimo e as leis econômicas, mais uma vez, em ação.

Cecília Meireles, os ciclos reais e a tecnologia pró-pobre

Que eu gosto de Cecília Meireles, ninguém mais tem dúvida. Desta vez, eu comprei um exemplar da Coleção Melhores Crônicas que é um volume todo dedicado à poetisa (um livro da Global, de 2003, reimpresso em 2012 pela quarta vez). O prefaciador, que também é o selecionador, Leodegário A. de Azevedo Filho, organizou as crônicas sob grandes temas. Obviamente, fui lá ver a Cecília professora. 

Veja só o que me fez a leitura de Cinema e Educação, crônica que ocupa singelas três páginas do livro (páginas 316 a 318).

Enquanto alguns passaram anos tentando ver no Pato Donald um ataque imperialista aos frágeis e inocentes valores brasileiros, Cecília Meireles foi assistir ao Fantasia de Walt Disney e gostou. Não que faça críticas. Por exemplo:

Fantasia seria mais interessante se outrsa fossem as músicas escolhidas – já que se desejavam fazer os desenhos sobre música. [p.317]

Mas, coerentemente com sua defesa do papel do educador como um sujeito que sempre se renova, ela afirma que a tecnologia não deve ser desprezada. Em suas palavras:

A técnica cinematográfica é desde muitos anos considerada auxiliar poderoso do professor, em todos os campos de ensino. [p.317]

O que ela diria do uso de video-aulas hoje? Nem preciso comentar, né?

Eu me lembro que uma professora de minha infância tinha receio de que eu não aprendesse a ler se continuasse apenas no mundo dos quadrinhos. Mas Cecília Meireles não pensava desa forma. Sobre o nosso amigo Mickey Mouse, ou melhor, sobre desenhos, ela disse:

“(…) em certos casos, só o desenho animado está em condições de tornar visíveis e compreensíveis coisas que, apenas através dos livros, parecem difíceis ou áridas”. [p.318]

Não se trata de uma visão passiva, de aceitação incondicional do desenho animado em sala de aula. Trata-se, isto sim, de aceitar os choques tecnológicos e reconhecer em que eles são ou não positivos (para fins de ensino). Em outras palavras: Cecília Meireles era simpática a choques do lado da oferta (economês puro, né?).

Vale a pena lembrar a sensibilidade social de Cecília Meireles com um longo parágrafo que, por sinal, encerra seu belo texto.

Além disso, é o cinema uma grande livro que pode ser visto, ao mesmo tempo, por um grande píublico – e uma boa coleção de filmes científicos, fortes e vivos, como essa pré-história de Walt Disney, equivaleria a uma biblioteca ambulante, indo até as populações rurais, até os iletrados, para os quais um locutor discreto, sem bizantinismos de linguagem nem de voz, serviria de explicador – ampliando a órbita de cultura das classes mais desfavorecidas. [p.318]

Os preconceitusos que me desculpem, mas inteligência é essencial e esta mulher a tinha de sobra. Cecília tinha uma visão claramente empreendedora do educador, sem dúvida. Uma visão moderna (o que ela diria do uso de computadores em sala de aula?), não necessariamente ingênua (sabemos que a tecnologia pode ser utilizada pelo aluno para não se concentrar na aula) e de um humanismo generoso!

Imagine um educador dizer que o Fantasia de Disney pode ser usado para levar cultura aos que mais dela necessitam. Hoje em dia, não duvido, surgiria alguém dizendo que tudo é relativo (exceto, paradoxalmente, esta frase), que música clássica é coisa de rico e que devemos dividir o Brasil entre pobres injustiçados e, portanto, honestos (“nós”)  e os canalhas (“eles”) e, assim, o correto seria usar desenhos feitos aqui sob a supervisão de um comitê de ideólogos, etc.

Cecília Meireles era grande demais para este Brasil mesquinho, eu sei. Mas, como sempre, eu acabo por enxergar algumas intuições econômicas muito interessantes em suas crônicas ou em suas poesias. Bem, esta é minha interpretação (outro tema que ela aborda neste texto: Fantasia como interpretação de músicas escolhidas e, como ela mesma diz: “(…) interpretação é coisa pessoal (…)”) de sua crônica.

Outra dica de gráficos

Leo Monasterio publicou (bom, eu vi no Twitter, mas acho que ele publicou) no blog dele esta dica. Acho que nós, economistas, temos que fazer este esforço para nos comunicarmos melhor com os não-economistas, não? Veja, não me importa se o gráfico segue ou não as normas da ABNT.

Um dos objetivos das normas da ABNT é facilitar a leitura de textos científicos, certo? Então, o ponto é: com ou sem regras da ABNT, devemos nos esforçar para apresentar melhor nossos dados. Caso a ABNT queira fazer parte disto, ótimo. Caso contrário, alguma norma nova surgirá da prática científica submetida à competição pela compreensão do leigo (soou meio hayekiano, não?).