Momento R do Dia

Na verdade, um texto interessante, que advoga o uso do R Markdown no ensino de Estatística. Talvez os professores de Estatística da nossa faculdade achem interessante. Você consegue acesso ao texto aqui.

Mas o que é R Markdown?

Melhor ver a descrição feita pelo pessoal do RStudio:

R Markdown enables easy authoring of reproducible web reports from R. It offers:

  • Easy creation of web reports from R that can be automatically regenerated whenever underlying code or data changes.
  • A highly accessible syntax (markdown) which lower the barriers to entry for reproducible research.
  • Output of a standalone HTML file (with images embedded directly in the file) that is easy to share using email, Dropbox, or by deploying to a web server.
  • Support for publishing dynamic and interactive web content.

This article includes an overview of how to use R Markdown within RStudio. For more specific details on syntax and implementation, see the R Markdown article.

O que o R Markdown faz? Primeiramente, ele não é um editor de texto. Nem uma planilha, ou um editor de slides. Não há “efeitos e animações”, exceto se você programar algum, claro. O que ele faz é gerar, em um único documento, a união de seus comandos no R e resultados do trabalho.

O artigo citado busca convencer o leitor da superioridade do R Markdown sobre algumas outras opções existentes (poucas, até onde sei), mas não creio que seja preciso argumentar muito (dá uma lida no artigo e veja se concorda comigo). Vantagens e limitações sobre seu uso são discutidas, bem como experiências em duas universidades.

Mas por que os autores se preocupam tanto com esta história de reproduzir resultados? 

Os autores apontam vários problemas ao tentarem avaliar trabalho de alunos porque os mesmos não são reproduzíveis (um problema comum e importante para professores de disciplinas similares como Econometria, Psicometria, etc). Por exemplo, o que há de errado em “copiar-e-colar” resultados do programa econométrico no editor de texto e entregar apenas o resultado? Cito um trecho (negrito por minha conta):

Since the commands used to generate the statistical output are not present in the final presentation, then either: a) the reader must assume that the student has calculated exactly what they say they have calculated, since there is no way of verifying the computation; or b) the grader must rely on the student to also copy-and-paste the commands used to generate the analysis. In either case, it will frequently be the case that the grader will be unable to completely follow the student’s work. Moreover, the issue of reproducibility is relevant not only for a second-party (i.e. a grader), but also for the student. Being able to retrace steps while studying for a fi nal, for example, is a desirable outcome. More concretely, the student may be reminded years later of the analysis, and seek to reapply the same methods in a diff erent setting. Having the commands separated from the results inhibits this process.

Ou seja, como o estudante vai aplicar o que aprendeu (supondo que foi honesto e não copiou o trabalho alheio) se só guardou o trabalho final? Das duas uma: ou copiou de alguém, ou é muito besta de não salvar todos os comandos pois, no final das contas, é isto que o ajudará em aplicações práticas, no futuro.

Não só isso.

Second, the separation of computation from analysis is not logical. The commands in an R script proceed chronologically, such that the analyst will most likely run the entire script all at once. A written report will be read in the same order, and there is no reason why the commands and analysis should not be interwoven.

Outra excelente observação, mas que não requer muitos comentários da minha parte. Mais importante, contudo, talvez seja o problema ético e suas consequências indesejáveis não apenas deste ponto-de-vista (novamente, negrito por minha conta):

Third, the separation of computing from presentation is not necessarily honest. At Smith College, a strict honor code – to which all students are bound – discourages cheating. But it is all too easy for a student copying-and-pasting output from one program to another to fudge a few numbers. Again, the divorce of the computation from the presentation enables the student to edit the content along the way. The possibility of getting “lost in translation” is disastrous for the data analyst. More subtly and less perniciously, the copy-and-paste paradigm enables, and in many cases even encourages, selective reporting.

 

Pois é. A questão científica novamente. No semestre passado, por exemplo, mostrei que a Econometria não é um exercício de “sempre-não-rejeitar-minha-hipótese”, pedindo que fossem estimadas três ou quatro funções consumo para a mesma base de dados. Com todos os problemas (gente que pegou o código e replicou sem pensar, etc), pelo menos um deles evitei: o da seleção de resultados reportados. Nem todos os alunos parecem ter se dado conta (ou apreciado) disto, mas, em algum tempo mais adiante, vão, na prática, sentir os efeitos disto, o que já está ótimo para mim.

Concluindo…

Fortemente sugiro que, se você gostou do que leu, faça um passeio pela página do RStudio que apresenta o R Markdown. Como relatei lá no Nepom, minha monitora de Microeconomia, por exemplo, não usa o R Markdown, mas já faz gráficos interativos como estes. Claro, lá você vai descobrir também o R Pubs, que pode ser útil para seus trabalhos.

Nunca usei o R Markdown em trabalhos de Econometria e talvez o Victor, o monitor da disciplina, ache isto interessante. Digo, talvez os dois monitores de, respectivamente, Econometria I e II, pensem que isto possa ser interessante. Talvez meu colega, professor de Econometria I, também ache, embora ele não use o R, o que não o impede de compartilhar comigo (e, de fato, ele compartilha) a visão de que que resultados de trabalhos estatísticos ou econométricos devem ser reproduzíveis.

Mas, você, usuário de Econometria, deveria considerar alguma forma de registro decente (não aquele amontoado de comandos dos quais você não se lembra depois) dos comandos que usa para gerar resultados para este ou aquele trabalho. Seja ou não com o R Markdown, como os autores ressaltaram, a vantagem para você, no final, é muito maior do que para nós, professores. Afinal, nunca se sabe o dia de amanhã e seu emprego confortável hoje pode dar lugar a um outro no qual você tenha um uso lucrativo de uma vantagem comparativa simples como a de saber usar o R.

O dinheiro é que é o vilão da história?

Aqui está a entrevista. Trechos:

O que ela precisa ser?
Precisa ser uma instituição de estudo, porque o ensino é consequente à pesquisa, ele não vem antes do estudo. Ao contrário. Só quem estuda é capaz de ensinar, ao passo que no Brasil, por interesse comercial, você enfatiza o ensino. O ensinismo inverte a equação, deixando a situação cada vez pior, cada vez pior… O cara que vai ser professor não precisa estudar, não precisa produzir. Ele simplesmente se apoia num manual qualquer. É o gráfico que se estabeleceu em cima da hora-aula. É isso que chamam de curso.

Mais um pouco:

O que o senhor acha das exigências da Nova Lei de Estágios, que demandam mudanças importantes nos cursos de graduação, licenciatura e bacharelado que preveem esse dado nos currículos?
O governo federal é responsável atualmente pela maior parcela do financiamento do mercantilismo, por meio das bolsas de estudo. Essas bolsas são um expediente para financiar os mercantilistas. Elas é que dão dinheiro para sustentar essas universidades particulares, que não são universidades. Aliás, as universidades federais também não são universidades. São arranjos das oligarquias locais em cada um dos Estados brasileiros.

Será isso mesmo? O dinheiro é a causa de todos os males e a solução está no setor público? Ou será que o problema é o rent-seeking incentivado pelo governo, como o mesmo entrevistado sugere no segundo trecho acima?

Talvez o entrevistado deva se inteirar dos problemas da produção científica no Brasil (um mundo do qual ele faz parte). Na Economia, artigos como este, este e este mostram os problemas dos incentivos criados pelo…governo federal (que o entrevistado parece ter em alta conta, a despeito da crítica sobre as bolsas) para gerar pesquisas, em economia. E em filosofia? Tem alguém preocupado com isto?

Um bom ponto para se começar a discussão é mudar o foco simplista sobre “dinheiro” versus (um super-suposto ad hoc) “espírito puro do pesquisador” e pensar no que disseram os artigos citados acima e também o nosso velho e sábio Ronald Coase: não existe tal coisa como o “avanço da ciência”, mas sim pesquisadores com interesses próprios que raramente são convergentes como qualquer debate científico, disputa por bolsas e as diferenças entre este autor e o entrevistado, por exemplo, revelam.

Em outras palavras, a entrevista toda pode ser analisada sob a ótica de um problema do tipo “agente-principal”. Aí começa o debate mais refinado. Será que temos pesquisadores brasileiros preocupados com isso? Quantos professores de economia que se debruçam sobre o problema do dilema “ensino-pesquisa” do ponto de vista microeconômico (incentivos!) você conhece? Sugestões são bem-vindas.

Fato não destacado pela faculdade…

…foi esta novidade: o PRIMEIRO artigo internacional de um economista do IBMEC-MG. Sim, estes caras que fazem a fama que o aluno, depois, conta para os tios no Natal. O nome do autor é Ari Francisco de Araujo Jr. O sujeito não é “mundialmente famoso (pelo que, exatamente?), nem reconhecido (principalmente pela Interpol?)”. Não é um “consultor famoso de auto-ajuda”, “colunista que finge saber de economia”, e nem é o sucesso do Porcão ou dos cassinos de Monte Carlo.

Nada disto.

Ele apenas trabalha muito e pesquisa. Coisa que, claro, não faz sucesso na era do “marketing pessoal” que vende gato por lebre para muita gente ingênua. Da próxima vez que for falar do seu professor, veja se ele ao menos sabe preencher seu currículo Lattes corretamente. Ari sabe.

Ah sim, ele também é co-blogueiro aqui, embora não muito presente.

Parabéns, Ari.