Momento R do Dia

Na verdade, um texto interessante, que advoga o uso do R Markdown no ensino de Estatística. Talvez os professores de Estatística da nossa faculdade achem interessante. Você consegue acesso ao texto aqui.

Mas o que é R Markdown?

Melhor ver a descrição feita pelo pessoal do RStudio:

R Markdown enables easy authoring of reproducible web reports from R. It offers:

  • Easy creation of web reports from R that can be automatically regenerated whenever underlying code or data changes.
  • A highly accessible syntax (markdown) which lower the barriers to entry for reproducible research.
  • Output of a standalone HTML file (with images embedded directly in the file) that is easy to share using email, Dropbox, or by deploying to a web server.
  • Support for publishing dynamic and interactive web content.

This article includes an overview of how to use R Markdown within RStudio. For more specific details on syntax and implementation, see the R Markdown article.

O que o R Markdown faz? Primeiramente, ele não é um editor de texto. Nem uma planilha, ou um editor de slides. Não há “efeitos e animações”, exceto se você programar algum, claro. O que ele faz é gerar, em um único documento, a união de seus comandos no R e resultados do trabalho.

O artigo citado busca convencer o leitor da superioridade do R Markdown sobre algumas outras opções existentes (poucas, até onde sei), mas não creio que seja preciso argumentar muito (dá uma lida no artigo e veja se concorda comigo). Vantagens e limitações sobre seu uso são discutidas, bem como experiências em duas universidades.

Mas por que os autores se preocupam tanto com esta história de reproduzir resultados? 

Os autores apontam vários problemas ao tentarem avaliar trabalho de alunos porque os mesmos não são reproduzíveis (um problema comum e importante para professores de disciplinas similares como Econometria, Psicometria, etc). Por exemplo, o que há de errado em “copiar-e-colar” resultados do programa econométrico no editor de texto e entregar apenas o resultado? Cito um trecho (negrito por minha conta):

Since the commands used to generate the statistical output are not present in the final presentation, then either: a) the reader must assume that the student has calculated exactly what they say they have calculated, since there is no way of verifying the computation; or b) the grader must rely on the student to also copy-and-paste the commands used to generate the analysis. In either case, it will frequently be the case that the grader will be unable to completely follow the student’s work. Moreover, the issue of reproducibility is relevant not only for a second-party (i.e. a grader), but also for the student. Being able to retrace steps while studying for a fi nal, for example, is a desirable outcome. More concretely, the student may be reminded years later of the analysis, and seek to reapply the same methods in a diff erent setting. Having the commands separated from the results inhibits this process.

Ou seja, como o estudante vai aplicar o que aprendeu (supondo que foi honesto e não copiou o trabalho alheio) se só guardou o trabalho final? Das duas uma: ou copiou de alguém, ou é muito besta de não salvar todos os comandos pois, no final das contas, é isto que o ajudará em aplicações práticas, no futuro.

Não só isso.

Second, the separation of computation from analysis is not logical. The commands in an R script proceed chronologically, such that the analyst will most likely run the entire script all at once. A written report will be read in the same order, and there is no reason why the commands and analysis should not be interwoven.

Outra excelente observação, mas que não requer muitos comentários da minha parte. Mais importante, contudo, talvez seja o problema ético e suas consequências indesejáveis não apenas deste ponto-de-vista (novamente, negrito por minha conta):

Third, the separation of computing from presentation is not necessarily honest. At Smith College, a strict honor code – to which all students are bound – discourages cheating. But it is all too easy for a student copying-and-pasting output from one program to another to fudge a few numbers. Again, the divorce of the computation from the presentation enables the student to edit the content along the way. The possibility of getting “lost in translation” is disastrous for the data analyst. More subtly and less perniciously, the copy-and-paste paradigm enables, and in many cases even encourages, selective reporting.

 

Pois é. A questão científica novamente. No semestre passado, por exemplo, mostrei que a Econometria não é um exercício de “sempre-não-rejeitar-minha-hipótese”, pedindo que fossem estimadas três ou quatro funções consumo para a mesma base de dados. Com todos os problemas (gente que pegou o código e replicou sem pensar, etc), pelo menos um deles evitei: o da seleção de resultados reportados. Nem todos os alunos parecem ter se dado conta (ou apreciado) disto, mas, em algum tempo mais adiante, vão, na prática, sentir os efeitos disto, o que já está ótimo para mim.

Concluindo…

Fortemente sugiro que, se você gostou do que leu, faça um passeio pela página do RStudio que apresenta o R Markdown. Como relatei lá no Nepom, minha monitora de Microeconomia, por exemplo, não usa o R Markdown, mas já faz gráficos interativos como estes. Claro, lá você vai descobrir também o R Pubs, que pode ser útil para seus trabalhos.

Nunca usei o R Markdown em trabalhos de Econometria e talvez o Victor, o monitor da disciplina, ache isto interessante. Digo, talvez os dois monitores de, respectivamente, Econometria I e II, pensem que isto possa ser interessante. Talvez meu colega, professor de Econometria I, também ache, embora ele não use o R, o que não o impede de compartilhar comigo (e, de fato, ele compartilha) a visão de que que resultados de trabalhos estatísticos ou econométricos devem ser reproduzíveis.

Mas, você, usuário de Econometria, deveria considerar alguma forma de registro decente (não aquele amontoado de comandos dos quais você não se lembra depois) dos comandos que usa para gerar resultados para este ou aquele trabalho. Seja ou não com o R Markdown, como os autores ressaltaram, a vantagem para você, no final, é muito maior do que para nós, professores. Afinal, nunca se sabe o dia de amanhã e seu emprego confortável hoje pode dar lugar a um outro no qual você tenha um uso lucrativo de uma vantagem comparativa simples como a de saber usar o R.

Anúncios

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s