Momento R do Dia – Lady Gaga impulsionando as buscas no Google ou as visualizações na Wikipedia?

Muita gente gosta de Lady Gaga. A prova de seu sucesso? Bem, há várias métricas: receitas de shows, receitas de CD’s ou DVD’s e, claro, presença na internet.

Uma questão que às vezes me faço é: como é que esta tal de “presença na internet”? Digo, como é que se mede isto? Parece que existem várias formas. Bem, eis uma sugestão: o sujeito ouve falar de Lady Gaga, vai à internet, consulta o Google e depois vai até a Wikipedia para ler mais detalhadamente sobre o fenômeno pop. Ou…

…o sujeito ouve falar de Lady Gaga, vai à internet, consulta a Wikipedia e depois vai ao Google procurar mais informações sobre o fenômeno pop.

Notou a sutileza? Pois é. Para simplificar o problema, vou dizer que não estou muito preocupado com o Twitter por enquanto (isso fica para outro exercício). Por enquanto, vamos usar o que aprendemos com este pacote do R para a Wikipedia e um pouco de mão-de-obra braçal com o Google Trends.

Primeiro, o que eu chamaria uma medida de sucesso na Wikipedia: a distância positiva em relação à média de visualizações de páginas.

lady_gaga

A linha vermelha mostra a série normalizada (média zero e variância unitária) das visualizações do verbete “Lady_Gaga” na Wikipedia inglesa. O mesmo para a língua castelhana na linha azul e, a linha verde, claro, mostra-nos o mesmo, mas para a Wikipedia de língua portuguesa. Imagino que a consulta seja mundial, mas não tenho a origem dos acessos. Não importa. O que importa é que Lady Gaga é, de fato, um fenômenos durante boa parte da série. Afinal, independentede da língua, há um descolamento positivo (em relação à média) em todas as três séries entre, digamos, 2009 e 2013.

Os dados, só para você saber, são diários. Por que estou dizendo isto? Porque o Google Trends nos dá dados semanais. Pois é. Uma dor de cabeça. Para simplificar, fiz a busca por “Lady Gaga” no Google Trends, na opção Worldwide. Minha hipótese é que não faria muita diferença, haja visto o que encontrei ali em cima. Para você ter uma idéia, eis um esboço das séries semanais do Google Trends e da Wikipedia (apenas língua inglesa.

lady_gaga_1

Não sei vocês, mas, ao ver este gráfico, eu me surpreendi. Achava que haveria alguma coincidência, mas nem tanto. Bom, meu exercício – sujeito a várias críticas, eu sei – foi o seguinte: verifiquei o número de raízes unitárias em cada série e descobri que ambas eram I(1), ou seja, cada uma delas tem uma única raiz unitária (e, não, as duas séries não cointegram).

Posto isto, tomei a primeira diferença de cada uma e tentei verificar a questão simples que coloquei ali em cima: será que são as visualizações da Wikipedia que levam o internauta ao Google ou será o contrário?

Não há, em princípio, uma teoria clara para me guiar nesta busca. Assim, fiz um teste simples: causalidade de Granger, mas com vários comprimentos de defasagens (de 1 a 15…ou seja, no limite, a causalidade seria de 15 semanas…). Não chequei os resíduos de cada sistema de equações (isto ficará para um próximo exercício), mas eis o que encontrei, em resumo.

H0A: Buscar “Lady Gaga” no Google não Granger-causa visualizações na Wikipedia.

Usando como critério um alfa de 0.001 (1%), esta hipótese é rejeitada para os seguintes comprimeintos de defasagem: 1 e 2 (para as defasagens mais altas, há alguma não-rejeição, mas sempre mais fraca do que a segunda hipótese nula.

H0B: Visualização de “Lady Gaga” da Wikipedia não Granger-causa busca no Google.

Neste caso, sob o mesmo critério de 1% de significância, a hipótese é rejeitada sob todas as estruturas de defasagem utilizadas.

Assim, temos evidências de que a consulta inicial é na Wikipedia e, depois, no Google.

Ok. O exercício deixa de lado diversas outras questões (e, sim, eu o estou usando para praticar e, posteriormente, fazer algo mais interessante do ponto de vista da econometria aplicada) como as próprias séries em si (basta pesquisar um pouco nos links indicados para entender melhor sobre o que estou falando).

Mas é um exercício interessante, não? Ah sim, não sou fã da Lady Gaga. Apenas achei engraçado o padrão do gráfico inicialmente apresentado. A partir dele, algumas questões surgiram e, bem, terminamos neste blog.

Até a próxima.

p.s. Desta vez, sem códigos.
p.s.2. Sim, eu resolvi investigar eventos que poderiam causar este deslocamento das séries em relação às suas médias. Mas não obtive nada muito sólido ainda. Talvez eu continue investigando.

Anúncios

Uma resposta em “Momento R do Dia – Lady Gaga impulsionando as buscas no Google ou as visualizações na Wikipedia?

  1. Pingback: Diagrama de Dispersão bacana! | De Gustibus Non Est Disputandum

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s