Uncategorized

Boxplots? Sim, mas com bons pratos e, quem sabe, uma boa cerveja?

Eu sei que você está em pleno Carnaval, comendo torresmo e casca de siri, não necessariamente nesta ordem. Provavelmente está tomando uma daquelas coisas horríveis que chamam por aí de cerveja. Bem, o efeito-substituição, muitas vezes, é mais forte do que o efeito-renda e depois a gente comenta sobre isto.

De qualquer forma, hoje vou mostrar como fazer um boxplot no R. Eu não fui acostumado a ler boxplots, mas eu não sou da geração Y! Tenho cérebro, mãos, olhos e curiosidade! Então, faço meu dever de casa. O que são estes tais boxplots? Diz-nos a Wikipedia:

In descriptive statistics, a box plot or boxplot is a convenient way of graphically depicting groups of numerical data through theirquartiles. Box plots may also have lines extending vertically from the boxes (whiskers) indicating variability outside the upper and lower quartiles, hence the terms box-and-whisker plot and box-and-whisker diagramOutliers may be plotted as individual points.

 

Box plots display differences between populations without making any assumptions of the underlying statistical distribution: they are non-parametric. The spacings between the different parts of the box help indicate the degree of dispersion (spread) and skewness in the data, and identify outliers. In addition to the points themselves, they allow one to visually estimate various L-estimators, notably the interquartile rangemidhingerangemid-range, and trimean. Boxplots can be drawn either horizontally or vertically.

No R, podemos fazer estes gráficos rapidamente.

Boxplots can be created for individual variables or for variables by group. The format is boxplot(x, data=), where x is a formula and data= denotes the data frame providing the data. An example of aformula is y~group where a separate boxplot for numeric variable y is generated for each value of group. Add varwidth=TRUE to make boxplot widths proportional to the square root of the samples sizes. Add horizontal=TRUE to reverse the axis orientation.

Então, vejamos um exemplo com o número de restaurantes no ranking dos melhores do mundo citado anteriormente neste blog.

Countries y2012 y2013
Argentina
Australia 1 2
Austria 1 1
Barbados
Belgium 1 1
Brazil 1 2
Canada
China 2
Denmark 2 2
Estonia
Finland
France 7 6
Germany 2 2
HK 1 1
India
Ireland
Italy 3 4
Japan 2 2
Kenya
Mexico 2 2
Monaco
Netherlands 2 1
Norway
Peru 1 2
Portugal 1 1
Russia
Singapore 2 1
South Africa
Spain 5 5
Sweden 3 2
Switzerland 1 1
Thailand 1 1
UAE
UK 3 3
USA 8 6

Faça-se a mágica! (sim, já entrei com os dados no R, zzzzz…)

boxplot(y2013~y2012, data=base, main=”Exemplo de Boxplot”,
xlab=”Restaurantes no Ranking em 2012″, ylab=”Restaurantes no Ranking em 2013″)

nhocnhoc

 

Pronto, gente. Agora, faz o dever de casa, vai lá na Wikipedia, lê, e veja como é que se lê este gráfico, ok?

p.s. Nenhum mimadinho da geração Y foi ferido ou morto durante a confecção deste texto. Chora, não vou ligar/chegou a hora/vai estudar/pode chorar/pode chorar…

Um comentário em “Boxplots? Sim, mas com bons pratos e, quem sabe, uma boa cerveja?

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s