As notas para derrotas e vitórias e as avaliações dos jogadores do Rio

Publicado por

Apesar do defeito de não ser um torcedor de futebol informado, sou curioso. Sempre vi que alguns jornais fazem avaliações dos times. São avaliações com notas e, em alguns casos, com palavras para sintetizar a atuação dos atletas. Coisa do tipo: “matador”, “lento”, “diferencial” e por aí vai. Bom, então sempre tive algumas perguntas que gostaria de tentar responder: como será o comportamento dessas notas? Será que em caso de vitória ou derrota elas tendem a apresentar um padrão? Há diferenças para notas por posição do jogador? E as palavras usadas para classificação a atuação do atleta. Quais são as mais frequentes? Vamos ao exercício…

 

A BASE DOS DADOS

Montei uma base de dados que coletei de um jornal do Rio entre os dias 01/09 e 06/10*. Depois, para ampliar mais a amostra, incluí os dez primeiros dias de agosto. Posteriormente, vou terminar a inclusão dos demais dias de agosto.

A base ficou então com 477 jogadores repetidos ou únicos. Desse grupo foi possível chegar a 464 notas, depois de excluir casos de jogadores que ficaram sem avaliação porque entraram no final da partida ou ficaram pouco tempo em campo.

Pela distribuição, 34% das notas são do Flamengo, 28% do Fluminense, 22% do Botafogo e 15% do Vasco. Portanto, as análises referentes ao Vasco têm esse fragilidade: trata-se de uma amostra menor, o que sempre implica maior imprecisão quando comparada com as demais.

 

LAMPEJOS, ARISCO E TRAVADO

Não poderia deixar de começar, é claro, analisando a grande variedade de palavras usadas para classificar a atuação dos jogadores. Foi bastante divertido, inclusive, ver os termos escolhidos, alguns deles bem criativos, como “disposição”, “xerife”, “tentou”, “apagado”, “travado”, “lampejos”, “arisco”.

Na imagem abaixo, podemos ver as palavras mais frequentes para casos de “derrota”, “empate” e “vitória”. Vejam se não é divertido. Há um padrão mais ou menos claro. De uma maneira geral, palavras com conotação positiva são mais usadas em casos de “vitória”, apesar de haver algumas que fogem a regra. Já aquelas com sentido negativo são mais comuns em casos de “derrota” e, claro, “empate”, porque time foi feito para ganhar, não é mesmo?

Painel 1 (14)

O resultado indica, pelo menos aparentemente, que as escolhas das avaliações são coerentes com os desempenhos dos times, sem entrar no mérito de qual palavra é mais ou menos adequada. (Em outro post, farei uma análise para testar essa associação) 

 

AS NOTAS VARIAM DE 3,5 A 7,5

O gráfico abaixo mostra a distribuição das notas, independentemente se foram de jogos com “derrota”, “vitória” ou “empate”. É possível notar que 90% delas se encontram entre 3,5 e 7,5. Há poucos casos abaixo de 3,5 ou acima de 7,5, indicando que há um padrão de evitar avaliações com muitos extremos.

Painel 2 (3)

EMPATES E DERROTAS SÃO QUASE A MESMA COISA

O segundo gráfico apresenta a distribuição das notas segundo o resultado das partidas. Note que há um padrão esperado. A média das notas das “vitórias” (6,7) é maior que aquela atribuída aos desempenhos dos jogadores no caso de “empate” (5,5) e “derrota” (5,2). Apesar de maior, não apresenta uma diferença muito grande.

O interessante é que não existe uma diferença aparentemente significativa nas médias para “empates” e “derrotas”. Ou seja, empate não empolga muito mesmo. Outro dado curioso. As notas para “derrotas” apresentam maior dispersão, indicando que há mais discrepância na hora de avaliar os jogadores quando eles perdem do que quando eles empatam ou vencem.

O gráfico utilizado para esses dados é o boxplot. Aparentemente parece complicado de entender, mas não é. Ele resume em três imagens uma série de informações sobre o comportamento das notas, como as mínimas (ponta da cauda inferior) e as notas máximas (ponta da cauda superior) de cada grupo de dados, no caso, “empate”, “vitória” e “derrota”. No caso elas não estão muito evidentes poque há pouca variação nos três conjuntos de dados.

No centro de cada caixa, em cinza, está a mediana de cada grupo de dados. Quanto maior ou menor, mais cada grupo se distancia dos demais, o que permite visualizar as diferenças entre eles. (Publicarei depois o comparativo das notas entre os times cariocas e também por posição do jogador)

Painel 3 (3)

 

 

______

A base de dados utilizou as notas e avaliações feitas pelo caderno de esportes do Globo. A escolha tem um motivo óbvio: no Rio é o jornal que cobre e faz avaliações quase diárias dos quatro grandes times do Estado (Flamengo, Fluminense, Botafogo e Vasco). Apesar da escolha, alerto que este post não tem o objetivo de encontrar chifre na cabeça de cavalo: supostamente deduzir viés dos jornalistas na avaliação. Futebol é mais divertido que isso e entendo que as avaliações não têm carácter científico. O post pode e deve ser lido, portanto, como um exercício (divertido) de como é possível trabalhar com dados, além, é claro, de servir de inspiração para os meus alunos de Jornalismo que desejam trabalhar com análise de dados em suas publicações.  🙂

 

Um comentário

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s