Newsletter

Sua assinatura não pôde ser validada.
Você fez sua assinatura com sucesso.

Oficina de Clio - Newsletter

Inscreva-se na newsletter para receber em seu e-mail as novidades da Oficina de Clio!

Nous utilisons Sendinblue en tant que plateforme marketing. En soumettant ce formulaire, vous reconnaissez que les informations que vous allez fournir seront transmises à Sendinblue en sa qualité de processeur de données; et ce conformément à ses conditions générales d'utilisation.

quarta-feira, 22 de setembro de 2021

Para que servem as estatísticas?

O texto abaixo resulta de uma discussão virtual acerca das supostas tendências ideológicas e preferências políticas dos professores de Humanidades, mas trata mais amplamente da importância das estatísticas (bem como de seus limites) para a compreensão de fenômenos sociais em macroescala. Como estou longe de ser um especialista no assunto, espero que os leitotes tenham isso em mente - e, caso possivel, me sinalizem equívocos implorando por correção. Vale ressaltar ainda que, por se tratar de adaptação de conversa informal, há algumas digressões um tanto pitorescas; o mesmo vale para o uso excessivo da primeira pessoa.


A realidade é opaca para qualquer um de nós. Todos trabalhamos com percepções impressionistas de onde olhamos a realidade. Nenhum ser humano é capaz de ter uma perspectiva total da realidade, como salientava Leibniz (co-criador do Cálculo "newtoniano").


Qualquer espaço amostral é suscetível a falhas, por maior que seja. Isso vale tanto para pesquisas de opinião quanto experimentos de laboratório. É por isso que pesquisadores de ciências naturais geralmente realizam milhares e milhares de vezes o mesmo experimento e, mesmo assim, surgem os famosos "pontos fora da curva", que geralmente correspondem a ocasiões em que algo "deu errado" - uma distração do experimentador, uma falha boba na aparelhagem etc. Um experimento realizado apenas 100 ou 200 vezes tem margem de erro astronômica.


Outro detalhe importante é a POSSIBILIDADE de repetir experimentos, como salientava o hoje pouco lembrado Jean Piaget. Há muitos ramos das ciências naturais que não têm como repetir experimentos. É o caso da meteorologia, da astronomia, astrofísica, etologia etc etc etc. São ciências de observação. Um exemplo: quem estuda predadores em ambiente natural tem raras oportunidades de presenciar um "evento de predação". O que se faz, geralmente, é localizar carcaças de presas, pegadas frescas que indiquem uma perseguição recente (que muitas vezes não resulta em abate), ou fezes do predador - onde se encontram pelos, penas ou indícios microscópicos que permitam identificar quem-comeu-o-que-e-quanto. Obviamente precisa-se de milhares de amostras fecais para ter um panorama acurado da coisa. Da mesma forma, há efemérides astronômicas comuns, frequentes e até previsíveis e outras raríssimas, como supernovas (lembrando que só "vemos" supernovas milhares de anos depois que elas ocorreram).


O mesmo se aplica a fenômenos sociais. Há aqueles corriqueiros e REGISTRADOS, como nascimentos, óbitos, casamentos, divórcios, campeonatos esportivos, eleições e outros relativamente raros, como revoluções, golpes de estado etc.


Mesmo fenômenos comuns são difíceis de analisar. Por exemplo, hoje, na Europa e nas Américas, em média, a duração dos casamentos tem se mantido num patamar inferior a 10 anos. Daí podemos inferir que os casamentos estão cada vez mais curtos - mas apenas na média. Digamos, por exemplo, que um país tenha uma média corrente de 5 anos. Isso não significa que a maioria dos casamentos dura 5 anos; significa que a maioria dura bem menos. Para um casamento de dez anos, há cinco de dois anos; para um de 20 anos, há outros 20 de apenas um; para um de 40, há 80 de seis meses. Ou seja, a média nos induz a uma conclusão tremendamente equivocada. A maioria dos casamentos dura bem menos que 5 anos; uma minoria fica bem acima dos 5. Na prática, a média corresponde a uns poucos casos reais que ficam acima da maioria e muito abaixo de uma minoria.


Isso nos leva à questão da modelagem estatística. O método mais comumente empregado é a um tanto grosseira estatística gaussiana, baseada literalmente em arremessos aleatórios de moedas (foi o modelo adotado por seu criador, Gauss, no século XVII). Aperfeiçoamentos foram surgindo nos séculos seguintes, majoritariamente baseados em jogos de azar - rolamento de dados, embaralhamento de cartas, lances de roleta etc. Diga-se de passagem, essa matemática bastante simples era geralmente produzida por aristocratas ociosos interessados em ganhar apostas em cassinos e mesas de carteado, e não por aristocratas e clérigos ociosos interessados em desvendar os mistérios do universo, como Newton ou Bayes. 


Mas justamente por ser simplória, é uma metodologia sedutora. Não exige muito esforço mental. Dependendo do caso, são contas que qualquer um faz de cabeça - afinal de contas, ninguém pode se dar ao luxo de resolver equações complexas durante uma partida de carteado.  A aplicação indiscriminada da estatística gaussiana é o que Nassim Taleb chama de "falácia lúdica", pois jogos são universos fechados, com começo, meio, fim e resultado claramente definidos. A realidade NÃO é um tabuleiro de xadrez ou um baralho com 52 cartas. A abordagem gaussiana realmente funciona para jogos (há alguns anos criei um modelo gaussiano que uso em partidas de War e funciona razoavelmente), mas jamais serviria para planejar estratégia em uma guerra de verdade. Para isso, é melhor ler Clausewitz (a obra de Sun Tzu, diga-se de passagem, é antiquada e um tanto banal, boa para executivos metidos a general de pijama). Note-se que, a rigor, jogos como xadrez ou War, por fascinantes que sejam, sequer são realmente jogos de estratégia - a rigor, são jogos de tática, segundo a classificação, ainda válida, de Clausewitz. E mesmo Clausewitz, que viveu e escreveu na virada do século XIX, já é antiquado - suas reflexões tomavam por modelo as Guerras Napoleônicas. E, como se sabe, a diferença entre tática e estratégia é que a primeira se se refere a situações em que os oponentes têm à vista as respectivas forças (ou seja, onde a totalidade ou maioria dos dados relevante é conhecida - como em um tabuleiro de xadrez), enquanto a última diz respeito a situações em que os oponentes desconhecem o conjunto das forças e recursos envolvidos, ocultos na tal "névoa da guerra", como diz Clausewitz. Mesmo em jogos de carteado, onde os adversários podem ocultar seus recursos, o número e tipo de cartas que cada um pode ter na mão é limitado e previamente conhecido pelos jogadores, constituindo assim um "desconhecido-conhecido".


Retornando à estatística gaussiana, ela se popularizou imensamente no século XIX e ainda é usada por muitos pesquisadores nas ciências biológicas, assim como em economia, administração, "negócios" etc. Vale notar que, a rigor, a metodologia gaussiana não é totalmente inválida, contanto que seja aplicada apenas a objetos de estudo e conjuntos de dados tratáveis por ela, ou seja, dados que não envolvam variação radical - como altura ou peso de indivíduos, por exemplo; nenhum pesquisador espera encontrar um indivíduo de 15 metros em uma população humana. O grande problema é que ela vem sendo usada de maneira generalizada e indiscriminada, com efeitos muitas vezes desastroso, especialmente na área econômica, onde são possíveis variações extremas - como restaurantes de bairro e grandes franquias mundiais com milhares de unidades, embora em ambos casos se opere no setor de alimentação.


Voltando à questão da duração dos casamentos, outra modelagem estatística seria no campo da "aleatoriedade mandelbrotiana", que comporta inúmeras metodologias, baseadas na "lei de potências" - ou seja, distribuição exponencial. Mandelbrot, como se sabe, é o "pai" da matemática de fractais, ligada ao campo da dita "matemática do caos".


O ideal seria usar um gráfico de colunas, mas vou usar uma imagem mais "palpável". Se em nosso hipotético país cada casamento fosse uma edificação em uma cidade, teríamos milhões de casas térreas, um pouco menos de prédios de dois andares, bem menos com três ou quatro e ainda menos com cinco andares (a tal "média" gaussiana) e então um número cada vez menor de prédios com 6 ou mais andares, talvez um milhão com dez, meio milhão com 20, e, numa queda brusca, umas poucas centenas de prédios com mais de 20 andares. Ou, para usar outra imagem, seria como uma escada com muitos degraus extremanente longos e baixos e poucos degraus curtinhos, mas extremamente altos (10, 20, 30 ou 40 vezes mais altos que os demais).


Aqui já resolvemos parte do problema. Toda média é uma abstração que não retrata fielmente a realidade. Médias são úteis para cálculos simples e grosseiros, mas falham miseravelmente quando se trata de captar a complexidade do real. Isso significa que é ABSURDO falar em "brasileiro médio", "americano médio", "evangélico médio" ou coisas assim. O "fulano médio" é uma abstração matemática. 


Não existe algo como o "professor de História médio", "o professor de humanas médio" ou o "acadêmico médio". Esse tipo de absurdo só existe na cabeça de "cientistas" políticos - como se política fosse "ciência". Ou de economistas, analistas de mercado, sociólogos e outros compradores da "falácia lúdica". Ressalto, todavia, que em todos esses campos há profissionais competentes e talentosos, muitas vezes marginalizados pelos pares, especialmente em áreas que adotam certa "ortodoxia", como é o caso da Economia.


Agora temos outro problema: escalas.


Escalas são algo completamente contraintuitivo, pois somos quase todos criaturinhas com menos de dois metros de altura num planeta cujo ponto mais alto é o Everest. Só conseguimos enxergar o Everest inteiro a muitos quilômetros de distância - aí perdemos os detalhes. Para ver os detalhes precisamos escalar o Everest (e aí não o vemos inteiro) ou usamos um bom telescópio refrator (e também perdemos de vista o Everest inteiro). Falo com conhecimento de causa, pois tenho alguma prática como astrônomo amador. 


Já tive um telescópio refrator razoável e com ele dava para ver até rochas lunares e mesmos distinguir a sombra projetada por elas. Mas há aqui dois problemas. Um deles é que a rocha é tão pequena e a lua tão grande que fica MUITO difícil saber exatamente em que ponto da lua está a rocha avistada. O outro problema é que o sujeito e o objeto estão simultaneamente em movimento. Eu, minha cadeira e meu telescópio estamos acompanhando a rotação terrestre, enquanto a rocha segue a translação lunar, ambas trajetórias a milhares de quilômetros por segundo!


Na prática de observação, o que vejo através de minha lente ocular é uma faixa de paisagem lunar desfilando por alguns minutos até que a lua suma de vista do telescópio, como se fosse uma tomada panorâmica de cinema. Mas na verdade é muito mais complicado que isso. Como sei que minha observação da lua durará pouquíssimo tempo, tenho que saber EXATAMENTE onde fica o pólo sul da esfera celestial (levei meses para descobrir: fica  cerca de 30 graus acima do telhado da casa de meu vizinho), traçar com antecedência uma estimativa da trajetória lunar, calibrar meu telescópio em um ponto específico da trajetória estimada e aguardar cerca de 15 minutos olhando para o vácuo. Se acertei na estimativa, a lua aparecerá por uns dois minutos na minha lente e  - puf! - desaparecerá dois minutos depois. Se errei, tenho que recomeçar tudo do zero. 


Parece tedioso, mas é emocionante como um safári. Fica mais fácil quando se tem um telescópio com tripé de montagem equatorial (melhor ainda com rotação automática), mas é caro. Para o astrônomo pobretão (como eu), o mais barato é um tripé zenital, que dificulta a tarefa. Não que a montagem zenital seja "pior" - ambas são boas, dependendo do que se queira observar. O ideal é ter mais de dois tripés, com montagens e mecanismos diferentes.


Voltando às escalas de observação, nossas  noções costumam ser muito toscas, pois somos algo como micróbios cósmicos, como diria Dr. Manhattan. Geralmente pensamos a diferença entre a Terra e Júpiter como algo como uma bola de futebol ao lado de uma bola de tênis - grave equívoco. A proporção mais adequada é algo como a Terra do tamanho de uma bola de gude e Júpiter como aquelas bolas gigantes do Quico. Comparado ao Sol, Júpiter é como um grão de areia ao lado da bola do Quico e a Terra seria virtualmente invisível.


Um hipotético astrônomo alienígena em Alfa Centauri, usando os mais avançados equipamentos astronômicos que temos hoje teria dificuldade para detectar, a Terra mesmo com um poderosíssimo radiotelescópio. Note-se bem, trata-se aqui de DETECTAR (não "ver") por métodos indiretos como anomalia gravitacional ou desvio de ondas, usando toneladas de cálculos astronômicos. E ainda restaria a dúvida: "isso é MESMO um planeta ou será outra coisa?"


"Observar" estatisticamente fenômenos sociais - como as inclinações políticas dos professores de História - é tão complicado quanto "caçar" a Lua com um telescópio refletor de montagem zenital. É mais como observar uma supernova ocorrida há milhares de anos com um radiotelescópio.


Primeiramente, pela escala. 18 professores de História, ou 100, ou dez mil são uma amostragem estatisticamente irrelevante. Não dá para fazer isso com uma pesquisa de opinião ou, digamos, contando quantos professores de História seguem Marcelo Freixo no Twitter, nem quantas pessoas seguem a página "Professores de História Marxistas e Militantes" no Facebook, muito menos lendo os comentários que essas pessoas postam ou números de curtidas. Todos esses dados são  qualitativamente interessantes, mas muito limitados e dificilmente pode-se extrapolar que representem fielmente as tendências políticas da maioria dos professores. Ainda estamos presos na perspectiva limitada apontada por Leibniz. Mesmo admitindo que a maioria dos professores se alinhem genericamente com posições políticas consideradas de "esquerda", é muito difícil inferir detalhes de sua adesão a esse campo político, com toda sua variação de qualidade e intensidade. Não se trata de uma população homogênea em que todos partilhem uniformemente das mesmas opiniões gerais e, muito menos, que venham a adotar atitudes idênticas diante de situações e questões específicas. Ainda que se chegasse a uma "média", como discutido antes, essa média, necessariamente abstrata, corresponderia a apenas uma parcela relativamente pequena do conjunto de pessoas reais envolvidas. A bem dizer, se pegássemos aleatoriamente algumas postagens em redes sociais, seria fácil constatar que há grande variedade e discordância entre os membros do grupo em questão.


Em segundo lugar, porque estatísticas consolidadas de fenômenos sociais macro são muito demoradas de coletar e calcular, então o resultado é sempre retrospectivo. Por exemplo, a mídia fala o tempo todo em PIB anual ou PIB trimestral, mas estes dados são apenas provisórios. O cálculo consolidado do PIB  geralmente leva cerca de 5 a 7 anos, então, quando sai, os governantes já não estão mais no poder. Mesmo o resultado consolidado não é "real", só é menos grosseiro. E o detalhe mais importante: entre a estimativa provisória divulgada na mídia e o resultado consolidado a discrepância sempre é enorme (algo na casa dos 30%) e SEMPRE para baixo. Ou seja, o PIB veiculado na mídia sempre é desviado para cima. Se parece maravilhoso é, na melhor das hipóteses, bom; se parece ruim, é péssimo - e se parece péssimo, na realidade, é o fundo do poço.


Para ter uma ideia realmente precisa acerca das inclinações políticas dos professores de História, teríamos que fazer um levantamento exaustivo - um recenseamento oficial ou algo assim. 


Como? O Ministério da Educação poderia abrir um site com um formulário declaratório. Não adiantaria para grande coisa, porque dificilmente alguém se declararia "extremista", já que todo extremista se considera sensato e moderado. O ideal seria um questionário discursivo - inviável, pois seria caríssimo e extraordinariamente demorado fazer algo assim. Restaria fazer um questionário de múltipla escolha. Mas, discursivo ou objetivo, qualquer questionário seria subjetivo - o resultado refletiria apenas os critérios previamente adotados pelos elaboradores do questionário. E, ainda assim, quando todo o trabalho de coleta e análise dos dados fosse concluído, é provável que os professores em questão já teriam mudado suas opiniões, ainda que sutilmente. Muito trabalho e dinheiro gastos para nada.


CONCLUSÃO

De um ponto de vista "empírico cético", é IMPOSSÍVEL ter certezas sobre as tendências políticas do conjunto dos professores de História, professores de humanas, dos acadêmicos de humanas ou o que o valha. O máximo que podemos ter é suspeitas, impressões e opiniões - "achismos", enfim. Mesmo uma ampla pesquisa estatística ofereceria apenas um vago retrato da realidade. Ficar discutindo isso não leva a lugar nenhum. É como um cachorro correndo atrás do rabo.


O melhor que podemos fazer é conviver com a incerteza - o que é incômodo. Como prova o sério, premiadíssimo e justamente reconhecido trabalho de Daniel Kahneman em psicologia experimental, o ser humano, mesmo com a mais refinada erudição e ampla formação acadêmica (o público estudado por Kahneman), tem imensa dificuldade em conviver com a incerteza prolongada. Temos, todos nós, gatilhos emocionais que nos induzem a escolher imediatamente as "certezas" que confirmem nossa visão de mundo, mesmo em questões triviais do cotidiano. Somos escravos de nossos hábitos. 


E a convicção costuma ser inversamente proporcional à reflexão. Nos deixamos guiar principalmente por nossas simpatias e antipatias inconscientes. O contrário disso exige um esforço prolongado de suspensão da certeza, cujo custo emocional costuma ser exasperante para a maioria de nós. No fundo, é basicamente o que Montaigne, La Boétie e Pascal já diziam séculos atrás. Traduzindo grosseiramente Pascal, "o ser humano é um graveto pensante".


Como "graveto pensante", me resigno à incerteza sobre este, como tantos outros assuntos. Minha única certeza absoluta e inegociável quanto a este mundo é que, a longo prazo, todos estaremos mortos. No que tange ao resto, tento sempre permanecer aberto a novos olhares e perspectivas, me dando ao luxo de não ter opiniões formadas sobre inúmeros assuntos.


No que concerne às estatísticas, elas constituem uma ferramenta extremamente válida para a abordagem de fenômenos sociais em escala macro - contanto que tenhamos plena consciência das limitações dessa ferramenta. Não se trata de acreditar ou deixar de acreditar em estatísticas, mas sim de compreender a natureza das diferentes metodologias e abordagens estatísticas e de sua aplicação adequada ao conjunto de dados por estudar.


Ao contrário do que pensava o Chaves do 8, nem tudo é "culpa das estatísticas"... Ou, como dizia certo matemático, os números não mentem, mas os seres humanos usam números para mentir.


Vale lembrar a piada: havia dois homens e um frango assado. Um deles comeu o frango inteiro e, depois, usando estatísticas, convenceu o outro de que ambos haviam comido meio frango...




Nenhum comentário: