terça-feira, 11 de março de 2014

Os número não mentem jamais. Será ? Estatística

OS NÚMEROS NÃO MENTEM JAMAIS. SERÁ? Estatística


"Fulano está com 34% de intenções de voto".
"Fome atinge 32 milhões de brasileiros".
"São realizados 4 milhões de abortos por ano no Brasil".


O homem nem sequer sonhava com eleições de massa, contabilização da miséria ou de abortos quando Santo Agostinho, no século VI, alertou os bons cidadãos contra "os matemáticos e todos aqueles que fazem profecias vazias". Segundo Agostinho, "o perigo é que eles tenham feito um pacto com o Diabo para obscurecer o espíritio e manter o homen no cativeiro do Inferno".
Pactos demoníacos à parte, ainda hoje é com uma boa dose de ceticismo que o brasileiro encara as chamadas estatísticas. Não importa o que pretendam retratar - como vai a saúde ou a economia do país, o que pensa ou como se coporta a população -, os grandes números calculados por órgãos oficiais ou institutots particulares são, senão diabólicos, pelo menos muito misteriosos.
A desconfiança tem seus motivos. O brasileiro está se acostumando a assistir a infindáveis bate-bocas sobre a validade dos números que lê. Até parece que atrás de uma pesquisa corre sempre uma polêmica. Quando dois especialistas falam, os que não são do ramo abaixam a orelha. Assim, quem não conhece a metodologia, não sabe o que é variável e nunca viu de perto a tal margem de erro, fica nadando num mar de dúvidas.
Afinal, pode-se ou não confiar no que os números dizem? A dúvida é tanta que o brasileiro já incorporou uma nova palavra ao seu vocabulário: "chutometria". O termo pode ser definido como "sistema de medir por meio de chutes, quer dizer, por palpites".
Mas nem tudo é tão obscuro ou vago no mundo das estatísticas. A verdade é que elas são fundamentais para a compreensão da realidade. O problema é interpretá-las corretamente. É preciso distinguir, primeiro, os dois tipos de estatísticas - as calculadas por amostragem, como as pesquisas sobre a intenção de voto, e as que envolvem a contagem pura e simples, como o censo da população, feito pelo IBGE. Deve-se saber também que há algumas regras básicas empregadas na "contabilidade" e na generalização dos dados obtidos. E tomar alguns cuidados pra não cair em ciladas.

"A única maneira de se conferir o resultado exato de uma eleição é realizá-la hoje mesmo", afirma o estatístico Carlos Alberto de Bragança Pereira. "Como isso é impossível, temos de utilizar os métodos de pesquisa por amostragem". Bragança Pereira é diretor do Instituto de Matemática e Estatística da Universidade de São Paulo (USP) e foi consultor da Organização dos Estados Americanos (OEA) nas eleições presidenciais do Haiti, El Salvador e Nicarágua.
A amostragem é um dos principais instrumentos da Estatística - a área da matemática que lida com os grandes números. Os estatísticos preocupam-se com o levantamento, a organização e a análise dos dados de um conjunto - a população de um país, as mulheres de uma cidade ou as moléculas do corpo humano. Isso pode ser feito de duas maneiras: contando todos os elementos do conjunto (quando isso é possível), ou contando uma pequena parte e calculando os re-sultados globais por generalização. 
 Amostra é uma "fatia" separada para estudo do universo. É como se alguém quisesse descobrir os ingredientes de um bolo de chocolate sem desmilingüir o bolo inteiro e cortasse, para análise, apenas um pedaço. 
Se a farinha, o fermento, o chocolate e os outros elementos estão bem misturados na massa, a proporção empregada de cada ingrediente pode ser inferida de uma fatia qualquer. No caso das pesquisas eleitorais no Brasil, os ingredientes do bolo de 100 milhões de eleitores não estão bem misturados. Apesar disso,  "podemos chegar a uma projeção muito próxima da realidade falando apenas com uma fatia desse conjunto, de 2 500 pes-soas", garante a estatística Renata Nunes César, gerente do Datafolha, instituto ligado ao jornal Folha de S. Paulo.  


A base do método de análise de um todo por suas fatias é a teoria da probabilidade, criada por dois importantíssimos pensadores do século XVII - o filósofo, matemático e físico  francês Blaise Pascal (1623-1662) e o matemático, também francês, Pierre de Fermat (1601-1665). Em 1654, eles foram desafiados por    grandes apostadores a calcular quanto uma pessoa poderia ganhar ou perder em jogos de moedas, dados, cartas e roleta. Foi assim que surgiram as fórmulas matemáticas que definem as chances de um evento ocorrer. 
Hoje, a Estatística é ferramenta indispensável em todas as ciências, biológicas,  exatas e sociais. "Mas não se pode dizer que seja, ela própria, uma ciência", afirma Bragança Pereira. "Não se trata, tampouco, de adivinhação ou magia. É um método de ´fotografar´ o presente e fazer projeções para o futuro." 
Para a foto sair com um bom foco, a parcela a ser estudada tem de ser bem escolhida. Voltando ao exemplo do bolo eleitoral brasileiro, para descobrir a quantidade de cada ingrediente que a receita leva, não basta analisar um naco qualquer. É necessário pegar pedaços diferentes e "montar" uma fatia que seja re-presentativa do bolo inteiro. 
Para começar, as pessoas não estão distribuídas igualmente pelo territó-rio nacional. Algumas áreas têm uma po--pulação maior que outras. É preciso fazer entrevistas em proporção à densidade das regiões. 
 "Até esse ponto, os institutos de pesquisa empregam o mesmo sistema de definição da amostra - por sorteio e proporcionalidade", explica Örjan Olsén. Sueco, no Brasil há 41 anos, Olsén foi diretor do Ibope e hoje dirige sua própria empresa, a Companhia Brasileira de Pesquisa e Análise (CBPA), em São Paulo. "Daí para diante, podem-se seguir dois métodos diferentes: a amostragem probabilística ou por quotas." 
Pelo método probabilístico, tudo tem de ser sorteado dentro de cada setor da cidade: primeiro, o quarteirão, depois, o domicílio e, dentro do domicílio, a pessoa a responder o questionário. 
Para representar a totalidade dos eleitores brasileiros, os entrevistados têm  de se encaixar nos diferentes "tipos de pessoas" que existem no país. São as chamadas variáveis - características, como sexo, idade, ocupação, nível de instrução e si-tuação sócio-econômica, que influem na opinião e no voto de cada um. "É a própria experiência que nos mostra quais variáveis devem ser levadas em conta", afirma o veterano estatístico José Severo de Camargo Pereira, professor aposentado da USP e consultor do Instituto Gallup. 
Assim, como a população brasileira é composta 50% por homens e outros 50% por mulheres, aproximadamente, o número total de entrevistas tem sempre de ser feito dentro dessa proporção.  
"Para garantir a proporcionalidade da amostra probabilística, temos um pe-queno pulo-do-gato", conta Severo. "Qualquer distorção é corrigida por alguns cálculos matemáticos  simples".  Essas continhas de chegar são as cha-madas ponderações. 
Na pesquisa por quotas, é diferente. Antes de começarem as entrevistas, é determinado quantas pessoas de cada tipo terá de haver no final. Então, o entrevistador já sai procurando um       número definido de eleitores para compor a proporção representativa de cada variável. 
O principal objetivo do  planejamento rigoroso da amostra é garantir a menor margem de erro na pesquisa. Margem de erro significa exatamente o que o nome diz - um intervalo  controlado dentro  do qual podem variar os resultados finais. Ou seja, um estudo bem planejado não elimina o erro, apenas o limita. 
O que pode parecer um preciosismo metodológico é muitas vezes o detalhe que faz a diferença. Imagine que o can-didato "A" tem 34% das intenções de voto e o candidato "B", 30%, numa pesquisa com margem de erro de 3%, bastante comum no Brasil. Isso significa que o instituto só afirma que o candidato "A" está com algo entre 31% e 37% das intenções de voto, e o  candidato "B", com 27% a 33% das preferências. Eles podem, portanto, estar empatados, com 33%, ou afastados em até dez pontos percentuais. Prestar atenção na margem de erro é o tipo de cuidado que ajuda a avaliar corretamente as porcentagens que bombardeiam o cidadão.
Veja este resultado do censo de 1980: o Instituto Brasileiro de Geografia e Estatística (IBGE) levantou na ocasião que havia no Brasil 41.974.865 pessoas casadas, sendo 21.029.031 homens e 20.945.834 mulheres. Percebeu alguma coisa errada? Claro, se no Brasil legalmente só existe casamento monogâmico e heterossexual (isto é, cada homem só pode se casar com uma e apenas uma única mulher), como é que pode haver um número maior de maridos do que de esposas? "É que o IBGE entrevistou pessoas de 15 anos de idade ou mais", explica Severo. "Como no interior do país é comum as mulheres se casarem até com 13 anos, estas ficaram fora da contagem."
Este é um exemplo de "escorregão" metodológico. Mas os números podem enganar de outras maneiras. Um erro no sistema de levantamento de dados, na composição da amostra, na elaboração do questionário ou na interpretação dos resultados, sem falar na forma de divulgação, podem ser fontes de equívoco.
 Muitas vezes os números que retratam a realidade brasileira são fruto de meras estimativas. Nos últimos meses, alguns "palpites" formidáveis têm recheado as notícias nos jornais e os discursos polí-ticos. São dados alarmantes, como os supostos 4 milhões de abortos realizados por ano no país, que tem aparecido freqüentemente na imprensa. A estimativa foi atribuída à Organização Mundial da Saúde (OMS), mas lá ninguém assume         a autoria da pesquisa. "Contar o número de abortos no Brasil é praticamente impos-sível", comenta o epidemiologista Ruy Laurenti, da Faculdade de Saúde Públi-ca da USP. "Simplesmente porque o aborto provocado é proibido por lei e, por isso, é feito clandestinamente, sem registro." 
Outro caso polêmico é o dos 32 milhões de brasileiros famintos. A conclusão do trabalho do Instituto de Pesquisa Econômica Aplicada (IPEA) é que mais de 9 milhões de famílias passam fome porque  têm renda abaixo de dois salários mínimos. Entre várias críticas levantadas à metodologia utilizada, afirma-se que não se pode medir a fome das famílias brasileiras por salários mínimos. Metade da população que vive no campo, por exemplo, não é paga em dinheiro, mas em produtos agrícolas, como mantimentos e animais. Daí, não se poder concluir, com segurança, que toda família sem dinheiro no bolso seja necessariamente faminta.
Uma simples palavra mal definida também pode ser responsável por grandes disparates estatísticos. É o caso do número de desempregados no Brasil. Os índices variam de 1 milhão a 20 milhões de pessoas. Qual o número correto, afinal? Tudo depende do que se entenda por "desempregado" - quem não tem carteira assinada (nesse caso, a pessoa pode trabalhar como autônomo), quem está procurando emprego, ou quem vive de peque-nos negócios, como vender  frutas nas esquinas? 
Mesmo tomadas todas as precauções, as estatísticas podem ser perigosas para quem as lê desavisadamente. Principalmente em assuntos que representem alguma ameaça à vida. Os hipocondríacos e pessimistas crônicos que o digam. Eles sabem o quanto é fácil se auto-incluir em índices crescentes de  mortalidade por doenças graves.

"As pessoas se esquecem de que, quando se descobre a cura para uma moléstia, a porcentagem de mortes causadas por ela naturalmente cai", alerta Severo. "Mas, como o total de mortes representa sempre 100%, a porcentagem de óbitos por outras doenças tem de subir", avisa Severo aos que se preocupam à toa.
A dica é não confundir possibilidade com probabilidade. Mesmo antes do choque do cometa Shoemaker-Levy 9  contra Júpiter, em julho passado, foi levantada a hipótese de que o mesmo poderia acontecer na Terra. A crença no desastre se fortaleceu quando o Congresso  americano anunciou planos de investir 50 milhões de dólares num gigantesco programa de prevenção à queda de cometas por aqui. A idéia dos congressistas americanos é que a NASA desenvolva um siste--ma de rastreamento e destruição de grandes objetos que eventualmente entrem em rota de colisão com o planeta. 
Mas qual é a probabilidade real de um cometa ou asteróide atingir a Terra? "É de uma vez a cada 100 milhões ou 200 milhões de anos", afirma o astrônomo Augusto Damineli Neto, do Instituto de Astronomia e Geofísica da USP e colaborador de SUPER. Damineli explica que o planeta é bombardeado todos os dias por rochas menores, pesando até um quilo, comuns no espaço. Mas, por serem muito pequenos, esses meteoros desintegram-se assim que entram na atmosfera. "Corpos maiores, como o Shoemaker, são bem mais raros. Além disso, a Terra é um alvo minúsculo, em termos astro-nômicos, e, portanto, difícil de acertar." 
Como se acredita que o último cometa a passar por aqui tenha sido aquele que eliminou os dinossauros da face da Terra, há 65 milhões de anos, o mais provável  é que a NASA tenha de esperar pelo menos outros 35 milhões de anos para colocar em uso as armas de caça a cometas. Ou seja, existe a possibilidade, mas a probabilidade de que isso venha a ocorrer é mínima.
Em se tratando de pesquisa, "o mais provável" é a única expressão que se pode utilizar. Em Estatística não existem certezas - pelo menos enquanto os especialistas não fizerem o pacto com o demônio, tão temido por Santo Agostinho. "Ninguém é guru ou adivinho. A única verdade abso-luta sobre Estatística é que, por mais próximo que os resultados estejam da  realidade, a probabilidade de se acertar exatamente na ´mosca´ é re-motíssi-ma", diz Bragança Pereira.

Como se escolhe o entrevistado

Veja como os institutos selecionam as pessoas que vão responder os questionários das pesquisas eleitorais

Universo
São todos os eleitores do Brasil - cerca de 100 milhões

Amostra
É uma "fatia" do universo, definida segundo o número de eleitores em cada região

Em cada região
Calcula-se a distribuição de eleitores por estado e daí se tira, proporcionalmente, o número de entrevistas que desem ser feitas em cada um deles

Em cada estado
As cidades são ordenadas segundo o número de eleitores que possuem. Daí se tira o número de entrevistas que devem ser feitas em cada uma

Cada cidade
É dividida em zonas, segundo a quantidade de eleitores. As áreas onde serão feiras entrevistas são então sorteadas

Em cada zona
A pesquisa precisa encontrar um grupo de eleitores representativos daquela área. Se 60% do eleitorado da região é da classe C, será necessário que 60% dos questionários sejam respondidos por pessoas da classe C.

Quando os números enganam

"Mulheres sorriem mais"

Esta é a conclusão de um trabalho acadêmico de uma psicóloga de São Paulo. A constatação saiu da comparação de 623 fotografias coletadas junto a amigos e familiares da pesquisadora. Nas fotos, mulheres de diferentes faixas de idade apareciam sorrindo mais do que os homens. O problema é que as 623 fotografias colhidas entre amigos e familiares da pesquisadora não podem representar o universo de todas as mulheres do mundo, nem do país, nem de uma região ou cidade. Para isso, a amostra deveria ser colhida em diferentes regiões geográficas, grupos sociais e culturais.  Assim, o máximo que a pesquisadora poderia concluir com o levantamento é que suas amigas e parentes são sorridentes.

"Pessimismo deixa careca"

Outro caso real, que saiu nos jornais: uma empresa japonesa de cosméticos constatou que homens pessimistas têm cabelos mais fracos e tendem a ficar carecas. Foram entrevistados 733 homens entre 15 e 59 anos de idade, em Tóquio. Resultado: 51% dos que se consideravam pessimistas disseram que seus cabelos estavam ficando fracos, enquanto 47% dos otimistas percebiam algum sinal de calvície. Problema: pessimismo e calvície é uma associação no mínimo questionável. O próprio porta-voz da empresa japonesa admitiu que ainda não se comprovou cientificamente nenhum vínculo entre a personalidade e a quantidade de cabelo. Além disso, a própria diferença entre as declarações dos pessimistas (51%) e as dos otimistas (47%) é muito pequena para se tirar qualquer conclusão nesse sentido.

"A política cambial do Plano Real é melhor do que a dosoutros planos econômicos?"

A pergunta é fictícia.  Mas serve para ilustrar vários "pecados capitais"  em pesquisas de opinião pública.
1. É tendenciosa. Deveria apresentar as duas opções para o entrevistado: "Você acha que a política cambial do Plano Real é melhor  ou pior  do que...?"
2. Pressupõe que o entrevistado saiba o que significa política cambial e conheça as políticas adotadas em diversos planos econômicos. 
3. A comparação é imprecisa:  não fica claro a que outros planos econômicos a questão se refere.

"Cai o número de seqüestros em São Paulo"

Outro exemplo fictício. Deve-se ficar alerta para informações desse tipo. É preciso saber mais antes de tirar qualquer conclusão. Será que menos pessoas estão sendo seqüestradas? Ou o que caiu foi o número de casos registrados na polícia, para evitar interrupção de contato com os seqüestradores? Em outras palavras, é preciso estar atento para as causas  que geram certos dados, antes de interpretá-los pelo caminho mais óbvio.  

"O candidato Fulano de Tal cai 15 pontos nas pesquisas"

Preste atenção também nesse tipo de manchete. O número até pode ser verdadeiro, mas esta talvez não seja a informação mais importante daquela pesquisa. É só imaginar que Fulano de Tal estivesse com 70% das intenções de voto. E Sicrano, o segundo colocado, com 5%. A diferença entre os dois, nesse caso, é enorme - 65 pontos percentuais. Assim, mesmo descendo para 55% das intenções de voto, Fulano   continua ainda muito na frente de Sicrano, se este permanecer com 5%. 

"Estados Unidos têm mais árvores hoje do que cem anos atrás"

O exemplo é real.  A informação é divulgada por madeireiras norte-americanas. Ela é uma meia-verdade, com as quais se deve ter muito cuidado. O dado sobre o maior número de árvores não é falso. Mas a conclusão a que a frase pode levar - de que os Estados Unidos têm hoje mais florestas do que no século passado - é mentirosa. Uma muda de poucos centímetros é uma árvore, porém, para o meio ambiente, ela não tem nem de longe a importância de uma sequóia nativa com cerca de 300 metros de altura (veja, sobre o assunto, reportagem na página 40). É preciso sempre avaliar a fonte da informação que está por trás dos números apresentados.


Nenhum comentário:

Postar um comentário