Ponderações sobre a pesquisa publicada no PNAS:
E ao destaque dado no HypeScience: Revelada "árvore da vida" com 2.3 milhões de espécies.
Esta
pesquisa precisa ser lida cum grano salis – com ceticismo saudável, pois revela
muitos pontos em que erros científicos crassos podem ocorrer:
1. Ignorância
declarada:
“Despite
decades of effort and thousands of phylogenetic studies on diverse
clades, we lack a comprehensive tree of life, or even a summary of
our current knowledge.”
“Apesar de
décadas de esforços e milhares de estudos filogenéticos sobre diversos clades, nós
não temos uma árvore da vida abrangente, ou até um sumário do nosso
conhecimento atual.”
2.
Preenchimento questionável de lacunas:
“When
source phylogenies are absent or sparsely sampled, taxonomic hierarchies
provide structure and completeness.”
“Taxonomies
contribute to the structure only where we do not have phylogenetic
trees.”
“Quando as
filogenias de origem estiverem ausentes ou esparsamente analisado, as
hierarquias taxonômicas fornecem estrutura e completude.”
“As taxonomias
contribuem para a estrutura somente quando nós não temos árvores filogenéticas.”
E se as
duas proposições forem dependentes da aceitação a priori da pressuposição de ancestralidade comum universal?
3. Primeiro
passo, direção incerta?
“Although a
massive undertaking in its own right, this draft tree of life represents
only a first step.”
“Embora
seja um grande empreendimento em si mesmo, este esboço de árvore da vida representa apenas um primeiro passo.”
4.
Destruição de dados:
“585,081
of the names are classified as nonphylogenetic units (e.g.,incertae
sedis [of uncertain placement]) and were therefore not
included in the synthesis pipeline.”
“585.081
dos nomes são classificados
como unidades não filogenéticas (e.g., incertae sedis [de
localização incerta]) e por isso não incluídos no processo de síntese.”
Algumas
vezes o verdadeiro tesouro está no lixo. Lembram do DNA lixo??? Um verdadeiro tesouro genético que a cada dia o ENCODE vai revelando.
5. Inclusão
seletiva:
“The
complete database contains 6,810 trees from 3,062 studies. At the time of
publication, 484 studies in our database are incorporated into the draft tree
of life.”
“O banco de
dados completo contém 6.810 árvores de 3.062 estudos. Por ocasião da publicação,
484 estudos em nosso banco de dados foram incorporados no esboço da árvore da
vida.”
E o que
isso significa? Que 20% dos estudos, e 10% das árvores – implica que muitos
desses estudos apresentaram duas ou mais filogenias conflitantes dos mesmos
dados. Além disso, eles não puderam usar filogenias análogas que foram apresentadas,
por exemplo, como diagramas impressos nos artigos.
6. Pré-conceito:
“Our goal
is to generate a best estimate of phylogenetic knowledge;
based on our tests, we give several reasons not to use all available
trees for synthesis. First, including trees that are incorrect does
not improve the synthetic estimate.”
“Nosso
objetivo é gerar uma melhor estimativa do conhecimento filogenético;
baseado em nossos testes, nós demos diversas razões em não usar todas
as árvores disponíveis para a síntese. Primeiro, incluir árvores que estão
incorretas não melhora a estimativa sintética.”
E quem decide
o que é a melhor árvore? E quem decide quais árvores publicadas são incorretas?
7. Consenso
não é ciência:
“In each
major clade, expert curators selected and ranked input trees
for inclusion based on date of publication,
underlying data, and methods of inference (see Materials
and Methods for details). These rankings generally reflect
community consensus about phylogenetic hypotheses.”
“Em cada clade
principal, curadores especialistas selecionaram e classificaram árvores
de entrada para inclusão baseado
na data de publicação, dados subjacentes, e métodos de inferência (vide Materials
and Methods para detalhes). Essas classificações geralmente
refletem o consenso da comunidade sobre hipóteses filogenéticas.”
Perguntas:
Desde quando que data de publicação é critério de exatidão? Quem é que decide se os dados são bons? Quem é que decide
quais métodos são os melhores? A classificação é garantida para reforçar o
consenso atual, que pressupõe a ancestralidade comum universal. Céticos e
dissidentes são eliminados logo no começo pelos “especialistas” – quem os
classificou assim?
8. Viciando
o jogo:
“Not all
trees are sufficiently well-curated; at this point, we have focused
curation efforts on trees that will most improve the synthetic tree.”
“Nem
todas as árvores foram suficientemente bem consideradas pelos especialistas;
a esta altura, nós focalizamos os esforços dos conhecimentos especializados
em árvores que irão melhorar mais a árvore sintética.”
Perceberam?
Os dados não estão falando objetivamente; os pesquisadores garantiram o que se
propuseram descobrir.
9. Os outros que sejam rigorosos:
“The full
set of trees in the database is important for other questions such
as estimating conflict or studying the history of
inference in a clade, highlighting the importance of continued
deposition and curation of trees into public data repositories.”
“A série
completa de árvores no banco de dados é importante para outras questões
tais como calcular o conflito ou estudar a história da inferência
em um clade, destacando a importância
da deposição continuada e do estudo especializado de árvores em repositórios de
dados públicos.”
É bom manter
todos os dados públicos, mas quem irá realmente conferi-los?
10. Inputs
altamente pré-concebidos:
“Most
tips in the synthetic tree (98%) come from taxonomy
only, reflecting both the need to incorporate more species into
phylogenies and the need to make published phylogenies
available.”
“A
maioria dos ramos na árvore sintética (98%) vem somente da taxonomia, refletindo tanto a necessidade de se incorporar
mais espécies nas filogenias e a necessidade de tornar disponíveis
as filogenias publicadas.”
Isso quer
dizer que somente 2% usam os altamente anunciados métodos filogenéticos moleculares
de se inferir ancestralidade.
11.
Resultados altamente pré-concebidos:
“We
obtained trees from digital repositories and also by contacting authors
directly, but our overall success rate was only 16%.”
“Nós
obtivemos árvores do repositários digitais e também contatando diretamente os
autores, mas a nossa taxa de sucesso geral foi somente de 16%.”
Na seção
Materials and Methods, os autores disseram:
“The data
retrieved are by no means a complete representation of
phylogenetic knowledge because we obtained digital phylogeny files for only 16%
of recently published trees.”
“Os dados
obtidos não são de modo algum uma representação completa do conhecimento
filogenético, pois nós obtivemos arquivos digitais de filogenia de apenas 16%
das árvores publicadas recentemente.”
12. Nem
precisava mencionar, mas não houve nenhuma inclusão de ceticismo, nem mesmo
ceticismo saudável, quanto à ancestralidade comum universal...
+++++
Sobre os ombros de um gigante.