Algumas ponderações sobre a pesquisa da síntese da filogenia e taxonomia em uma árvore da vida abrangente

quarta-feira, setembro 23, 2015


Ponderações sobre a pesquisa publicada no PNAS:






Esta pesquisa precisa ser lida cum grano salis – com ceticismo saudável, pois revela muitos pontos em que erros científicos crassos podem ocorrer:

1. Ignorância declarada:

“Despite decades of effort and thousands of phylogenetic studies on diverse clades, we lack a comprehensive tree of life, or even a summary of our current knowledge.”

“Apesar de décadas de esforços e milhares de estudos filogenéticos sobre diversos clades, nós não temos uma árvore da vida abrangente, ou até um sumário do nosso conhecimento atual.”

2. Preenchimento questionável de lacunas:

“When source phylogenies are absent or sparsely sampled, taxonomic hierarchies provide structure and completeness.”

“Taxonomies contribute to the structure only where we do not have phylogenetic trees.” 

“Quando as filogenias de origem estiverem ausentes ou esparsamente analisado, as hierarquias taxonômicas fornecem estrutura e completude.”

“As taxonomias contribuem para a estrutura somente quando nós não temos árvores filogenéticas.”
 
E se as duas proposições forem dependentes da aceitação a priori da pressuposição de ancestralidade comum universal?

3. Primeiro passo, direção incerta?

“Although a massive undertaking in its own right, this draft tree of life represents only a first step.

“Embora seja um grande empreendimento em si mesmo, este esboço de árvore da vida representa apenas um primeiro passo.”

4. Destruição de dados:

585,081 of the names are classified as nonphylogenetic units (e.g.,incertae sedis [of uncertain placement]) and were therefore not included in the synthesis pipeline.”

585.081 dos nomes são classificados como unidades não filogenéticas (e.g., incertae sedis [de localização incerta]) e por isso não incluídos no processo de síntese.”

Algumas vezes o verdadeiro tesouro está no lixo. Lembram do DNA lixo??? Um verdadeiro tesouro genético que a cada dia o ENCODE vai revelando.

5. Inclusão seletiva:

“The complete database contains 6,810 trees from 3,062 studies. At the time of publication, 484 studies in our database are incorporated into the draft tree of life.”

“O banco de dados completo contém 6.810 árvores de 3.062 estudos. Por ocasião da publicação, 484 estudos em nosso banco de dados foram incorporados no esboço da árvore da vida.”

E o que isso significa? Que 20% dos estudos, e 10% das árvores – implica que muitos desses estudos apresentaram duas ou mais filogenias conflitantes dos mesmos dados. Além disso, eles não puderam usar filogenias análogas que foram apresentadas, por exemplo, como diagramas impressos nos artigos.

6. Pré-conceito:

“Our goal is to generate a best estimate of phylogenetic knowledge; based on our tests, we give several reasons not to use all available trees for synthesis. First, including trees that are incorrect does not improve the synthetic estimate.”

“Nosso objetivo é gerar uma melhor estimativa do conhecimento filogenético; baseado em nossos testes, nós demos diversas razões em não usar todas as árvores disponíveis para a síntese. Primeiro, incluir árvores que estão incorretas não melhora a estimativa sintética.”

E quem decide o que é a melhor árvore? E quem decide quais árvores publicadas são incorretas?

7. Consenso não é ciência:

“In each major clade, expert curators selected and ranked input trees for inclusion based on date of publication, underlying data, and methods of inference (see Materials and Methods for details). These rankings generally reflect community consensus about phylogenetic hypotheses.”

“Em cada clade principal, curadores especialistas selecionaram e classificaram árvores  de entrada para inclusão baseado na data de publicação, dados subjacentes, e métodos de inferência (vide Materials and Methods para detalhes). Essas classificações geralmente refletem o consenso da comunidade sobre hipóteses filogenéticas.”

Perguntas: Desde quando que data de publicação é critério de exatidão? Quem é que decide se os dados são bons? Quem é que decide quais métodos são os melhores? A classificação é garantida para reforçar o consenso atual, que pressupõe a ancestralidade comum universal. Céticos e dissidentes são eliminados logo no começo pelos “especialistas” – quem os classificou assim?

8. Viciando o jogo:

Not all trees are sufficiently well-curated; at this point, we have focused curation efforts on trees that will most improve the synthetic tree.”  

Nem todas as árvores foram suficientemente bem consideradas pelos especialistas; a esta altura, nós focalizamos os esforços dos conhecimentos especializados em árvores que irão melhorar mais a árvore sintética.”

Perceberam? Os dados não estão falando objetivamente; os pesquisadores garantiram o que se propuseram descobrir.

9. Os outros que sejam rigorosos:

“The full set of trees in the database is important for other questions such as estimating conflict or studying the history of inference in a clade, highlighting the importance of continued deposition and curation of trees into public data repositories.”

“A série completa de árvores no banco de dados é importante para outras questões tais como calcular o conflito ou estudar a história da inferência em um clade, destacando a importância da deposição continuada e do estudo especializado de árvores em repositórios de dados públicos.”

É bom manter todos os dados públicos, mas quem irá realmente conferi-los?

10. Inputs altamente pré-concebidos:

Most tips in the synthetic tree (98%) come from taxonomy only, reflecting both the need to incorporate more species into phylogenies and the need to make published phylogenies available.”

A maioria dos ramos na árvore sintética (98%) vem somente da taxonomia, refletindo tanto a necessidade de se incorporar mais espécies nas filogenias e a necessidade de tornar disponíveis as filogenias publicadas.”

Isso quer dizer que somente 2% usam os altamente anunciados métodos filogenéticos moleculares de se inferir ancestralidade.

11. Resultados altamente pré-concebidos:

“We obtained trees from digital repositories and also by contacting authors directly, but our overall success rate was only 16%.

“Nós obtivemos árvores do repositários digitais e também contatando diretamente os autores, mas a nossa taxa de sucesso geral foi somente de 16%.

Na seção Materials and Methods, os autores disseram:

“The data retrieved are by no means a complete representation of phylogenetic knowledge because we obtained digital phylogeny files for only 16% of recently published trees.”

“Os dados obtidos não são de modo algum uma representação completa do conhecimento filogenético, pois nós obtivemos arquivos digitais de filogenia de apenas 16% das árvores publicadas recentemente.”

12. Nem precisava mencionar, mas não houve nenhuma inclusão de ceticismo, nem mesmo ceticismo saudável, quanto à ancestralidade comum universal...

+++++

Sobre os ombros de um gigante.