Grande

Notícias

LarLar / Notícias / Grande

Aug 03, 2023

Grande

Parasitas e Vetores volume 16, Artigo número: 265 (2023) Citar este artigo 90 Acessos 4 Detalhes das Métricas Altmétricas Os flavivírus são um grupo diversificado de vírus de RNA, que incluem o etiológico

Parasitas e Vetores volume 16, Artigo número: 265 (2023) Citar este artigo

90 acessos

4 Altmétrico

Detalhes das métricas

Os flavivírus são um grupo diversificado de vírus RNA, que incluem os agentes etiológicos do zika, da dengue e da febre amarela, transmitidos por mosquitos. Os flavivírus não codificam a transcriptase reversa e não podem fazer a transcrição reversa em DNA, mas as sequências de DNA dos flavivírus são encontradas integradas nos cromossomos dos mosquitos Aedes aegypti e como sequências extracromossômicas. Nós examinamos anteriormente o Ae. genoma de referência aegypti para identificar integrações de flavivírus e analisar a conservação dessas sequências entre dados do genoma completo de 464 Ae. aegypti coletados em 10 países em todo o mundo. Aqui, estendemos esta análise identificando sequências de flavivírus nessas amostras independentemente do Ae. montagem de referência aegypti. Nosso objetivo foi identificar o conjunto completo de sequências virais, incluindo aquelas ausentes no genoma de referência, e sua distribuição geográfica. Comparamos as sequências identificadas usando BLASTn e aplicamos métodos de aprendizado de máquina para identificar clusters de sequências semelhantes. Além dos agrupamentos de sequências que correspondem aos quatro eventos de integração viral que descrevemos anteriormente, identificamos 19 agrupamentos menores. O único cluster com uma forte associação geográfica consistia em sequências semelhantes a vírus de agentes de fusão celular específicas da Tailândia. Os restantes clusters não tinham uma associação geográfica e consistiam principalmente em sequências curtas quase idênticas, sem forte semelhança com quaisquer genomas de flavivíricos conhecidos. Os dados de sequenciamento de leitura curta não nos permitiram determinar se as sequências identificadas eram extracromossômicas ou integradas em Ae. cromossomos aegypti. Nossos resultados sugerem que a cepa Liverpool e o campo Ae. os mosquitos aegypti possuem uma variedade semelhante de DNA flavivviral conservado, cujo papel funcional deve ser investigado em estudos de acompanhamento.

Em nossa publicação anterior [1], examinamos genomas de referência de Aedes aegypti e Ae. albopictus para identificar sequências integradas de flavivírus para melhorar nossa compreensão dos elementos virais endógenos não retrovirais (nrEVEs) (ver [2] para revisão recente). Também examinamos os dados de sequenciamento do genoma completo do Aedes disponíveis publicamente para compreender a conservação das sequências virais identificadas. Descobrimos que nrEVEs em Ae. albopictus eram muito diversos e com pouca conservação. Em contraste, descobrimos que quase todos os nrEVEs no Ae. O genoma de referência do aegypti originou-se de quatro eventos de integração viral (VIEs) distintos. Concluímos que a diversidade de sequências nrEVE de flavivvírus no genoma de referência é o resultado da duplicação e fragmentação destas quatro VIEs. O Ae. fragmentos nrEVE de aegypti estavam presentes em quase todos os isolados sequenciados examinados, mas mostraram uma estrutura filogenética semelhante a uma estrela sem clados, indicativo de um evento recente de expansão populacional de um ancestral comum.

Juntamente com esses quatro eventos principais, em nosso trabalho anterior observamos muitas sequências curtas (<50 nt) semelhantes a flavivírus no Ae. genoma de referência aegypti, que não analisamos na época [1]. Além disso, outras investigações encontraram sequências longas com identidade muito alta (> 95%) para um vírus agente de fusão celular (NC_001564.2), com alguma especificidade geográfica [3, 4]. Outros estudos descobriram que o DNA viral é gerado por mosquitos Aedes durante a infecção por flavivírus [5, 6].

A limitação da nossa abordagem anterior foi o foco nos nrEVEs presentes nos genomas de referência dos mosquitos. Neste breve relatório, abordamos essa limitação examinando a paisagem do suposto DNA flavivviral (pfDNA) em Ae. aegypti independentemente do genoma de referência. Especificamente, pretendemos identificar qualquer pfDNA geograficamente específico que esteja ausente no genoma de referência. Em uma análise robusta, também incluímos deliberadamente sequências de alta qualidade com comprimento de correspondência muito curto entre o DNA do mosquito e as sequências virais para fortalecer quaisquer sinais de sequência conservados em regiões geográficas. Como estamos usando dados de sequenciamento de leitura curta, não somos capazes de determinar se as sequências de pfDNA são intra ou extracromossômicas. Também não reexaminamos as sequências que pertencem aos quatro eventos de integração viral (VIE1 a VIE4), conforme descrito anteriormente [1]. Para nossa análise, alinhamos 464 Ae. aegypti de sequenciamento de genoma completo (WGS) [7] para todas as sequências Flaviviridae do banco de dados NCBI RefSeq (n = 118, em abril de 2020) [7] e nrEVEs que identificamos anteriormente [1] (Tabela 1, arquivo adicional 2: Fig. S1). Para o alinhamento, utilizamos o software bowtie2 [8] com configurações muito sensíveis (-D 15 -R 2 -N 0 -L 11 -i S, 1, 0,75). As leituras mapeadas foram montadas de novo usando o software SPAdes (v3.13.0) [9] em 25.049 contigs, com um número médio de 53 contigs por isolado (intervalo: 8–138). A distribuição dos comprimentos do contig seguiu uma distribuição exponencial com comprimento médio de 200 nt e um contig mais longo de 10.057 nt.

 97%) compared to Calbertado virus [1]. Thus, cluster 3 corresponds to what we previously termed VIE1. Based on our analysis here, the Ae. aegypti AaegL5 reference assembly has only half of the VIE1 sequence. This result is consistent with our previous observation that VIE1 is less conserved than VIE2, VIE3 or VIE4 [1]./p> 95% identity. The cluster was most prevalent in Ghana (19%) and Senegal (13%)./p> 100 nt (Additional file 3: Table S1). This bifurcation of clusters into those that contain only sequences < 50 nt and those that include sequences > 100 nt serves to separate white noise from genuine hits./p> 95% identity to sequences of these VIEs. Consequently, these 46 contigs also had hits against the Ae. aegypti reference genome. In addition, all four Madagascan samples had an identical 606-nt sequence that matched a 743–1349-nt region of a Cell-fusing agent virus with 86% identity. The remaining 516 contigs in the cluster had short (25–72 nt) hits against the viral genome and similar length hits (28–72 nt) against the Ae. aegypti reference genome. In post-clustering quality control, we found that clustering of these sequences was a statistical artifact. The e-value for pairs of contigs without any BLASTn hit was set to 1.0, and as a result the main similarity between these 516 contigs was dissimilarity to other contigs./p>