banner
Centro de notícias
Sólida experiência em gestão da cadeia de suprimentos.

Novos domínios de ligação a carboidratos identificados por telas metagenômicas funcionais baseadas em exibição de fagos da microbiota intestinal humana

Nov 04, 2023

Biologia das Comunicações volume 6, Número do artigo: 371 (2023) Citar este artigo

2236 acessos

1 Citações

10 Altmétrica

Detalhes das métricas

Os micróbios não cultivados representam um enorme recurso biológico inexplorado de novos genes e produtos genéticos. Embora esforços recentes de sequenciamento genômico e metagenômico tenham levado à identificação de numerosos genes que são homólogos a genes anotados existentes, ainda existe um enorme pool de genes não anotados que não encontram homologia de sequência significativa com genes anotados existentes. A metagenômica funcional oferece uma maneira de identificar e anotar novos produtos de genes. Aqui, usamos metagenômica funcional para explorar novos domínios de ligação a carboidratos que podem ajudar comensais intestinais humanos na adesão, colonização intestinal e metabolismo de carboidratos complexos. Nós relatamos a construção e a triagem funcional de uma biblioteca metagenômica de exibição de fagos de amostras fecais humanas saudáveis ​​contra polissacarídeos/glicoconjugados dietéticos, microbianos e hospedeiros. Identificamos várias sequências de proteínas que não encontram um acerto em nenhum domínio de proteína conhecido, mas prevê-se que contenham dobras semelhantes a módulos de ligação a carboidratos. Nós expressamos, purificamos e caracterizamos bioquimicamente alguns desses domínios de proteínas e demonstramos sua função de ligação a carboidratos. Nosso estudo revela vários domínios de ligação a carboidratos não anotados anteriormente, incluindo um domínio de ligação a levan e quatro domínios complexos de ligação a N-glicanos que podem ser úteis para a rotulagem, visualização e isolamento desses glicanos.

A Terra é o lar de comunidades microbianas de aproximadamente 4–6 × 1030 células1 de mais de um trilhão de espécies2, a grande maioria das quais não foi cultivada por técnicas laboratoriais padrão3 ou estudada. As comunidades microbianas representam um reservatório potencial para a mineração de novas enzimas e biomoléculas4. A metagenômica baseada em sequenciamento e a metagenômica funcional, a aplicação de métodos independentes de cultura, serviram como um meio poderoso de entender e explorar a complexidade das comunidades microbianas para a descoberta de novas biomoléculas5. A metagenômica funcional, que envolve a construção de bibliotecas metagenômicas de DNA (usando vetores adequados como cosmídeos, fosmídeos6 ou fagos7) e sua triagem para um fenótipo desejado8, permite a identificação de genes que codificam produtos gênicos com funções desejadas sem qualquer informação prévia sobre seus propriedades com base na similaridade de sequência em bancos de dados públicos. Portanto, esta estratégia, juntamente com o fornecimento de novos genes/proteínas para aplicações biotecnológicas8, também auxilia na atribuição funcional de proteínas designadas como proteínas hipotéticas em bancos de dados9.

O intestino humano é uma paisagem rica em glicanos com enorme complexidade estrutural de glicanos10 decorrente da enorme diversidade de monossacarídeos e ligações glicosídicas nos glicanos endógenos da mucina11,12 no muco do hospedeiro13, bem como em polissacarídeos de plantas dietéticas, como amido, hemicelulose e pectina10. Em contraste com os genomas humanos, que codificam apenas 97 hidrolases de glicosídeos, com apenas 17 quebrando um pequeno subconjunto de ligações glicosídicas presentes em nutrientes de carboidratos como sacarose, lactose e amido, um mini-microbioma construído com 177 genomas de referência da microbiota intestinal humana foi descobriu-se que possui 15.882 diferentes genes de enzimas de carboidratos ativos (CAZyme) responsáveis ​​pelo metabolismo de glicanos14. É evidente que o metabolismo dos nutrientes de carboidratos complexos no intestino é realizado pelos CAZymes dos aproximadamente trilhões de micróbios de aproximadamente 160 espécies que compõem a microbiota intestinal humana15,16,17. Os CAZymes frequentemente têm uma arquitetura modular, com um ou mais domínios catalíticos em conjunto com módulos auxiliares não catalíticos ou módulos de ligação a carboidratos (CBMs)18 que aproximam o módulo catalítico de substratos inacessíveis e, assim, aumentam a concentração efetiva do substrato e eficiência enzimática19. Além das CBMs, outras proteínas, como as lectinas bacterianas, também se ligam a moléculas de carboidratos no intestino20. Assim, o metagenoma microbiano do intestino humano é um enorme tesouro de genes que codificam proteínas de ligação a carboidratos que podem ser exploradas para uma variedade de aplicações21 como tipagem sanguínea22, purificação de afinidade bioespecífica23 e aplicações de direcionamento para terapia antitumoral e antiviral24, e que também pode aumentar nossa compreensão das interações hospedeiro-comensal.

144 bp, indicating enrichment. A high degree of selection was also evident from the high frequency of occurrence of PCR amplicons of the same size among randomly picked phage clones for a given selection condition and sometimes, even for phage clones from different elution conditions (e.g. Fig. 2a–f). We confirmed this by sequencing a few amplicons of the same size and verifying that they had the same sequence. Sequences of all recombinant phage clones identified are listed in Supplementary Data 1, Table S4./p>90% sequence identity amongst Ap-Ap2, Ap-Ap5 and St-Glc2, and amongst Am-Glc2, St-Glc1, and St-Glc5, with the clone Am-Glc2 (197 amino acids long, amylose binder eluted with glucose) mapping almost completely within St-Glc1 (370 amino acids long, starch binder eluted with glucose) (Supplementary Data 1, Tables S4 and S9)./p>50% of their molecular mass12 and a rich oligosaccharide repertoire of ~100 different O-glycan structures that are differentially present along the length of the gut, thereby creating unique niches and potential binding sites along the gut for the colonization of bacteria11,53, perhaps contributing to the varying microbiota composition in different regions of the gut54,55. The ability to bind to or utilize mucin provides a competitive edge in colonization of the gut56,57,58,59, and gut symbionts like Akkermansia muciniphila60, Bifidobacterium61, Bacteroides species58, and Lactobacillus fermentum62 indulge in mucosal glycan foraging, secreting glycoside hydrolases (GHs) for mucin glycan degradation59,63./p>

Based on our biochemical evidence of glycan binding (and the high sequence similarity between MU1 and MU3), we suggest that MG1, MN3 and MU1/MU3 domains be annotated as new CBMs in the CAZy database. Future studies can focus on how these glycan binding domains compare with existing LacNAc binding galectins21,64 and Siaα2-6 binding proteins such as the human influenza A and B virus lectin haemagglutinin65, Pseudomonas aeruginosa pili66, the surface protein antigen (PAc) of Streptococcus mutans67, mushroom Polyporus squamosus agglutinin (PSA)68, and the plant lectins, Sambucus nigra agglutinin (SNA), Sambucus canadensis agglutinin (SCA), Sambucus sieboldiana agglutinin (SSA), Wheat-germ agglutinin (WGA), Trichosanthes japonica (TJA-I), and ML-I of Viscum album69,70,71,72,6 Gal beta 1->4GlcNAc and HSO3(-)- > 6Gal beta 1->GlcNAc specific lectin in tuberous roots of Trichosanthes japonica. Biochemistry 31, 11647–11650 (1992)." href="/articles/s42003-023-04718-0#ref-CR73" id="ref-link-section-d84397227e2617"73./p>144 bp (which is the size of the amplicon expected for a non-recombinant phage amplified by the T7UP and T7DOWN primers) were considered to be recombinant. Enriched recombinant phages were further subjected to Sanger sequencing in-house (at IMTECH, using 16-capillary 3130xl Genetic Analyzer, Applied Biosystems). DNA sequences obtained were translated using ExPASy80 and visualized using FinchTV version 1.4.0. Sequences with more than 30 continuous amino acids (without any stop codon) were considered for further analysis. These metagenomic sequences were subjected to searches against both the protein sequence database, ‘UniRef100’81, and the profile databases, ‘pfamA-full’ and ‘pfamB’31, and ‘dbCAN2’33 using mmseqs282 at a very high sensitivity (-s 8.5). In addition, an all-against-all sequence search of the initial 33 query proteins was also performed. The general command run for these searches was ‘mmseqs easy-search input_protein_seqs search_database output.result_file tmp_directory -s 8.5 --format-mode 2‘. In the search against UniRef100, for each query protein sequence, the top five returned hits were retained and were then further searched for pfamA-full domains as above using mmseqs2. The fields ‘representativeMember_organismName‘ and ‘cluster_representative_name‘ (in Table S5) were obtained using uniprot API81. In the search result against pfamA-full, the field ‘pfam-family_description‘ (in Table S7) was obtained using https://github.com/AlbertoBoldrini/python-pfam (a python interface for pfamA). Three-dimensional structure predictions were performed for all amino acid sequences using a local server installed AlphaFold2, and structures were visualized using reverse rainbow coloring based on pLDDT scores in PyMOL (Schrodinger) (Supplementary Data 2)./p>6 Gal beta 1->4GlcNAc and HSO3(-)- > 6Gal beta 1->GlcNAc specific lectin in tuberous roots of Trichosanthes japonica. Biochemistry 31, 11647–11650 (1992)./p>