Sehr Gastgeber
Nature Communications Band 14, Artikelnummer: 2676 (2023) Diesen Artikel zitieren
1390 Zugriffe
4 Altmetrisch
Details zu den Metriken
Viren in gebauten Umgebungen (BUs) geben Anlass zur Sorge für die öffentliche Gesundheit, werden jedoch im Allgemeinen weniger untersucht als Bakterien. Um die Virusdynamik in BEs besser zu verstehen, bewertet diese Studie Virome aus 11 Lebensräumen in vier Arten von BEs mit geringer bis hoher Belegung. Es wurde festgestellt, dass die Vielfalt, Zusammensetzung, Stoffwechselfunktionen und Lebensstile der Virome vom Lebensraum abhängig sind. Caudoviricetes-Arten sind in Oberflächenlebensräumen in den Naturschutzgebieten allgegenwärtig und einige von ihnen unterscheiden sich von denen, die in anderen Umgebungen vorkommen. Antimikrobielle Resistenzgene werden in Viren identifiziert, die auf Oberflächen leben, die von Insassen häufig berührt werden, und in Viren, die auf der Haut von Insassen vorkommen. Verschiedene CRISPR/Cas-Immunsysteme und Anti-CRISPR-Proteine finden sich in bakteriellen Wirten bzw. Viren, was mit den stark gekoppelten Virus-Wirt-Verbindungen übereinstimmt. Hinweise darauf, dass Viren möglicherweise die Anpassung des Wirts auf eine spezifische Art und Weise an den jeweiligen Lebensraum unterstützen, werden durch eine einzigartige Geninsertion identifiziert. Diese Arbeit zeigt, dass Virus-Wirt-Wechselwirkungen in BEs häufig auftreten und dass Viren integrale Mitglieder von BE-Mikrobiomen sind.
Viren verdienen unsere Aufmerksamkeit, da sie möglicherweise schädliche Auswirkungen auf die menschliche Gesundheit1 haben, aber auch in vielen Ökosystemen eine entscheidende Rolle spielen2,3,4. Gebaute Umgebungen (BUs), in denen Menschen normalerweise den größten Teil ihres Lebens verbringen, beherbergen eine große Vielfalt an Mikroorganismen5, aber die meisten Studien zu BEs haben sich weitgehend auf Bakterien und Pilze konzentriert und Viren außer Acht gelassen6,7. Die Gesamtkonzentration der Viren in BEs wird auf ~105 Partikel/Kubikmeter geschätzt8. Obwohl die Umweltbedingungen der meisten BEs oligotroph sind und als schlecht für mikrobielles Leben geeignet gelten9, wurde in mikrobiellen Gemeinschaften in der Luft eine auffällige Vielfalt an Viren, einschließlich epidemieassoziierter Viren (z. B. SARS-CoV-210 und Gelbfiebervirus11), gefunden und auf Oberflächen in BEs. Einige Studien zu Viromen in öffentlichen Gebäuden (z. B. Kindertagesstätten und Toiletten) konzentrierten sich hauptsächlich auf einen kleinen räumlichen Maßstab und begrenzte Probentypen und untersuchten nicht die bakteriellen Wirte der Viren12,13,14. Eine kürzlich durchgeführte globale Studie, die eine metagenomische Massensequenzierung ohne Virusanreicherung anwandte, lieferte den Beweis, dass Viren auf öffentlichen Oberflächen in BEs allgegenwärtig sind15.
Virus-Wirt-Interaktionen sind von zentraler Bedeutung für die Ökologie und Entwicklung von Mikrobiomen in verschiedenen Ökosystemen4,16,17. Jüngste Fortschritte bei bioinformatischen Werkzeugen haben eine genaue Vorhersage der Assoziation zwischen von Metagenomen abgeleiteten Viren und ihren potenziellen bakteriellen Wirten ermöglicht, einschließlich exakter Übereinstimmungen molekularer Signale (nämlich geclusterter, regelmäßig beabstandeter Short Palindromic Repeat [CRISPR]-Spacer, integriertes Genom und tRNA) und Konsistenz k-mer-Frequenz18. Phagen haben verschiedene Lebensstil- und Übertragungsstrategien entwickelt, wie z. B. den Wechsel des gemäßigt-lytischen Lebenszyklus, die Transduktion und die Störung von Wirtsgenen, um die zelluläre Maschinerie des Wirts für die Reproduktion zu nutzen19. In den meisten Meeres- und Bodenumgebungen sind Phagen oft sehr vielfältig und häufig anzutreffen, wodurch sie routinemäßig einen erheblichen Teil ihrer mikrobiellen Wirte infizieren, was zusammen mit der Expression viruskodierter Hilfsstoffwechselgene (AMGs) im Wirtsgenom eine Schlüsselrolle spielt im globalen Nährstoffkreislauf4,20,21. Aus ökologischer Sicht können Phagen in einer mikrobiellen Gemeinschaft den Wettbewerb zwischen Bakterienarten vermitteln, indem sie mithilfe verschiedener etablierter ökologischer Modelle, darunter die Modelle „Kill-the-winner“ und „huckepack-the-winner“ lytische Infektionen auslösen22.
Während Phagen schnelle genetische und phänotypische Veränderungen in Bakterien vorantreiben können, können Bakterienwirte auch leicht Abwehrmechanismen entwickeln, um Phagenangriffen durch De-novo-Mutationen und andere molekulare Mechanismen entgegenzuwirken23. Kürzlich wurden in einer körperweiten metagenomischen Studie am Menschen verschiedene funktionelle CRISPR/CRISPR-assoziierte (Cas) Systeme in Bakterien identifiziert24. Um jedoch das Immunsystem des Wirts zu antagonisieren, haben Phagen Anti-CRISPR-Proteine (Acr) entwickelt, um bakterielle Cas-Nukleasen während der Infektion zu inaktivieren25. Die langfristige Inaktivierung von CRISPR/Cas durch Inhibitorphagen kann bei einigen Bakterienlinien zum Verlust oder sogar zum Fehlen von CRISPR/Cas führen26.
Über CRISPR/Cas-Systeme wurde weltweit in Oberflächenmikrobiomen in städtischen Umgebungen berichtet15; Allerdings sind die Immunmechanismen der Infektion und die Virus-Wirt-Interaktionen (z. B. das Ausmaß der Virus-Wirt-Verbindungen, der vorherrschende virale Lebenszyklus und die Neuheit der Acr-Proteine), die in BEs auftreten, kaum verstanden. Um diese Wissenslücke zu schließen und die Diversität und Ökosystemfunktionen von Viren in BEs zu untersuchen, wurden in dieser Studie 738 Massenmetagenome aus verschiedenen Lebensräumen in verschiedenen BEs in Hongkong (HK) untersucht. Die in dieser Studie identifizierten hochgradig gekoppelten Virus-Wirt-Wechselwirkungen stützen die Annahme, dass Viren die Anpassung bakterieller Wirte an die spezifischen Umweltbedingungen von BEs unterstützen und dass die Häufigkeit der meisten Bakterienpopulationen in BEs stark mit ihren residenten Viren korreliert. Diese Studie liefert Beweise dafür, dass Viren integrale Mitglieder des BE-Mikrobioms sind.
Aus den 738 Massenmetagenomen, die von ländlichen und städtischen BEs in Hongkong gesammelt wurden, darunter Piers, öffentliche Einrichtungen, Wohnhäuser und U-Bahnen (Abb. S1a, Ergänzende Daten 1), wurden mit MetaWRAP etwa 4,5 Millionen zusammengesetzte Contigs generiert (siehe „Methoden“). mit Längen meist zwischen 1 und 3 kb wurden erhalten (Abb. S1b). Virale Contigs wurden mit Visorter227 und DeepVirFinder28 identifiziert; Letzteres zeigte eine bessere Leistung bei kürzeren Contigs (1–3 kb; Abb. S1c). Insgesamt wurden aus allen Proben 594.851 einzigartige Virus-Contigs mit Längen ≥ 1 kb gewonnen (Abb. 1a). Nach der Qualitätsfilterung wurden 1174 virale Genome mit einer Vollständigkeit von ≥ 50 % (98 vollständige, 346 hochwertige und 730 mittlere Genome) identifiziert (Abb. S1d, Zusatzdaten 2). Diese Genome waren in allen vier Arten von BEs gut vertreten (Abb. 1b), wobei 66 % davon auf Oberflächen in Wohnhäusern nachgewiesen wurden (Abb. 1c). Trotz der Analyse der Massenmetagenome zeigten nur 28 % der Virusgenome Hinweise auf eine Wirtsintegration, basierend auf einer Bewertung der Provirus-Integrationsstellen (dh die Wirtsregion wurde an beiden Enden der Virusgenome vorhergesagt) (Abb. 1c). Von den 471 identifizierten viralen operativen taxonomischen Einheiten (vOTUs) wurden 355 in mindestens zwei Proben gefunden (Abb. S2a); Unter den BE-Typen wurden die meisten vOTUs in Wohnhäusern gefunden. Bei einem höheren taxonomischen Ranking wurden die viralen Genome in 332 bzw. 220 vOTUs auf Gattungs- und Familienebene gruppiert. Die Verdünnungskurven der vOTUs erreichten kein Plateau, was darauf hindeutet, dass zusätzliche Proben erforderlich sind, um die Virom-Diversität in BEs innerhalb einer Stadt zu erfassen (Abb. S2a).
a Boxplots der Contig-Längen der vorhergesagten viralen und nicht-viralen Contigs >1 kb, bestimmt durch Virsorter2 (Vs2) und DeepVirFinder (DVF) und bewertet durch CheckV. Die Anzahl der Contigs (n) wird angegeben. Boxplots stellen den Median, die ersten und dritten Quartile dar, wobei die Whisker innerhalb des Interquartilbereichswerts von 1,5 gezeichnet werden. Punkte außerhalb der Whiskers sind Ausreißer. b Akkumulationskurven der viralen Genome in den kombinierten Datensätzen für Pier, öffentliche Einrichtungen, Wohnsitz und U-Bahn. c Metadaten und Taxonomie von 1174 Virusgenomen mit einer Vollständigkeit von >50 %. d Hauptkoordinatenanalyse der Bray-Curtis-Unähnlichkeitsmatrix für alle Proben. Die Farbe und Form der Symbole weisen auf die gebaute Umgebung bzw. die Oberflächenmaterialien hin.
Da die Proben aus unterschiedlichen Lebensräumen in Bezug auf Quellen (z. B. Luft und Oberfläche) und Materialien (z. B. Beton, Metall und Holz) gesammelt wurden, wurden die lebensraumabhängigen Merkmale der Virome weiter untersucht. Virale Genome wurden am häufigsten aus der Haut der Bewohner (21 % aller Proben) und Türklinken (15 %) und am seltensten aus der Luft (2 %) gewonnen (Abb. S2b). Die Viromzusammensetzung unterschied sich größtenteils zwischen den Lebensräumen (Ähnlichkeitsanalyse R = 0,355, p < 0,001), und die permutationelle multivariate Varianzanalyse bestätigte, dass der Lebensraum der Haupttreiber der Variation war (R2 = 0,148, p < 0,001) (Abb. 1d). Das luftgetragene Virom unterschied sich von den oberflächengetragenen Viromen mit einer geringen Varianz innerhalb des Lebensraums gemäß der Bray-Curtis-Dissimilaritätsdistanz in der Hauptkoordinatenanalyse und der Homogenität multivariater Dispersionen (Permutationsanalyse multivariater Dispersionen F = 53,29, p < 0,001) (Abb. 1d, S2c). Darüber hinaus wiesen die vOTUs auf Handläufen, Stangen und Ticketschaltern einen deutlich geringeren Reichtum und Shannon-Diversitätsindex auf als die vOTUs auf der Haut der Bewohner und häufig berührten Innenflächen (z. B. Türklinken) (Varianzanalyse [ANOVA], p < 0,05; Abb. S2d, Ergänzende Daten 3). Die Artengleichmäßigkeit variierte erheblich zwischen den Lebensräumen (ANOVA, p <0,05), aber die durchschnittlichen Gleichmäßigkeitswerte aller Lebensräume lagen bei > 0,85 (Abb. S2d), was darauf hindeutet, dass kein Lebensraum dominante vOTUs aufwies.
Anschließend wurden die vOTUs taxonomischen Rängen zugeordnet, basierend auf einem Vergleich mit bekannten Virussequenzen aus der Datenbank „Integrated Microbial Genome and Viral (IMG/VR)“29. Die meisten vOTUs (92,4 %) konnten taxonomisch nicht einer bekannten Virusgattung oder -familie zugeordnet werden, ähnlich der gemeldeten Neuheitsrate für die aus anderen Ökosystemen gesammelten Virome2,30, und konnten nur als nicht klassifizierte Mitglieder der Klasse Caudoviricetes aufgelöst werden (Abb. 1c). Unter den annotierten vOTUs gehörten 1,7 %, 1,7 %, 1,3 % und 0,6 % zur dsDNA-Virusgattung Pahexavirus, zur ssRNA-RT-Virusfamilie Metaviridae, zur ssDNA-Virusfamilie Genomoviridae bzw. zur ssDNA-Virusfamilie Inoviridae (Abb. S3). Insbesondere waren die Mitglieder der Familie Autographiviridae, einer umfassend untersuchten Familie virulenter Phagen31, in der U-Bahn-Luft angereichert und dominant (Abb. S3, Zusatzdaten 4); Im Gegensatz dazu kamen die Mitglieder der Gattung Pahexavirus häufig auf Türklinken und Hautoberflächen vor (Abb. S3, Ergänzende Daten 4), was nicht überraschend ist, da gezeigt wurde, dass diese Hautbakterien (z. B. Propionibacterium32) infizieren. Darüber hinaus wurden die Mitglieder der Ordnung Orthopolintovirales, einer neuen Gruppe von Viren, die als Virophagen bekannt sind33, auch auf menschlichen Hautoberflächen angereichert (Abb. S3). Bemerkenswert ist, dass die humanassoziierten Papillomaviren der Familie Papillomaviridae, die direkt oder indirekt über Hautkontakt übertragen werden können34, hauptsächlich in häufig berührten Lebensräumen (z. B. Türklinken, Ticketschaltern und Handläufen in öffentlichen Einrichtungen) gefunden wurden (Abb. S3a).
Caudoviricetes, eine Klasse von Viren mit einem helikalen Schwanz und einem ikosaedrischen Kapsid (Schwanzbakteriophagen), ist in verschiedenen Ökosystemen weit verbreitet2,30. Um zu untersuchen, ob die Mitglieder von Caudoviricetes, die in den BE-Lebensräumen vorhanden waren, einen gemeinsamen evolutionären Ursprung besitzen, wurde ein phylogenetischer Baum mit 87 vOTUs auf Artenebene unter Verwendung von 77 Referenzprotein-kodierenden Markergenen erstellt (Abb. 2a). Der Baum zeigte, dass die Caudoviricetes-vOTUs, die in verschiedenen BE-Lebensräumen weit verbreitet waren, aber nicht über die IMG/VR-Datenbank klassifiziert werden konnten, zur Gattung Bendigovirus gehörten, wohingegen eine bestimmte Klade mit einem unbekannten vOTU zur Gattung Oshimavirus gehörte (Abb. 2a). .
a Ein phylogenetischer Baum mit maximaler Wahrscheinlichkeit von 87 vOTUs auf Artenebene, die von BEs abgeleitet wurden. Die Zweige der beiden Cluster von Oshimavirus und Bendigovirus sind in hellgrün bzw. orange dargestellt. Die grauen und weißen Kreise kennzeichnen die neuartigen Caudoviricetes-Viren. b Ein phylogenetischer Baum mit maximaler Wahrscheinlichkeit von 599 vOTUs auf Artenebene, abgeleitet aus BEs und anderen Datensätzen (SMGC, GOV und MetaSUB). Zweige der neuartigen Caudoviricetes vOTUs sind rot dargestellt. Abstammungslinien mit Zweiglängen <0,5 kb wurden zu einer Klade zusammengefasst und sind im äußeren Ring weiß dargestellt.
Die Phylogenie der Caudoviricetes-Mitglieder aus den HK BEs wurde weiter anhand von drei anderen Datensätzen von Viromen analysiert, nämlich Hautmetagenomen hauptsächlich von Probanden in Nordamerika (der Skin Microbial Genome Collection [SMGC]-Datensatz)35 und dem Global Ocean Viromes [GOV]-Datensatz36 und der Datensatz „Metagenomics and Metadesign of the Subways and Urban Biomes“ [MetaSUB]15. Wie erwartet rekrutierten die von den HK-BEs abgeleiteten viralen Genome 18,9 % der Sequenzierungsablesungen aus dieser Studie, was deutlich mehr als 0,3 % bzw. 0 % aus den SMGC- bzw. GOV-Datensätzen war (Abb. S4a). Das Ergebnis des GOV-Datensatzes (0 %) zeigt, dass Viren in der Meeresumwelt aus anderen Abstammungslinien stammen als diejenigen in den BEs, die starken anthropogenen Einflüssen ausgesetzt sind (Abb. S4a). Aus den vier Datensätzen wurde außerdem ein phylogenetischer Baum mit 599 vOTUs auf Artenebene erstellt. Es zeigte sich, dass die vOTUs der HK-BEs phylogenetisch näher an denen in den SMGC- und MetaSUB-Datensätzen lagen als an denen im GOV-Datensatz (Abb. 2b). Basierend auf den Zweiglängen wiesen die vOTUs aus den HK-BEs und dem Meerwasser eine vergleichsweise hohe phylogenetische Diversität auf (Abb. S4b). Dennoch waren einige der vOTUs der HK-BEs gruppiert (Abb. 2b), was darauf hindeutet, dass die BE-Lebensräume für bestimmte vOTUs selektiv waren.
Um die potenziellen funktionellen Rollen zu untersuchen, die Virome in den BE-Mikrobiomen von Hongkong spielen, wurden 99.084 proteinkodierende Gene, die in den Viromen identifiziert wurden, mithilfe mehrerer Datenbanken annotiert. Die Ergebnisse zeigten, dass 38 % der proteinkodierenden Gene keine signifikante Datenbankübereinstimmung aufwiesen und etwa 2 % keine biologischen Funktionen zugewiesen wurden (Abb. 3a, b), was darauf hindeutet, dass wenig über die potenziellen Funktionen von Viromen in BEs bekannt ist . Um die gemeinsamen Funktionen der Virome weiter zu identifizieren, wurden alle proteinkodierenden Gene in 24.145 De-novo-proteinkodierende Gencluster geclustert, und 43,1 % dieser Cluster hatten mindestens zwei Gene (Abb. 3c). Die Akkumulationskurve proteinkodierender Gencluster war ungesättigt, was darauf hinweist, dass die gesammelten Proben eine große Funktionsvielfalt aufweisen (Abb. 3d). Die größten proteinkodierenden Gencluster mit >50 Genen kodierten hauptsächlich Proteine mit Funktionen im Membrantransport (d. h. ABC-Transporter) und direkter/indirekter Transkriptionsregulation zur Steuerung der Genexpression, Genomreplikation und Übertragung auf andere Wirtszellen (d. h. Reaktionsregulator). ) (Abb. 3e). Andere gemeinsame virale Funktionen wie Verpackung, Zusammenbau und Lyse wurden ebenfalls in den größten Clustern gefunden (Abb. 3e).
a Der Prozentsatz und die Anzahl der proteinkodierenden viralen Gene, die identifiziert und zwischen den fünf Datenbanken geteilt wurden. b Prozentsatz der Gene, die einer Datenbank zugeordnet werden konnten oder nicht. c Prozentsatz der Protein-kodierenden Gencluster, die einer Datenbank zugeordnet werden konnten oder nicht, und Größenverteilung der Protein-kodierenden Gencluster basierend auf der Anzahl der Gene. d Eine Akkumulationskurve der proteinkodierenden Gencluster. e Funktionelle Annotation der proteinkodierenden Gencluster mit >50 Genen. Der proteinkodierende Gencluster, der Beta-Lactamase kodiert, ist rot hervorgehoben. f Die Anzahl viraler Gene mit mutmaßlichen Beta-Lactamase-Domänen basierend auf den Datenbanken Pfam und Kyoto Encyclopedia of Genes and Genomes (KEGG). g Die Anzahl der antimikrobiellen Resistenzgene (ARGs), die Beta-Lactamasen kodieren, basierend auf den Datenbanken Resistance Gene Identifier (RGI) und Resfams. Das Venn-Diagramm fasst die Anzahl der identifizierten ARGs in den beiden Datenbanken zusammen und das Balkendiagramm zeigt die Verteilung der ARGs über BE-Lebensräume.
Während Studien an Darmviromen gezeigt haben, dass Phagen selten ARGs kodieren30, 37, ist unklar, ob diese Eigenschaft auch bei Viren in BEs häufig vorkommt. Basierend auf versteckten Markov-Modellsuchen in den Datenbanken Pfam38 und Kyoto Encyclopedia of Genes and Genomes (KEGG)39 wurden 53 einzigartige Protein-kodierende Gencluster identifiziert, die mutmaßliche Beta-Lactamase-kodierende Gene enthielten (Abb. 3f), und die meisten ARGs wurden aus Viren gewonnen, die die menschliche Haut bewohnen. Der größte proteinkodierende Gencluster enthielt 55 Gene, die für die Metallo-Beta-Lactamasen-Superfamilie (PF00753) kodierten, und Gene, die für die LysR-Familie der Transkriptionsregulatoren (K17850) kodierten (Abb. 3e). Um die Antibiotikaresistenzfähigkeit der BE-Virome weiter zu validieren, wurde eine Homologiesuche in den kuratierten ARG-Datenbanken mit Resfams40, NCBI AMRFinderPlus41 und dem Resistance Gene Identifier (RGI)42 durchgeführt. Es wurden 63 Beta-Lactamase-kodierende Gencluster identifiziert, darunter 45 von Resfams und 19 von RGI, aber keiner von AMRFinder, und diese Cluster waren hauptsächlich auf Poller-, Türklinken- und Hautoberflächen verteilt (Abb. 3g). Bei der Suche gegen Resfams wurden auch andere potenzielle ARGs identifiziert, darunter ermAC, vanABCDHRXZ und tetADEHY (Abb. S5), die Resistenzen gegen Erythromycin43, Vancomycin44 bzw. Tetracyclin45 verleihen.
Die Vorhersage der zellulären Wirte von Viren ist wichtig für das Verständnis der Dynamik von Virus-Wirt-Interaktionen und potenzieller Koevolutionsmechanismen; Daher wurden sowohl In-situ- als auch Ex-situ-Wirte identifiziert, um die Wirtszuordnung zu maximieren21. Die erhaltenen Ex-situ-Virus-Wirt-Verbindungen deckten 122 vOTUs ab, was 31 % der Genome ausmachte (Supplementary Data 5, Abb. S6a). Bei der Vorhersage von Ex-situ-Wirten anhand von Genom-Spacer-Übereinstimmungen wurden nur Bakterien berücksichtigt. Die dominanten Wirte waren die Bakteriengattungen Corynebacterium, Barrientosiimonas, Micrococcus und Kocuria, die zur Klasse Actinomycetia gehören (Abb. S6b). Um die Wechselwirkungen zwischen Viren und ihren In-situ-Wirten systematisch aufzuklären, wurde eine umfangreiche Assemblierung mikrobieller Genome aus demselben Datensatz durchgeführt, die dazu führte, dass 58 % der viralen Genome mit einem Satz von 860 repräsentativen metagenomassemblierten Genome (rMAGs) verknüpft wurden. (Ergänzende Daten 6, Abb. S6a). Zwei weitere Methoden – WIsH46- und tRNA-Matches – wurden ebenfalls verwendet, um die Verbindungen zwischen rMAGs und Viren zu identifizieren, was dazu führte, dass weitere 17 % der viralen Genome mit In-situ-Wirten abgeglichen wurden (Abb. S6a). Insgesamt wurden In-situ-Wirte für 349 vOTUs oder 81 % der viralen Genome vorhergesagt (Supplementary Data 7), was etwa dreifach höher war als die Anzahl der vOTUs oder der Prozentsatz viraler Genome, für die Ex-situ-Wirte vorhergesagt wurden dass Viren in den BEs ein enges Wirtsspektrum haben. Ein Netzwerk für die In-situ-Virus-Wirt-Verbindungen auf Familienebene wurde weiter aufgebaut, und die am häufigsten vorhergesagten Wirte gehörten zur Familie der Mycobacteriaceae, gefolgt von Dermatophilaceae und Micrococcaceae (Abb. 4a).
a Ein Netzwerkdiagramm, das Viren und ihre vorhergesagten bakteriellen Wirte auf Familienebene veranschaulicht. Die Kreise und Rauten geben die vorhergesagten Bakterienwirte bzw. Viren an, und die Kanten sind entsprechend den Vorhersagemethoden gefärbt. Die Häufigkeit der in einem Lebensraum auftretenden Virus-Wirt-Verbindungen ist rechts dargestellt. b Die relative Häufigkeit von Wirten und Viren (gruppiert nach der vorhergesagten Wirtstaxonomie) basierend auf der Lesekartierung der 614 Massenmetagenome von BEs (linkes Feld). Die Taxonomie wird nach der durchschnittlichen Wirtsbedeckung aller Lebensräume geordnet. Pearsons Korrelation der Paare relativer Virus-Wirt-Häufigkeiten in jeder Probe (mittleres Feld). Signifikant korrelierte relative Häufigkeiten (p < 0,05) werden gemäß dem Pearson-Koeffizienten eingefärbt (mittleres Feld). Dargestellt sind die durchschnittlichen Virus-Wirt-Häufigkeitsverhältnisse in den 614 Proben (gelber Kreis) und die Prozentsätze der Viren mit und ohne lytische Proteine (Balkendiagramm) (rechtes Feld). Die genauen p-Werte sind in den Zusatzdaten 8 aufgeführt.
Um die möglichen Einflüsse von Viren auf die mikrobielle Ökologie in BEs weiter zu untersuchen, wurde die Virusinfektionsdynamik bestimmter Wirtslinien in verschiedenen Lebensräumen auf der Grundlage der linienspezifischen Virus-Wirt-Häufigkeitsverhältnisse auf Familienebene der Wirte bewertet (Abb. 4b). Unter den verschiedenen Abstammungslinien wurden unterschiedliche Virus-Wirt-Häufigkeitsverhältnisse beobachtet, wobei die relative Häufigkeit der Viren häufig unter der der Wirte lag, mit Ausnahme der Bakterienfamilie Parvularculaceae (Abb. 4b). Die meisten abstammungsspezifischen Virus-Wirt-Häufigkeitsbeziehungen (31 von 42) unterschieden sich erheblich zwischen den Lebensräumen (Ergänzungsdaten 8). Beispielsweise wurden signifikante Korrelationen mit hohen Pearson-Koeffizienten (≥ 0,75) zwischen Virus- und Wirtshäufigkeiten für die Bakterienfamilien Caulobacteraceae, Dermabacteraceae und Dermatophilaceae auf Wohnflächen und für die Familie Chroococcidiopsidaceae auf Pieroberflächen gefunden (Abb. 4b, Ergänzende Daten 8). . Allerdings variierte die taxonomische Verteilung von Wirten und Viren erheblich (ANOVA, p <0,01) zwischen den Lebensräumen in den Piers, wohingegen sie zwischen den Lebensräumen in den Residenzen relativ homogen war (Abb. 4b). Interessanterweise waren Proteine, die mit dem Lysezyklus in Zusammenhang stehen, häufiger bei Viren mit höheren Virus-Wirt-Häufigkeitsverhältnissen anzutreffen (Abb. 4b), was darauf hindeutet, dass ein potenzieller Anstieg der lytischen Virusinfektion das Wirtswachstum und die Wirtshäufigkeit verringert. Umgekehrt wurden mehr Viren mit lysogenen Zyklen mit dominanten Wirten (z. B. Micrococcaceae und Dermatophilaceae) in den meisten Lebensräumen in Verbindung gebracht (Supplementary Data 2, Supplementary Data 7), was die Piggyback-the-Winner-Hypothese stützt22. Bemerkenswerterweise wurde ein geringerer Anteil von Viren mit lysogenen Zyklen in vielen Lebensräumen beobachtet, die rauen Umweltbedingungen ausgesetzt waren, wie z. B. der Luft in U-Bahnen und Böden und Handläufen in Piers (Abb. S7).
Stark gekoppelte Virus-Wirt-Verbindungen können zu CRISPR-Acr-Wechselwirkungen in Prokaryoten führen47. Um diese Wechselwirkungen zu untersuchen, wurden 2.478 CRISPR-Spacer aus 25 % der rMAGs extrahiert und es wurde festgestellt, dass sie in Mitgliedern der Bakterienfamilien Micrococcacea, Mycobacteriaceae und Deinococcaceae weit verbreitet sind (Supplementary Data 7). Allerdings waren nur 2 % der Spacer im selben Datensatz mit den Virusgenomen verknüpft. Insbesondere wurde in rMAGs ein vollständiges CRISPR/Cas-System mit einer Provirus-Integration identifiziert (Abb. 5a), was darauf hindeutet, dass Acr-Proteine in den Viren vorherrschend waren, um die CRISPR/Cas-Abwehr zu parieren. Um dies zu bestätigen, wurden zunächst die Cas-kodierenden Gene in allen rMAGs identifiziert: 34 rMAGs enthielten CRISPRs der Typen I und III, die mit den Systemen Cas1, Cas2 und Cas10 assoziiert waren, wobei Typ I der dominierende CRISPR-Typ war (Supplementary Data 9). . Als nächstes wurde PaCRISPR48 verwendet, um Acr-Proteine aus den 99.084 gefundenen Virusproteinen und 6.283 mutmaßlichen Proteinen vorherzusagen. Nach dem Herausfiltern der Acr-Proteine basierend auf ihren benachbarten Helix-Turn-Helix (HTH)-Domänen enthaltenden Proteinen und dem Abgleich mit der Proteindatenbank und der Conserved Domains Database49 wurden 162 Proteinfamilien als potenzielle Acr-Proteine identifiziert und die meisten davon gefunden von Caudoviricetes-Viren übertragen werden (Supplementary Data 10). Insgesamt wurden mehrere mögliche Acr-Typen identifiziert (d. h. AcrIB, AcrIF und AcrIIA), wobei Acr-Proteine vom Typ I den größten Acr-Cluster bilden, da sie in verschiedenen Lebensräumen (außer Luft) verbreitet sind (Abb. S8). Der AcrIA-Cluster stimmte auch mit dem in den MAGs gefundenen Haupt-Cas-Cluster vom Typ I überein (Supplementary Data 9).
a Die vollständigen CRISPR/Cas-Systeme, die in zwei Proviren identifiziert wurden. Der CRISPR-Locus ist rot hervorgehoben. b Der potenzielle Acr-Mechanismus in einem Virus, der mithilfe von Spacer-Matching mit einem Wirt verknüpft werden könnte, wird durch ein rot gestricheltes Kästchen hervorgehoben. Das Acr-Protein ist durch einen Stern gekennzeichnet und der CRISPR-Locus ist rot hervorgehoben. c Ein phylogenetischer Baum mit maximaler Wahrscheinlichkeit der 162 Acr-Proteine, die in dieser Studie identifiziert wurden, und der 339 Acr-Proteine, die aus der kuratierten PaCRISPR-Datenbank erhalten wurden48. Die Zweige der neun neu vorhergesagten Acr-Proteine sind rot dargestellt. Die roten Sterne am äußeren Ring kennzeichnen die vorhergesagten Acr-Proteine mit Strukturen mit hoher Konfidenz (plDDT > 80), basierend auf dem AlphaFold2-Tool. d Vergleich der hochzuverlässigen Strukturen (plDDT > 80) der vier neu vorhergesagten Acr-Proteine mit ihrer nächsten Referenz.
Basierend auf der Spacer-passenden Virus-Wirt-Verbindung fanden wir Hinweise auf ein Typ-I-Acr-Protein, das an der Hemmung des Typ-I-CRISPR/Cas-Systems beteiligt ist. Es wurde festgestellt, dass ein Siphoviridae-Virus (SL336563_c_18_full), das aus der Handfläche eines Bewohners gewonnen wurde, ein Acr0001-kodierendes Gen trägt (Abb. 5b), das laut einer Homologiesuche anhand der von Acr kuratierten Datenbank48 und eines phylogenetischen Baums (Abb. 5c) sein kann Wird verwendet, um die Typ-I-CRISPR/Cas-Immunität zu umgehen. Dieses Ergebnis steht im Einklang mit den CRISPR/Cas-Systemen vom Typ I–E, die in von Türklinken getragenen Wirten aus demselben Wohnort gefunden wurden. Die Entwicklung einer CRISPR-Resistenz kann zu einem schnellen Aussterben von Phagen führen, insbesondere wenn die CRISPR/Cas-Systeme eine hohe Diversität an Spacern aufweisen25. Interessanterweise wurde kein integrierter Phagen in einem rMAG (SL336752_bin.1_c_05) gefunden, in dem nur ein Contig vier CRISPR-Loci mit 86 einzigartigen CRISPR-Spacern beherbergte.
Neun der 162 vorhergesagten Acr-Proteine wurden als neu angesehen, dh sie stimmten nicht mit einer bekannten Referenz mit einem BLAST-basierten Hit-E-Wert <0, 001 überein (Supplementary Data 10). Ein phylogenetischer Baum wurde erstellt, um die Einzigartigkeit aller vorhergesagten Acr-Proteine weiter zu bestimmen, von denen festgestellt wurde, dass sie in verschiedenen Subtypen weit verbreitet sind (Abb. 5c). Die Computermodellierung aller vorhergesagten Acr-Proteine zeigte unterschiedliche Strukturen (bei 48 wurde davon ausgegangen, dass sie ein hohes Vertrauen aufweisen [plDDT > 80]) (Abb. S9). Der Vergleich der hochzuverlässigen Strukturen der vier neu vorhergesagten Acr-Proteine mit ihren engsten Referenzen ergab Unterschiede, die möglicherweise für die Variationen in ihren Funktionen verantwortlich sind (Abb. 5d). Mehrere vorhergesagte Acr-Proteine befanden sich in vollständigen zirkulären vOTUs (mit lysogenen und lytischen Zyklen) unbekannter Familien (Abb. S10a–b), was darauf hindeutet, dass diese Proteine eine Rolle bei der Entwicklung schlecht charakterisierter Caudoviricetes-Viren spielen. Einige Acr-Proteine befanden sich zwischen den Integrase- und Terminase-Untereinheiten in Viren mit lysogenen Zyklen (Abb. S10a), während andere sich in der Nähe der Terminase-Untereinheiten in Viren befanden, die lytische Zyklen durchführen (Abb. S10b), was darauf hindeutet, dass die Acr-kodierenden Gene vorhanden sind wird nicht nur beim ersten Eintritt und während der Lysogenese exprimiert, sondern auch beim Übergang in den Lysezyklus, um die Spaltung der Phagengenome der Nachkommen durch CRISPR/Cas-Systeme zu verhindern, wie zuvor in Listeria-Phagen gezeigt50. Darüber hinaus wurde eine Reihe lytischer Gene, einschließlich derjenigen, die für Endolysine, das Rz-Lyseprotein, Holin und Holin-Antiholin kodieren, von spezifischen vollständigen zirkulären vOTUs mit lysogenen Zyklen getragen (Abb. S10a). Umgekehrt enthielt ein vollständiger zirkulärer vOTU (SL336690_c_82__full), der lytische Zyklen durchführt, immer noch eine Integrase (Abb. S10b), was darauf hindeutet, dass dieses Virus einen Übergang von einem lysogenen zu einem lytischen Zyklus durchläuft, wenn sich die Umweltbedingungen ändern51.
Studien haben gezeigt, dass Viren in vielen Ökosystemen AMGs besitzen, die am Stoffwechsel des Wirts beteiligt sind, um ihre Anpassung an die Umwelt zu erleichtern3, 4. Die AMGs in den BE-Viromen wurden untersucht und 468 mutmaßliche AMGs wurden gefunden, darunter 86 mit unbekannten Funktionen (Supplementary Data). 11). Es wurde festgestellt, dass die meisten AMGs mutmaßlich eine Rolle im Stoffwechsel von Cofaktoren und Vitaminen (24 %), im Kohlenhydratstoffwechsel (22 %) und im Aminosäurestoffwechsel (18 %) spielen. Bemerkenswerterweise unterschieden sich die von Viren in Innenräumen übertragenen AMGs deutlich von denen in Außenräumen (Abb. 6a). Es wurde festgestellt, dass das essentielle Enzym dUTPase, das an der Regulierung der zellulären dTTP/dUTP-Spiegel beteiligt ist und für die Genauigkeit der DNA-Reparatur und -Rekombination52 entscheidend ist, in einigen Viren der BEs kodiert ist (Abb. 6a, Abb. S10a, b). . Es ist jedoch unklar, warum Viren ein Enzym kodieren, das in Eukaryoten und Prokaryoten weit verbreitet ist52.
a Eine Heatmap der durchschnittlichen Häufigkeit jedes AMG in den BE-Lebensräumen. Die durchschnittliche Häufigkeit wurde auf der Grundlage der durchschnittlichen Häufigkeit der Viren berechnet, die die entsprechenden AMGs in jedem Lebensraum beherbergen. b Ein Schema, das die Einfügung von Genen durch einen Virus veranschaulicht, der das Wirtsgenom zerstört. Der Bereich der Gene im Wirt, der basierend auf einer vergleichenden Genomanalyse mit einem eng verwandten Stamm fehlte, wird durch ein graues gestricheltes Kästchen hervorgehoben. c Ein Schema, das den Einbau von zwei AMGs veranschaulicht, die einen bestimmten Schritt der Sulfatreduktion durch ein Virus in einen Wirt steuern. Die provirale Region wird durch ein graues gestricheltes Kästchen hervorgehoben, und die AMGs werden durch ein rot gestricheltes Kästchen hervorgehoben. Dargestellt sind die Wirtsgene (schwarzer gestrichelter Kasten) und die am Schwefelstoffwechsel beteiligten Wege. d Ein Schema, das die Einfügung von fünf AMGs, die den gesamten präQ0-Biosyntheseweg kodieren, durch ein Virus in einen Wirt veranschaulicht. Die AMGs werden durch ein rot gestricheltes Kästchen hervorgehoben.
Bei einer Zellinfektion integrieren einige Viren ihr Genom in das Wirtschromosom und zerstören so die Wirtsgene19. Konkret wurde ein Provirus (SL336669_c_04) in einem Wirt gefunden, dessen Genom mit Ausnahme der Region mit der viralen Insertion dem Referenz-Paracoccus marcusii (CP041041.1) sehr ähnlich war (83,5 % ± 5,7 %). Die vom Provirus eingefügten Gene kodieren Kälteschockproteine, ABC-Transporter für Zucker und Kohlenhydrate sowie Proteine, die bei der Arsenresistenz und Energieumwandlung eine Rolle spielen53 (Abb. 6b). Die virale Insertion hatte auch die ftsAWZ-Gene, die für Zellteilungsproteine kodieren, und die nrdEFHI-Gene, die für eine Ribonukleotidreduktase kodieren, die Desoxyribonukleotide für die DNA-Synthese und -Reparatur im Wirtsgenom bereitstellt, zerstört. Ein Vergleich der Genome zwischen dem hier identifizierten Provirus und einem bekannten P. marcusii-Phagen54 ergab keine Ähnlichkeit.
Zusätzlich zur Genominsertion gab es Hinweise auf eine virale Insertion von AMGs in das Genom zweier Wirte, die möglicherweise den Stoffwechsel der Wirte veränderte und ihre Anpassungsfähigkeit an einen Lebensraum verbesserte. Auf der Oberfläche eines Pollers an einem Pier wurde festgestellt, dass ein Provirus (SL345587_c_14) zwei AMGs (cysH und ubiE) in das Genom eines Wirts (SL345587_bin.2) eingeführt hat, der zur Familie der Acetobacteraceae gehört (Abb. 6c). CysH kodiert für eine 3′-Phosphoadenylylsulfat-Reduktase, die durch Umwandlung von Sulfat Sulfit erzeugt, das Teil des Schwefelwasserstoff-Biosynthesewegs im Schwefelstoffwechsel ist55. Andere Gene, die für den Schwefelstoffwechsel verantwortlich sind, wurden ebenfalls im rMAG identifiziert, darunter cysNCDH, das an der Regulierung der Bildung von 3′-Phosphoadenosin-5′-phosphosulfat (PAPS) beteiligt ist, cysJI, das für Sulfitreduktase im assimilatorischen Sulfatreduktionsweg kodiert, und cysQ, das ein erzeugt Adenosin-5′-Phosphosulfatreduktase aus PAPS und andere soxABZY-Gene, die am Schwefeloxidationssystem beteiligt sind (Abb. 6c). Neben der Synthese von Sulfit kann CysH auch den Pool an zellulärem PAPS steuern, das toxisch ist, wenn es sich ansammelt56. Ein weiterer von der Türklinke in Innenräumen übertragener Wirt der Mycobacteriaceae (SL345927_bin.2) wurde mit einem viralen Genom (SL345921_c_18_full) verknüpft, das von der rechten Handfläche stammt. Es wurde festgestellt, dass die AMGs (queCDEF und folE), die Enzyme kodieren, die am gesamten Biosyntheseweg von 7-Cyano-7-Deazaguanin (preQ0) beteiligt sind, in das Wirtsgenom integriert sind (Abb. 6d). Die Gene, die für die PreQ0-Biosynthese kodieren, wurden in den verfügbaren Mycobacteriaceae-Genomen nicht gefunden (von NCBI: txid1762). Zusammengenommen legen diese Ergebnisse nahe, dass der Stoffwechsel der Wirte in BEs durch eine Virusinfektion beeinflusst werden kann, was ihre Anpassungsfähigkeit an einen bestimmten Lebensraum verändern kann.
Obwohl Viren in BEs genauso zahlreich sind wie Bakterien8, haben sie in der Literatur weitaus weniger wissenschaftliche Aufmerksamkeit erhalten. Eine kürzlich durchgeführte globale Studie über Oberflächenmikrobiome in städtischen Umgebungen hat gezeigt, dass es möglich ist, verschiedene Viren aus großen metagenomischen Proben von BEs zu gewinnen15. In dieser Studie haben wir die Virome, die aus 11 Lebensräumen in vier Arten von BEs in Hongkong stammen, im Detail analysiert.
In jedem BE-Lebensraum wurden mehrere vOTUs identifiziert, ihre Diversität war jedoch deutlich geringer als die der zuvor im globalen Meereswasser identifizierten vOTUs36. Das Material und die Art einer bestimmten Oberfläche sind wahrscheinlich die Haupttreiber der Virom-Vielfalt, wobei Beton-, Holz- und Hautoberflächen eine größere Vielfalt aufweisen als Metall- und Kunststoffoberflächen, wie unsere Ergebnisse zeigen. Sogar auf Oberflächen aus demselben Metall spielt die Kontakthäufigkeit eine wichtige Rolle bei der Kontrolle der Virom-Diversität, wie ein häufig berührter Türknauf im Innenbereich zeigt, der eine höhere Virom-Diversität aufweist als die selten berührten Außenhandläufe. Im Gegensatz zu Meeresumgebungen mit reichhaltigen Ressourcen20 weisen die meisten Lebensräume in BEs eine schlechte Nährstoffversorgung und unkontrollierte und raue Umweltbedingungen auf, zu denen intensives ultraviolettes Licht sowie schwankende Temperatur und Luftfeuchtigkeit gehören. Diese ungünstigen Bedingungen können zusammen mit den Eigenschaften von Oberflächenmaterialien zu taxonomischen Variationen und Funktionsverschiebungen im bakteriellen Mikrobiom führen9. Ökologische Erkenntnisse belegen auch, dass Umweltfilterung die Bakterienvielfalt in Innenräumen steuern kann57, was sich wiederum auf die Vielfalt von Phagen auswirken kann, die über ein enges Wirtsspektrum verfügen58. In Übereinstimmung mit den Unterschieden in Diversität und Struktur zwischen Bakteriengemeinschaften in der Luft und auf Oberflächen59 waren die in der Luft und auf der Oberfläche übertragenen Virome in der vorliegenden Studie unterschiedlich. Der Einsatz fortschrittlicher Belüftungs- und Filtersysteme könnte die geringere Viromvielfalt in der U-Bahn-Luft erklären als in der Luft von Veranstaltungsorten mit natürlicher Belüftung12. Viren der Klasse Caudoviricetes, von denen viele auf Familien- oder Gattungsebene noch nicht klassifiziert sind, waren in den HK-BEs in den meisten Lebensräumen mit Ausnahme der Luft allgegenwärtig und dominant, was mit den Ergebnissen für andere Ökosysteme übereinstimmt30.
Immer mehr Beweise deuten darauf hin, dass Viren in rauen Umgebungen überleben und das Überleben ihrer bakteriellen Wirte unterstützen können60. In HK-BEs wurden stark gekoppelte Wechselwirkungen zwischen Phagen und bakteriellen Wirten beobachtet, und der Anteil wirtsgebundener Viren war mehr als doppelt so hoch wie im Boden17 und im menschlichen Darm30, die beide über ein reichhaltiges Nährstoffangebot verfügen. Nach dem Eindringen in einen Wirt kann ein Phagen verschiedene Strategien anwenden, um die Anpassung des Wirts voranzutreiben18. Ein Mechanismus ist die Insertion großer DNA-Fragmente in hochkonservierte Insertionsstellen des Bakterienchromosoms durch Phagen mit lysogenen Zyklen61, die zwar schädliche Auswirkungen auf die Fitness des Wirts haben, aber auch genetische Variationen für evolutionäre Innovationen erzeugen können, um die Anpassung des Wirts an neue Umgebungen zu unterstützen. Ein weiterer Mechanismus ist die Expression phagenkodierter AMGs nach der Insertion in das Wirtsgenom3. Die eingefügten AMGs variieren je nach den Umweltbedingungen, denen der Wirt ausgesetzt ist21, und dieses Phänomen wurde auch in verschiedenen BE-Lebensräumen beobachtet. Auf häufig berührten Innenflächen waren die AMGs, die dUTPase kodieren, weit verbreitet und unterstützten wahrscheinlich die Virusreplikation, damit sie effektiv in ihren Wirten überleben können62. An einer Stange in einem Pier, der häufig mit Meerwasser bespritzt wird, wurde das AMG-cysH, das am Schwefelstoffwechsel beteiligt ist, von einem Phagen mit lysogenen Zyklen in einen Wirt integriert. Interessanterweise wurde dieses Gen auch in Virussequenzen identifiziert, die aus sauerstoffarmen Wassersäulen63 und einem tiefen Süßwassersee64 stammen. CysH unterstützt den Wirt möglicherweise dabei, einen Reaktionsengpass im Schwefelstoffwechsel zu überwinden, indem es einen bestimmten Schritt des Stoffwechselwegs reguliert. Im Gegensatz zur Insertion eines einzelnen AMG wurden Gene, die an der Regulierung des gesamten präQ0-Biosynthesewegs für die Bildung einer vielfältigen Klasse von Nukleosidanaloga mit antibiotischen, antineoplastischen oder antiviralen Aktivitäten65 beteiligt sind, in einem bakteriellen Wirt auf der menschlichen Haut und a gefunden Ticketkiosk. Die synthetisierten Verbindungen in diesem Wirt können die Anpassung des Wirts an häufig berührte Oberflächen unterstützen. In den BEs wurden auch mehrere AMGs mit unbekannter Funktion gefunden, die experimentell weiter untersucht werden sollten, um ihre Rolle bei Virus-Wirt-Interaktionen zu bestimmen.
Die virale Lebensstrategie des Wechsels zwischen lysogenen und lytischen Zyklen ist ein wesentlicher Treiber der Virus-Wirt-Evolution51. Im Allgemeinen variiert die Häufigkeit von Viren mit lysogenen Zyklen je nach Umweltbedingungen, wobei die Häufigkeit bei geringerer Bakteriendichte und geringerem Nährstoffgehalt höher ist66. Während erwartet wird, dass sowohl Innen- als auch Außenlebensräume in BEs Viren mit lysogenen Zyklen begünstigen, wurde in Außenlebensräumen ein relativ geringerer Anteil dieser Viren beobachtet. Im Allgemeinen sind Außenlebensräume anfälliger für äußere Belastungen als Innenlebensräume, was zur Expression lytischer Gene und zum Übergang von einem lysogenen in einen lytischen Zyklus unter Stressbedingungen (d. h. DNA-Schäden) führt51. Ähnlich wie in der Meeresumwelt3 könnte die Freisetzung organischer Stoffe durch Viruslyse eine Rolle im Nährstoff- und Ressourcenkreislauf für die Mitglieder mikrobieller Gemeinschaften in oligotrophen BEs spielen. Zukünftige Studien sind jedoch erforderlich, um zu bestimmen, welche ökologischen Modellviren für die Etablierung in den BEs verwendet werden.
Phagen-assoziierte ARGs geben aufgrund der Möglichkeit ihrer weiten Verbreitung durch die Übernahme der Genomreplikationsmaschinerie des Wirts Anlass zur Sorge67. Im Vergleich zu bakterienassoziierten ARGs stellen Phagen-assoziierte ARGs eine größere Bedrohung dar, da ihre Verbreitungswege schwer zu verfolgen und vorherzusagen sind67. Obwohl eine phagenvermittelte ARG-Transduktion selten ist und die ARGs möglicherweise nicht funktionsfähig sind37,68, wurde eine durch funktionelle Beta-Lactamase-kodierende Gene vermittelte Antibiotikaresistenz in Süßwasserviromen identifiziert und experimentell validiert69. In den BEs unserer Studie wurden die meisten mutmaßlichen ARGs in Viren gefunden, die auf der menschlichen Haut oder häufig berührten Innenflächen leben. Diese ARG-tragenden Viren können Bakterienwirte infizieren, und anschließend können die mutmaßlichen ARGs horizontal zwischen Bakterienarten übertragen werden70. Zusätzlich zu ARGs, die Resistenz gegen Beta-Lactam-Antibiotika verleihen, wurden in den Viren der BEs auch mehrere AGRs identifiziert, die Resistenz gegen Makrolide, Vancomycin und Tetracyclin verleihen. Daher ist die Rolle, die Viren bei der Entwicklung von Antibiotikaresistenzen bei Bakterien spielen, insbesondere bei solchen, die auf häufig berührten Oberflächen in BEs vorhanden sind, von entscheidender Bedeutung und erfordert weitere Untersuchungen.
Der häufige Überlebenskampf zwischen Bakterien und Phagen hat bei vielen Bakterien zur Entwicklung von Abwehrsystemen geführt19. Insbesondere die Art und Weise, wie Phagen die CRISPR/Cas-Systeme in Bakterien über Acr-Proteine inaktivieren, hat wachsende Aufmerksamkeit erhalten, da CRISPR/Cas-Systeme das einzige adaptive Immunsystem sind, das bisher in Prokaryoten identifiziert wurde50. In dieser Studie wurden mehrere Acr-Proteine in Phagen vorhergesagt, die in den BEs gefunden wurden. Aufgrund ihrer Funktion bei der Abwehr entwickeln sich phagenkodierte Acr-Proteine schnell und weisen eine begrenzte Sequenzähnlichkeit zu experimentell charakterisierten Acr-Proteinen71 auf, was die Rückschlüsse auf die Art der Acr-Proteine schwierig macht. Folglich werden die meisten der in dieser Studie identifizierten Acr-Proteine nicht von den CRISPR/Cas-Systemen bakterieller Wirte angegriffen. Allerdings sind Acr-Proteine möglicherweise nicht so effektiv wie früher angenommen, da sich die Resistenz gegen das CRISPR-System ebenfalls schnell entwickelt und daher zu einem schnellen Aussterben von Phagen führen kann, insbesondere wenn die CRISPR/Cas-Systeme eine große Diversität an Spacern entwickeln, die für Phagen nur schwer zu überwinden ist Punktmutationen25. Dieses Phänomen steht im Einklang mit unseren Ergebnissen, dass in einem rMAG, das vier CRISPR-Loci mit 86 Spacern enthielt, keine Proviren gefunden wurden.
Diese Studie hat zwar Aufschluss über Viren in BEs gegeben, weist jedoch einige Einschränkungen auf. Erstens könnten in unserem Virom-Analyse-Workflow potenzielle Verzerrungen auftreten. Aufgrund der geringen Biomasse in den BE-Proben und der möglichen Verzerrungen im Zusammenhang mit den Methoden zur DNA-Extraktion und -Reinigung könnte die Vielfalt der Viren und ihrer Wirte unterschätzt werden. Darüber hinaus könnte das Fehlen geeigneter Referenzen in den Datenbanken der Bioinformatik-Tools zu schlecht charakterisierten Sequenzen führen72. Zweitens unterschieden die Ergebnisse der metagenomischen Sequenzierung nicht, ob die identifizierten Viren und die damit verbundenen Gene (z. B. ARGs und Acr-Proteine) funktionsfähig oder defekt waren. Zukünftige experimentelle Untersuchungen werden erforderlich sein, um die Funktionen der neuen Acr-Proteine zu identifizieren. Drittens wurden RNA-Viren nicht berücksichtigt; Daher konnte die vollständige Virom-Diversität in den BEs nicht untersucht werden. Viertens ermöglichten uns die angewandten Contig-basierten Tools27,28,30 zwar die Entdeckung vieler neuartiger, bisher nicht kultivierter Viren, die Assemblierung mit anderen Algorithmen kann jedoch andere Viren aufdecken, und eine Virus-Binning-Methode kann fragmentierte Multi-Contig-Virus-Assemblies besser ansprechen, um mehr zu ermöglichen Präzises Clustering sowohl viraler als auch bakterieller Populationen und direkte Untersuchung von Virus-Wirt-Wechselwirkungen73. Schließlich könnten zukünftige Vergleiche mit anderen hochselektiven, häufig gereinigten und ressourcenbeschränkten Umgebungen, wie Krankenhäusern und Krankenstationen74, den Einfluss physikalischer und chemischer Eigenschaften von Oberflächen auf die Häufigkeit von Viren und die Virus-Wirt-Interaktionen weiter kontextualisieren.
Zusammenfassend glauben wir, dass diese Studie die erste ist, die die Vielfalt, Taxonomie, Stoffwechselfunktionen und Lebensstile von Viromen in verschiedenen Lebensräumen in BEs zeigt. Diese Studie unterstreicht die enge Kopplung zwischen Viren und bakteriellen Wirten in BEs und veranschaulicht die Bedeutung ihrer Koevolution durch verschiedene Virus-Wirt-Interaktionsmechanismen für die Wirtsanpassung und das Virusüberleben in oligotrophen BEs. Es wurden auch viele neue Viren aus der Klasse Caudoviricetes und Acr-Proteine identifiziert, was darauf hindeutet, dass noch weitere davon in BEs entdeckt werden müssen. Insgesamt sind Viren wichtige Mitglieder der BE-Mikrobengemeinschaften, und ein besseres Verständnis ihrer Biologie kann letztendlich eine bessere Gestaltung von Städten und den Schutz der öffentlichen Gesundheit ermöglichen.
Die metagenomischen Datensätze umfassten 738 Proben, die aus 11 Lebensräumen in vier Arten von BEs (nämlich Piers, öffentliche Einrichtungen, Wohnhäuser und U-Bahnen) in Hongkong gesammelt wurden. Von neun Pfeilern mit geringer Belegung wurden 175 Proben9 von den Oberflächen von vier Arten von Lebensräumen gesammelt: Poller (n = 40), Böden (n = 45), Handläufe (n = 45) und Masten (n = 45). Von acht öffentlichen Einrichtungen (d. h. vier Parks und vier U-Bahn-Ausgängen) mit mittlerer Belegung wurden 134 Proben75 von den Oberflächen von zwei Arten von Lebensräumen gesammelt: Parkhandläufe (n = 69) und Handläufe von U-Bahn-Ausgängen (n = 65). In vier Wohnungen mit jeweils einem einzigen Bewohner wurden 268 Proben75 von den Oberflächen von drei Arten von Lebensräumen gesammelt: Türklinken (n = 66), Kopfteile (n = 68) und der Haut der Bewohner (d. h. linke und rechte Handflächen und Unterarme; n = 134). Von den Bewohnern wurde eine schriftliche Einverständniserklärung zur Entnahme von Hautproben eingeholt und die Studie wurde vom Ethik-Unterausschuss für Humansubjekte der City University of Hong Kong genehmigt (Ref.: H001553). Von 84 U-Bahn-Stationen mit hoher Auslastung wurden 161 Proben76 aus zwei Arten von Lebensräumen gesammelt: Oberflächen von Fahrkartenschaltern (n = 81) und Luft über den Bahnsteigen (n = 80). Die gleiche Probenahmemethode wurde verwendet, um alle Oberflächen75- und Luftproben76 zu sammeln. Die Materialien der Oberflächen waren entweder Metall, Kunststoff oder Beton. Detaillierte Informationen zu den Proben finden Sie in den Zusatzdaten 1.
Die genomische DNA aller Oberflächen- und Luftproben wurde mit den entsprechenden Methoden extrahiert75,76. Kurz gesagt, genomische DNA wurde aus Abstrichen extrahiert, die mit dem ZymoBIOMICS 96 MagBead DNA-Kit (Zymo Research, CA, USA) von Probenoberflächen gesammelt wurden, und dabei den Anweisungen des Herstellers folgen. Die Zellen wurden mithilfe einer chemischen Lösung und der mechanischen Perlenaufschlämmungstechnologie lysiert. Genomische DNA wurde mithilfe eines maßgeschneiderten Protokolls aus Luftprobenfiltern extrahiert. Die Zelllyse wurde unter Verwendung von NucliSENS Lysis Buffer (BioMérieux, Marcy-l'Étoile, Frankreich) und einem Multi-Enzym-Cocktail (MetaPolyzyme, Sigma-Aldrich, MO, USA) durchgeführt, gefolgt von mechanischem Perlenschlagen. Als Positivkontrolle im Extraktionsprozess wurde ein synthetischer mikrobieller Gemeinschaftsstandard von ZymoBIOMICS (Zymo Research Corporation, CA, USA) verwendet und zusammen mit den Oberflächen- und Luftproben sequenziert. Die Sequenzierung aller genomischen DNA-Proben wurde auf einem Illumina HiSeq X Ten System (Illumina Inc., San Diego, CA) im HudsonAlpha Genome Center (Huntsville, Alabama)15 durchgeführt. Die Qualitätskontrolle und die Zusammenstellung der Lesevorgänge in Contigs wurden wie zuvor beschrieben durchgeführt9. Kurz gesagt, Adapter wurden mit AdapterRemoval (v.2.2.2)77 aus den Rohsequenzen entfernt. Qualitätsfilterung und -kürzung wurden mit KneadData (v.0.7.6) mit Standardparametern und dem menschlichen Genom hg38 als Referenz zur Entfernung menschlicher Sequenzen durchgeführt. Die Positivkontrollen lieferten die erwarteten Sequenzierungsergebnisse. Lesevorgänge in einer Probe, die Contigs in den Negativkontrollen zugeordnet werden konnten, wurden mithilfe eines internen Skripts entfernt, und alle ungepaarten Lesevorgänge wurden mithilfe von fastq-pair (v.1.0; https://) weiter aus den Paired-End-Fastq-Dateien entfernt. github.com/linsalrob/fastq-pair). Alle kontaminierenden Arten, die von decontam (v.1.12; https://github.com/benjjneb/decontam) basierend auf dem Standardschwellenwert identifiziert wurden, wurden entfernt. Nach der Qualitätskontrolle wurden etwa 5,0 Millionen Paired-End-Clean-Reads pro Probe aufbewahrt und mit MetaWRAP (v.1.2.1)78 zu etwa 4,5 Millionen Contigs zusammengesetzt.
Die Leistung von zwei Viruserkennungstools wurde zunächst anhand eines Scheindatensatzes bewertet, der 2000 zufällig ausgewählte Genomfragmente (1, 3, 5, 10 und 20 kb) von echten Viren aus der RefSeq-Virusdatenbank (Version 209) enthielt. Der durchschnittliche Virus-Recall der Genomfragmente unterschiedlicher Länge wurde mit VirSorter227 (v.2.2.4; alle Kategorien) mit dem Standard-Cutoff und DeepVirFinder (v.1.0)28 mit unterschiedlichen Cut-offs (0,5, 0,7, 0,8 und) berechnet 0,9) (Abb. S1c). Basierend auf den Ergebnissen des Scheindatensatzes wurden VirSorter2 mit dem Standard-Cutoff (alle Kategorien) und DeepVirFinder mit einem vorhergesagten Score ≥ 0,5 und einem p-Wert < 0,05, was für jede Fragmentlänge zum höchsten viralen Recall führte, gemeinsam zur Verarbeitung verwendet Die 4, 5 Millionen Contigs wurden aus 738 Metagenomproben zusammengestellt (Abb. S1b). Insgesamt wurden mit den beiden Tools 594.851 einzigartige mutmaßliche Virus-Contigs erhalten. CheckV (v.0.8.1; Datenbank v.1.0)79 wurde verwendet, um die Qualität der mutmaßlichen Virus-Contigs zu bewerten, und 1174 Virus-Contigs, die vollständige, hochwertige (>90 % Vollständigkeit) und mittlere Qualität (50) umfassten –90 % Vollständigkeit) Genome wurden beibehalten30 (Supplementary Data 2). Bei Genomen, die vorhergesagte Proviren enthielten, wurden nur die proviralen Regionen beibehalten. PHASTER) (https://phaster.ca/)80 und VIBRANT (v.1.2.1)81 wurden separat angewendet, um provirale Sequenzen gemäß den folgenden zwei Kriterien zu identifizieren, wie zuvor vorgeschlagen21: (i) die viralen Contigs stammten von Contigs mit nicht-viralen (Wirts-)flankierenden Sequenzen oder (ii) die viralen Contigs enthielten lysogene Markerproteine (dh Integrase und Serin-Rekombinase). Insgesamt wurden mit den beiden oben genannten Tools und CheckV 332 einzigartige Proviren identifiziert, und nur diejenigen (127), die in ein Bakteriengenom integriert waren, hatten ein hohes Vertrauen (der Gesamtscore der Prophagenregion betrug >90 in PHASTER) und wurden in den Downstream einbezogen Analyse.
Alle viralen Genome mit einer Vollständigkeit von >50 % wurden auf der Grundlage einer durchschnittlichen Nukleotididentität (ANI) von 95 % mit einem Alignment-Anteil von > 85 % relativ zur kürzeren Sequenz, basierend auf zentroidbasiertem Clustering, in vOTUs auf Artenebene geclustert30. vOTUs auf Gattungs- und Familienebene wurden mithilfe einer Kombination aus Gen-Sharing und Aminosäureidentität (AAI) basierend auf Markov-Clustering82 wie zuvor beschrieben30 generiert. Kurz gesagt, virale Genome mit <20 % AAI oder <10 % Gen-Sharing und einem Inflationsfaktor von 1,2 wurden in vOTUs auf Familienebene geclustert, während diejenigen mit <50 % AAI oder <20 % Gen-Sharing und einem Inflationsfaktor von 2,0 geclustert wurden in vOTUs auf Gattungsebene.
Die offenen Leserahmen (ORFs) in den 471 vOTUs wurden von Prodigal (v.2.6.3)83 unter Verwendung des Parameters „-p meta“ vorhergesagt. Den proteinkodierenden Gensequenzen der 471 vOTUs wurde eine Taxonomie auf Familienebene zugewiesen, wobei der Mehrheitsregelansatz wie zuvor beschrieben verwendet wurde30. Insbesondere die auf dem International Committee on Taxonomy of Viruses (ICTV) basierende Taxonomie der wichtigsten IMG/VR (v4)-Datenbank29, die mit DIAMOND (v.0.9.32; Optionen: –query-cover 50 –subject-cover 50 –E -Wert 1e−5 –max-target-seqs 1000) wurde auf jedes Protein übertragen. In Fällen, in denen die Taxonomie des Top-Treffers fehlte, wurde der nächste Treffer übernommen, wenn sein Bit-Score innerhalb von 25 % des Top-Treffers lag. Jede vOTU wurde dann dem niedrigsten taxonomischen Rang von> 70 % der annotierten Proteine zugeordnet. Auf Familien- und Gattungsebene muss ein Genom mindestens zwei annotierte Proteine mit einem durchschnittlichen AAI von > 30 % bzw. drei annotierte Proteine mit einem durchschnittlichen AAI von > 40 % aufweisen, die mit einem Referenzgenom aus der IMG/VR-Datenbank abgeglichen sind30.
Die sauberen Lesevorgänge aller 738 Metagenome wurden mithilfe von Bowtie2 (v.2.4.4) mit den Standardparametern auf die Virusgenome abgebildet. Eine „Filter“-Funktion von BamM (v.1.7.3; http://ecogenomics.github.io/BamM/) wurde verwendet, um die auf die Genomen abgebildeten Lesevorgänge zu überprüfen, um Zuordnungen mit geringer Qualität zu entfernen, und die Lesevorgänge, die darüber ausgerichtet wurden ≥90 % ihrer Länge bei ≥95 % ANI blieben erhalten. Die viralen Genome, bei denen ≥70 % ihrer Länge durch die Reads abgedeckt wurden, wurden mithilfe eines Python-Skripts in Read2RefMapper (v.1.1.0) ausgewählt, und die durchschnittliche Abdeckung pro Basenpaar jedes Contigs in jeder Probe wurde mithilfe des BamM generiert „parse“-Funktion mit dem Parameter „tpmean“, um die Bereiche mit der höchsten und niedrigsten 10 %-Abdeckung zu entfernen. Basierend auf der Kartierungsanalyse wurden virale Genome in 614 Metagenomen nachgewiesen. Die durchschnittliche relative Häufigkeit der 1174 Virusgenome in den 614 Metagenomen wurde berechnet, indem die durchschnittliche Abdeckung eines Virusgenoms durch die Gesamtzahl der sauberen Lesevorgänge in allen Proben dividiert und dann mit der durchschnittlichen Anzahl aller sauberen Lesevorgänge in den 614 Metagenomen multipliziert wurde Erhöhen oder verringern Sie die Gesamtzahl der Lesevorgänge für jede Stichprobe auf den Durchschnitt17.
Drei öffentlich verfügbare Virom-Datensätze, nämlich Hautmetagenome hauptsächlich von Probanden in Nordamerika (SMGC-Datensatz)35, Ozeanmetagenome aus gemäßigten und tropischen epipelagischen und mesopelagischen Ozeanen (GOV-Datensatz)36 und Oberflächenmetagenome von U-Bahn-Stationen internationaler Städte außer Hongkong ( Der MetaSUB-Datensatz (15) wurde zusammen mit dem in dieser Studie generierten Virom-Datensatz analysiert. Die aus den öffentlichen Datenbanken abgerufenen Virusgenome wurden mit CheckV bewertet und es wurden nur Viren mittlerer und hoher Qualität zurückgehalten (Abb. S6a). Die Zuordnung von Lesevorgängen zu unserem Datensatz und den drei öffentlich verfügbaren Virom-Datensätzen wurde mit der Funktion „bowtie2-build“ durchgeführt, indem zunächst vier Indizes erstellt wurden, die nur vOTUs auf Artenebene aus allen Virom-Datensätzen verwendeten. Die sauberen Lesevorgänge wurden dann mithilfe von Bowtie2 mit der Option „–very-sensitive -k 20“ an jedem Genomindex ausgerichtet und Ausrichtungen mit Kartierungs-ANI < 95 % wurden verworfen.
Alpha-Diversitätsindizes, nämlich Richness, Shannon's H und Pielou's Evenness, wurden mit dem R-Paket vegan (v.2.5.7)84 berechnet. Siebzig Metagenome mit Singleton-vOTUs wurden von der Analyse ausgeschlossen. Der Mann-Whitney-U-Test wurde durchgeführt, um die statistische Signifikanz des Unterschieds zwischen zwei Gruppen zu testen, während eine Varianzanalyse angewendet wurde, um die Unterschiede zwischen zwei oder mehr Gruppen zu bestimmen. Für die Beta-Diversitätsanalyse wurde eine Hauptkoordinatenanalyse basierend auf der Bray-Curtis-Unähnlichkeitsmatrix unter Verwendung der Funktion „vegdist“ des R-Pakets vegan durchgeführt. Eine paarweise Ähnlichkeitsanalyse und eine permutationelle multivariate Varianzanalyse wurden durchgeführt, um die Signifikanz der Unähnlichkeit zwischen Gruppen mithilfe der Funktionen „anosim“ und „adonis“ des R-Pakets vegan zu testen.
Ein phylogenetischer Baum mit maximaler Wahrscheinlichkeit, der Caudoviricetes-vOTUs aus dieser Studie und die drei öffentlich verfügbaren Viromdatensätze (SMGC, GOV und MetaSUB) umfasst, wurde wie zuvor beschrieben erstellt30,85. Kurz gesagt, 77 kuratierte Caudoviricetes-Marker wurden mithilfe eines Profil-Hidden-Markov-Modells (HMM) anhand der proteinkodierenden Gensequenzen der vOTUs durchsucht. Der Datensatz aus dieser Studie enthielt 444 vOTUs mit Längen ≥5 kb und 37.775 proteinkodierende Gensequenzen, während die drei öffentlichen Datensätze 2389 vOTUs mit Längen ≥5 kb und 168.256 virale proteinkodierende Gensequenzen enthielten. Die Top-HMM-Treffer wurden individuell mit den Profil-HMMs der 77 Marker abgeglichen, wie zuvor empfohlen, mithilfe der Funktion „hmmsearch“, die 40 bzw. 58 Marker aus dieser Studie bzw. die vier Datensätze kombinierte. Die Ausrichtungen einzelner Marker wurden dann mit trimAl (v.1.4)86 getrimmt, um Positionen mit <50 % Lücken beizubehalten, und Lücken wurden bei Bedarf mit einem hauseigenen Python-Skript gefüllt. Es wurden nur Genome mit einer Aminosäurerepräsentation von >5 % in der gesamten Alignment-Länge beibehalten. Ein verketteter phylogenetischer Proteinbaum wurde aus dem Mehrfachsequenz-Alignment unter Verwendung von FastTreeMP (v.2.1.11) mit dem Auto-Modell87 abgeleitet. Der Baum wurde in der Mitte verwurzelt und mit iToL (v.6; https://itol.embl.de/) visualisiert.
Die ORFs in den Virusgenomen wurden mit mehreren Proteinfamiliendatenbanken, einschließlich KEGG39, Pfam38, TIGRFAM88, VOGDB (http://vogdb.org) und der Virome-Datenbank der Erde89, unter Verwendung der Profil-HMM-Suchmethode, die mit dem Dienstprogramm hmmsearch in durchgeführt wurde, annotiert HMMER (v.3.1b2) mit den Standardparametern. Jedem ORF wurde die Annotation des Alignments mit der höchsten Bewertung (Bit-Score ≥ 60 und ein E-Wert ≤ 1e−5) unter den Datenbanken zugewiesen.
Die ARGs in den Virusgenomen wurden mit dem Resistance Gene Identifier-Tool (v.5.2.0)42 mit der Option „–low_quality“ annotiert, wodurch die beste Identität von >60 % auf die Referenzsequenzen in der CARD-Datenbank (v. 3.0.9)90 und unter Verwendung des Tools NCBI AMRFinderPlus (v.3.8.4)41 mit den Standardoptionen 60 % Abdeckung und 80 % Identität zu den Referenzsequenzen in der Resfams-Datenbank (v.1.2)40. Die Suche wurde mit dem Dienstprogramm hmmsearch im HMMER-Tool (v.3.1b2) mit einem E-Wert ≤ 1e−5 und einem Erfassungsschwellenwert ≥40 durchgeführt. Die Resfams-Anmerkung mit der besten Bewertung wurde übernommen, wenn eine ARG unterschiedliche Anmerkungen aus den Datenbanken erhielt.
AMGs wurden basierend auf dem viralen Modus von DRAM (v.1.4.0)91 annotiert, der die von VirSorter2 erzeugte Ausgabe verwendet. Die 1174 identifizierten viralen Contigs wurden von VirSorter2 (--prep-for-dramv) erneut verarbeitet, um die Datei „VIRSorter affi-contigs.tab“ zu erstellen, und dann mit den Standarddatenbanken im DRAM annotiert. Dieser Prozess eliminierte laut VirSorter2 573 Virusgenome mit niedrigen Viruswerten. Mutmaßliche AMGs in den verbleibenden 601 Virusgenomen wurden auf der Grundlage eines hohen Hilfsscores von 1 oder 2 identifiziert. Die übernommenen Genbeschreibungen basierten auf der destillierten Annotation von DRAM-v mit den Standardparametern. Um die AMG-Annotationen aus DRAM zu ergänzen, wurden die viralen Genome auch mit VIBRANT mit den Standardparametern annotiert, und Annotationen, die nicht im DRAM gefunden wurden, wurden beibehalten.
Kandidaten für Acr-Proteine wurden zunächst mit PaCRISPR48 mit einem Standard-Grenzwert vorhergesagt, und eine weitere Filterung der Kandidaten-Acr-Proteine wurde wie zuvor beschrieben auf der Grundlage von HTH-Domänen enthaltenden Proteinen durchgeführt, die sich innerhalb von fünf Genen stromaufwärts oder stromabwärts befinden müssen92. Die gefilterten Acr-Kandidatenproteine wurden anschließend mit MMseq2 (v.13.45111)93 mit den Parametern „--min-seq-id 0.5 -c 0.7 --cov-mode 2 --cluster-mode 0“ geclustert. Die repräsentativen Acr-Proteine, die keinen Treffer mit einer HHpred-Wahrscheinlichkeit ≥ 0,9 für eine Proteindatenbank- und Conserved Domains Database-Sequenz erzeugten, wurden als vorhergesagte Acr-Proteine angesehen und für die nachgelagerte Analyse aufbewahrt49. Die Typen der vorhergesagten repräsentativen Acr-Proteine wurden mithilfe einer PSI-BLAST-Suche mit den Standardparametern anhand der von Acr kuratierten Datenbank PaCRISPR48 geschätzt. Das Mehrfachsequenz-Alignment zwischen den vorhergesagten Acr-Proteinen und den 339 Referenz-Acr-Proteinen, die aus der kuratierten PaCRISPR-Datenbank erhalten wurden, wurde mit FAMSA (v.1.5.12)94 erstellt und mit trimAl (v.1.4)86 getrimmt, um Positionen mit <50 % Lücken beizubehalten . Ein phylogenetischer Baum mit maximaler Wahrscheinlichkeit wurde mit den ausgerichteten Sequenzen unter Verwendung von FastTreeMP (v.2.1.11) mit dem Auto-Modell erstellt und unter Verwendung von iTOL visualisiert. Die Strukturen der Acr-Proteine wurden mit dem AlphaFold2-Tool mit den Standardeinstellungen95,96 vorhergesagt.
MAGs (Supplementary Data 5) wurden aus allen untersuchten Metagenomen wie zuvor beschrieben rekonstruiert9. Kurz gesagt, die sauberen Lesevorgänge jeder Probe wurden zu Contigs zusammengefasst und diejenigen mit Längen > 1000 bp wurden mithilfe von MetaWRAP (v.1.2.1)78 in MAGs zusammengefasst. Die resultierenden MAGs wurden mit der Funktion „bin_refinement“ von MetaWRAP78 weiter verfeinert und mit der Funktion „dRep dereplicate“ von dRep (v.3.2.2)97 derepliziert. Insgesamt wurden 860 bakterielle rMAGs mit einer Kontamination ≤10 % und einer Vollständigkeit ≥50 % generiert. Die ORFs in den Contigs von rMAGs wurden mit Prokka (v.1.14.6)98 vorhergesagt und die Funktionen wurden mit EggNOG-Mapper (v.2.0.1)99 annotiert.
Um die relative Häufigkeit jedes rMAG in allen Proben zu berechnen, wurden die sauberen Lesevorgänge von jedem Metagenom mithilfe der BamM-Funktion „make“ jedem Genom zugeordnet. Lesekartierungen mit geringer Qualität (<75 % ausgerichtete Länge jedes Lesevorgangs und <95 % ANI) wurden mithilfe der BamM-Filterfunktion entfernt und die Abdeckung jedes Genoms wurde als Mittelwert der Anzahl der ausgerichteten Lesevorgänge dargestellt Jede Position in den Contigs nach dem Entfernen der höchsten und niedrigsten 10 %-Abdeckungsregionen wurde mit der BamM-Funktion „parse“ im „tpmean“-Modus berechnet. Die relative Häufigkeit jedes rMAG wurde dann als Durchschnitt der Abdeckungen aller seiner Contigs berechnet, wobei jeder Contig nach seiner Länge in Basenpaaren gewichtet wurde.
Sowohl die In-situ- als auch die Ex-situ-Wirte der Virusgenome wurden wie zuvor beschrieben identifiziert21. Zur Herstellung der Virus-Wirt-Verbindung wurden zwei Wirtsdatenbanken verwendet, in denen 203.065 vollständige Bakterien- und Archaeengenome, die 146.464 prokaryotische Arten repräsentieren, aus RefSeq (heruntergeladen aus der NCBI-Datenbank im November 2021) zur Identifizierung von Ex-situ-Wirten verwendet wurden, während 860 bakterielle rMAGs verwendet wurden wurden mit GTDB-Tk (v.1.5.1) taxonomisch annotiert100 und wurden zur Identifizierung von In-situ-Wirten verwendet. CRISPR-Spacer wurden mithilfe eines benutzerdefinierten Python-Skripts aus den beiden Wirtsdatenbanken extrahiert und für CRISPR-assoziierte Proteine (Cas) kodierende Gene wurden mithilfe von CRISPRCasFinder (v.4.2.20)101 erkannt.
Mikrobielle Wirte für die 1174 viralen Genome wurden mithilfe einer Kombination bioinformatischer Methoden vorhergesagt, die virale exakte Übereinstimmungen (oder große Ähnlichkeit) mit (i) Wirts-CRISPR-Spacern, (ii) integrierten Virusfragmenten in Wirtsgenomen, (iii) Wirts-tRNA-Genen, und (iv) Host-K-Mer-Signaturen. Die Methoden (i) und (ii) wurden nur zur Ex-situ-Wirtsvorhersage verwendet. Für Methode (i) wurde BLASTn aus Blast+ (v.2.9.0)102 verwendet, um CRISPR-Spacer-Sequenzen mit den Virusgenomen zu vergleichen, und Übereinstimmungen mit ≤ 1 Fehlpaarung und einem E-Wert ≤ 1e−5 wurden beibehalten. Für jeden CRISPR-Spacer, der in einem viralen Genom übereinstimmte, wurde die Wiederholungssequenz aus derselben zusammengesetzten CRISPR-Region mit allen bakteriellen und archaealen Genomen über BLASTn verglichen (E-Wert ≤ 1e−5, 100 % Nukleotididentität und 95 % Abdeckung). ), um diese CRISPR-Region (und alle Viren, die Spacer in dieser CRISPR-Region beherbergen) mit einem Wirt zu verknüpfen. Für Methode (ii) wurde ein Bit-Score-Schwellenwert von 50 mit einem E-Wert ≤ 1e−5 und einem ANI von ≥ 96 % zur Identifizierung gemeinsamer Genomregionen über BLASTn verwendet, und als Kriterien wurden nur Treffer ≥ 1000 bp berücksichtigt Es hat sich gezeigt, dass sie die sicherste Host-Vorhersage liefern30. Für Methode (iii) wurden virale und Wirts-tRNA-Gene durch tRNA-scan SE-2.0 unter Verwendung des allgemeinen bzw. des bakteriellen/archaealen Modells vorhergesagt, und dann wurde ein BLASTn-Vergleich zwischen den vorhergesagten viralen und bakteriellen tRNA-Genen durchgeführt. Die tRNA-Übereinstimmungen zwischen den Viren und Wirten im Datensatz wurden dann so bewertet, dass eine exakte Übereinstimmung eine höhere Punktzahl (hohe Punktzahl) als eine Wirts-tRNA mit einem einzigen Basenunterschied (mittlere Punktzahl) und eine Wirts-tRNA mit einem zwei Basenunterschied ( niedriger Punktestand). Für Methode (iv) wurde WIsH (v.1.1)46 zur Wirtsvorhersage verwendet, nachdem tRNA-Sequenzen auf den viralen Genomen maskiert wurden, um die Leistung zu verbessern. Anschließend wurden 3.024 Virusgenome (heruntergeladen vom NCBI-Virusportal im Januar 2022), deren Wirte Wirbellose sind, als Täuschungsdatenbank verwendet, nachdem Viren, von denen bekannt ist, dass sie eine vorhergesagte Wirtsgattung infizieren, konservativ ausgeschlossen wurden. Für jedes virale Genom wurde der vom WIsH vorhergesagte Wirt mit dem niedrigsten p-Wert (≤ 1e–5) als konservativ bei Wirtszuordnungen auf Familienebene beibehalten. Sowohl CRISPR-Spacer- als auch Genomübereinstimmungen wurden für die In-situ-Wirtszuordnung beibehalten und erhielten eine höhere Priorität als die WIsH- und tRNA-Ergebnisse. Die durchschnittlichen abstammungsspezifischen Virus-Wirt-Abdeckungsverhältnisse wurden berechnet, indem die relative Häufigkeit von rMAGs durch die der viralen Genome dividiert wurde. Das Netzwerk der Virus-Wirt-Verbindungen wurde mit Cytoscape (v.3.9.0)103 visualisiert, und vor dem Aufbau eines Netzwerks wurde eine Unterabtastung durchgeführt, um mögliche Verzerrungen aufgrund einer ungleichmäßigen Anzahl von Metagenomen, die in den BE-Lebensräumen untersucht wurden, zu beseitigen.
Die in dieser Studie verwendeten DNA-Sequenzierungsrohdaten wurden im NCBI Sequence Read Archive unter den BioProject-Zugangsnummern PRJNA671748, PRJNA722771, PRJNA561080 und PRJNA881785 hinterlegt. Die SRA-Zugangsnummer jeder Probe ist in den Zusatzdaten 1 angegeben. Die in dieser Studie verwendeten öffentlich zugänglichen Datenbanken waren Resfams (http://www.dantaslab.org/resfams), CARD (https://card.mcmaster.ca/). , Pfam (https://www.ebi.ac.uk/interpro/download/Pfam/), IMG/VR (https://genome.jgi.doe.gov/portal/IMG_VR/), VOG (http:/ /vogdb.org), TIGRFAM (https://www.ncbi.nlm.nih.gov/genome/annotation_prok/tigrfams/), KEGG (https://www.genome.jp/kegg/) und NCBI-Virus/ Bakterien/refseq (https://www.ncbi.nlm.nih.gov/refseq/). Die analysierten Datensätze umfassen das Erdvirom (http://portal.nersc.gov/dna/microbial/prokpubs/EarthVirome_DP/), SMGC (https://www.ncbi.nlm.nih.gov/sra/?term=SRP002480). ), GOV (https://bitbucket.org/MAVERICLab/) und MetaSUB (https://github.com/dscdorothy/HK_BE_viromic) sind online verfügbar. Die hochsicheren Strukturen der vorhergesagten Acr-Proteine werden unter https://github.com/dscdorothy/HK_BE_viromic bereitgestellt.
Der unterstützende Code wird unter https://github.com/dscdorothy/HK_BE_viromic bereitgestellt.
Manrique, P., Dills, M. & Young, MJ Die menschliche Darmphagengemeinschaft und ihre Auswirkungen auf Gesundheit und Krankheit. Viren 9, 141 (2017).
Artikel PubMed PubMed Central Google Scholar
Li, Z. et al. Mit kalten Sickerstellen verbundene Tiefseesedimente sind ein unterirdisches Reservoir viraler Vielfalt. ISME J. 15, 2366–2378 (2021).
Artikel CAS PubMed PubMed Central Google Scholar
Coutinho, FH et al. Durch Metagenomik entdeckte Meeresviren geben Aufschluss über virale Strategien in den Ozeanen. Nat. Komm. 8, 15955 (2017).
Artikel ADS CAS PubMed PubMed Central Google Scholar
Trubl, G. et al. Aktive Virus-Wirt-Wechselwirkungen bei Temperaturen unter dem Gefrierpunkt in arktischen Torfböden. Mikrobiom 9, 208 (2021).
Artikel CAS PubMed PubMed Central Google Scholar
Gilbert, JA & Stephens, B. Mikrobiologie der gebauten Umwelt. Nat. Rev. Microbiol. 16, 661–670 (2018).
Artikel CAS PubMed Google Scholar
Lax, S. et al. Längsschnittanalyse der mikrobiellen Interaktion zwischen Mensch und Innenraum. Wissenschaft 345, 1048–1052 (2014).
Artikel ADS CAS PubMed PubMed Central Google Scholar
Fouquier, J., Schwartz, T. & Kelley, S. Schnelle Ansammlung verschiedener Umweltpilzgemeinschaften auf öffentlichen Toilettenböden. Indoor Air 26, 869–879 (2016).
Artikel CAS PubMed Google Scholar
Prussin, AJ, Garcia, EB & Marr, LC Gesamtkonzentrationen von Viren und Bakterien in der Innen- und Außenluft. Umgebung. Wissenschaft. Technol. Lette. 2, 84–88 (2015).
Artikel CAS PubMed PubMed Central Google Scholar
Tong, X. et al. Metagenomische Einblicke in die mikrobiellen Gemeinschaften inerter und oligotropher Außenmolenoberflächen einer Küstenstadt. Mikrobiom 9, 213 (2021).
Artikel CAS PubMed PubMed Central Google Scholar
Cantú, VJ et al. Umsetzung der praktischen Oberflächenüberwachung von SARS-CoV-2 in schulischen Umgebungen. mSystems 7, e00103–e00122 (2022).
PubMed PubMed Central Google Scholar
Sacchetto, L. et al. Gefahr für Nachbarn: Gelbfiebervirus-Seuchen in städtischen und Stadt-Land-Übergangsgebieten des Bundesstaates Minas Gerais während der Gelbfieberausbrüche 2017–2018 in Brasilien. PLOS Negl. Trop. Dis. 14, e0008658 (2020).
Artikel PubMed PubMed Central Google Scholar
Prussin, AJ et al. Saisonale Dynamik von DNA- und RNA-Virus-Bioaerosolgemeinschaften in einer Kindertagesstätte. Mikrobiom 7, 53 (2019).
Artikel PubMed PubMed Central Google Scholar
Gibbons, SM et al. Ökologische Abfolge und Lebensfähigkeit menschenassoziierter Mikrobiota auf Toilettenoberflächen. Appl. Umgebung. Mikrobiol. 81, 765–773 (2015).
Artikel ADS PubMed PubMed Central Google Scholar
Whon, TW et al. Metagenomische Charakterisierung der viralen DNA-Diversität in der Luft in der oberflächennahen Atmosphäre. J. Virol. 86, 8221–8231 (2012).
Artikel CAS PubMed PubMed Central Google Scholar
Danko, D. et al. Eine globale metagenomische Karte städtischer Mikrobiome und antimikrobieller Resistenzen. Zelle 184, 3376–3393 (2021).
Artikel CAS PubMed PubMed Central Google Scholar
He, T., Li, H. & Zhang, X. Hydrothermale Tiefseeviren kompensieren den mikrobiellen Stoffwechsel bei Virus-Wirt-Interaktionen. MBio 8, e00893–17 (2017).
Artikel PubMed PubMed Central Google Scholar
Emerson, JB et al. Wirtsgebundene Bodenvirenökologie entlang eines Permafrost-Taugradienten. Nat. Mikrobiol. 3, 870–880 (2018).
Artikel CAS PubMed PubMed Central Google Scholar
Coclet, C. & Roux, S. Globaler Überblick und große Herausforderungen von Wirtsvorhersagemethoden für nicht kultivierte Phagen. Curr. Meinung. Virol. 49, 117–126 (2021).
Artikel CAS PubMed Google Scholar
Desfarges, S. & Ciuffi, A. in Viruses: Essential Agents of Life (Hrsg. Witzany, G.) 147–175 (Springer Niederlande, 2012).
Suttle, CA Viren im Meer. Natur 437, 356–361 (2005).
Artikel ADS CAS PubMed Google Scholar
Jian, H. et al. Vielfalt und Verbreitung von Viren im tiefsten Ozean der Erde. ISME J. 15, 3094–3110 (2021).
Artikel CAS PubMed PubMed Central Google Scholar
Brown, TL, Charity, OJ & Adriaenssens, EM Ökologische und funktionelle Rollen von Bakteriophagen in unterschiedlichen Umgebungen: mariner, terrestrischer und menschlicher Darm. Curr. Meinung. Mikrobiol. 70, 102229 (2022).
Artikel CAS PubMed Google Scholar
Doron, S. et al. Systematische Entdeckung von Antiphagen-Abwehrsystemen im mikrobiellen Pangenom. Science 359, eaar4120 (2018).
Artikel ADS PubMed PubMed Central Google Scholar
Münch, PC, Franzosa, EA, Stecher, B., McHardy, AC & Huttenhower, C. Identifizierung natürlicher CRISPR-Systeme und -Ziele im menschlichen Mikrobiom. Cell Host Microbe 29, 94–106.e4 (2021).
Artikel PubMed Google Scholar
Landsberger, M. et al. Anti-CRISPR-Phagen kooperieren, um die CRISPR-Cas-Immunität zu überwinden. Zelle 174, 908–916 (2018).
Artikel CAS PubMed PubMed Central Google Scholar
Burstein, D. et al. Wichtige Bakterienstämme verfügen im Wesentlichen nicht über CRISPR-Cas-Virusabwehrsysteme. Nat. Komm. 7, 10613 (2016).
Artikel ADS CAS PubMed PubMed Central Google Scholar
Guo, J. et al. VirSorter2: ein von Experten geleiteter Multiklassifizierer-Ansatz zum Nachweis verschiedener DNA- und RNA-Viren. Mikrobiom 9, 37 (2021).
Artikel PubMed PubMed Central Google Scholar
Ren, J. et al. Identifizierung von Viren aus metagenomischen Daten mithilfe von Deep Learning. Quant. Biol. 8, 64–77 (2020).
Artikel CAS PubMed PubMed Central Google Scholar
Camargo, AP et al. IMG/VR v4: eine erweiterte Datenbank unkultivierter Virusgenome im Rahmen umfangreicher funktioneller, taxonomischer und ökologischer Metadaten. Nukleinsäuren Res. 51, D733–D743 (2023).
Artikel PubMed Google Scholar
Nayfach, S. et al. Metagenomisches Kompendium von 189.680 DNA-Viren aus dem menschlichen Darmmikrobiom. Nat. Mikrobiol. 6, 960–970 (2021).
Artikel CAS PubMed PubMed Central Google Scholar
Boeckman, J. et al. Schafe im Wolfspelz: T7-ähnliche Bakteriophagen der gemäßigten Klimazone und die Ursprünge der Autographiviridae. Virologie 568, 86–100 (2022).
Artikel CAS PubMed Google Scholar
Sherier, AJ, Woerner, AE & Budowle, B. Bevölkerungsinformative Marker, die mithilfe des Wright-Fixierungsindex und maschinellem Lernen ausgewählt wurden, verbessern die menschliche Identifizierung mithilfe des Hautmikrobioms. Appl. Umgebung. Mikrobiol. 87, e01208–e01221 (2021).
Artikel ADS CAS PubMed PubMed Central Google Scholar
Duponchel, S. & Fischer, MG Viva Lavidaviren! Fünf Merkmale von Virophagen, die riesige DNA-Viren parasitieren. PLoS Pathog. 15, e1007592 (2019).
Artikel PubMed PubMed Central Google Scholar
Ryndock, EJ & Meyers, C. Ein Risiko für die nichtsexuelle Übertragung des humanen Papillomavirus? Experte. Rev. Anti. Infizieren. Dort. 12, 1165–1170 (2014).
Artikel CAS PubMed Google Scholar
Saheb Kashaf, S. et al. Integration von Kultivierung und Metagenomik für eine umfassende Sicht auf die Vielfalt und Funktionen des Hautmikrobioms. Nat. Mikrobiol. 7, 169–179 (2022).
Artikel CAS PubMed Google Scholar
Gregory, AC et al. Makro- und Mikrodiversität mariner DNA-Viren von Pol zu Pol. Zelle 177, 1109–1123.e14 (2019).
Artikel CAS PubMed PubMed Central Google Scholar
Enault, F. et al. Phagen kodieren selten Antibiotikaresistenzgene: ein warnendes Beispiel für Viromanalysen. ISME J. 11, 237–247 (2017).
Artikel CAS PubMed Google Scholar
El-Gebali, S. et al. Die Datenbank der Pfam-Proteinfamilien im Jahr 2019. Nucleic Acids Res. 47, D427–D432 (2019).
Artikel CAS PubMed Google Scholar
Kanehisa, M. & Goto, S. KEGG: Kyoto-Enzyklopädie der Gene und Genome. Nukleinsäuren Res. 28, 27–30 (2020).
Artikel Google Scholar
Gibson, MK, Forsberg, KJ & Dantas, G. Verbesserte Annotation von Determinanten der Antibiotikaresistenz zeigt mikrobielle Resistomcluster nach Ökologie. ISME J. 9, 207–216 (2015).
Artikel CAS PubMed Google Scholar
Feldgarden, M. et al. AMRFinderPlus und der Referenzgenkatalog erleichtern die Untersuchung der genomischen Zusammenhänge zwischen antimikrobieller Resistenz, Stressreaktion und Virulenz. Wissenschaft. Rep. 11, 12728 (2021).
Artikel ADS CAS PubMed PubMed Central Google Scholar
Feldgarden, M. et al. Validierung des AMRFinder-Tools und der Resistenzgendatenbank durch Verwendung von Genotyp-Phänotyp-Korrelationen antimikrobieller Resistenzen in einer Sammlung von Isolaten. Antimikrob. Agenten Chemother. 63, e00483–19 (2019). (2019).
Artikel CAS PubMed PubMed Central Google Scholar
Lim, KT, Hanifah, YA & Yusof, MYM ermA, ermC, tetM und tetK sind für die Erythromycin- und Tetracyclin-Resistenz unter Methicillin-resistenten Staphylococcus aureus-Stämmen, die aus einem Tertiärkrankenhaus in Malaysia isoliert wurden, von wesentlicher Bedeutung. Indian J. Med. Mikrobiol. 30, 203–207 (2012).
Artikel CAS PubMed Google Scholar
Schouten, MA et al. Prävalenz vancomycinresistenter Enterokokken in Europa. EUR. J. Clin. Mikrobiol. Infizieren. Dis. 19, 816–822 (2000).
Artikel CAS PubMed Google Scholar
Roberts, MC Update zu erworbenen Tetracyclin-Resistenzgenen. FEMS Mikrobiol. Lette. 245, 195–203 (2005).
Artikel CAS PubMed Google Scholar
Galiez, C., Siebert, M., Enault, F., Vincent, J. & Söding, J. WUNSCH: Wer ist der Gastgeber? Vorhersage prokaryotischer Wirte aus metagenomischen Phagen-Contigs. Bioinformatik 33, 3113–3114 (2017).
Artikel CAS PubMed PubMed Central Google Scholar
Taxiarchi, C. et al. Ein genetisch kodiertes Anti-CRISPR-Protein schränkt die Ausbreitung des Gene Drive ein und verhindert die Unterdrückung der Population. Nat. Komm. 12, 3977 (2021).
Artikel ADS CAS PubMed PubMed Central Google Scholar
Wang, J. et al. PaCRISPR: ein Server zur Vorhersage und Visualisierung von Anti-CRISPR-Proteinen. Nukleinsäuren Res. 48, W348–W357 (2020).
Artikel CAS PubMed PubMed Central Google Scholar
Lu, S. et al. CDD/SPARCLE: die konservierte Domänendatenbank im Jahr 2020. Nucleic Acids Res. 48, D265–D268 (2020).
Artikel CAS PubMed Google Scholar
Osuna, BA et al. Kritische Anti-CRISPR-Locus-Repression durch einen bifunktionalen Cas9-Inhibitor. Cell Host Microbe 28, 23–30 (2020).
Artikel CAS PubMed PubMed Central Google Scholar
Young, R. Phagenlyse: drei Schritte, drei Möglichkeiten, ein Ergebnis. J. Mikrobiol. 52, 243–258 (2014).
Artikel CAS PubMed PubMed Central Google Scholar
Pálinkás, HL et al. CRISPR/Cas9-vermittelter Knock-out der dUTPase bei Mäusen führt zu früher embryonaler Letalität. Biomolecules 9, 136 (2019).
Artikel PubMed PubMed Central Google Scholar
Torrents, E. Ribonukleotid-Reduktasen: essentielle Enzyme für das Leben von Bakterien. Vorderseite. Zelle. Infizieren. Mikrobiol. 4, 52 (2014).
Artikel PubMed PubMed Central Google Scholar
Xu, Y., Zhang, R. & Jiao, N. Vollständige Genomsequenz des aus dem Südchinesischen Meer isolierten Paracoccus marcusii-Phagen vB_PmaS-R3. Stand Genom. Wissenschaft. 10, 94 (2015).
Artikel Google Scholar
Kredich, NM Biosynthese von Cystein. EcoSal Plus 3, https://doi.org/10.1128/ecosalplus.3.6.1.11 (2008).
Neuwald, AF et al. cysQ, ein Gen, das für die Cysteinsynthese in Escherichia coli K-12 nur während des aeroben Wachstums benötigt wird. J. Bakteriol. 174, 415–425 (1992).
Artikel CAS PubMed PubMed Central Google Scholar
Adams, RI, Bateman, AC, Bik, HM & Meadow, JF Mikrobiota des Innenraumklimas: eine Metaanalyse. Mikrobiom 3, 49 (2015).
Artikel PubMed PubMed Central Google Scholar
López-Leal, G. et al. Die Analyse tausender prokaryontischer Genome ergab eine hohe Häufigkeit von Prophagen mit einem streng begrenzten Wirtsspektrum. mSystems 7, e00326–22 (2022).
Artikel PubMed PubMed Central Google Scholar
Gohli, J. et al. Das U-Bahn-Mikrobiom: saisonale Dynamik und direkter Vergleich von Luft- und Oberflächenbakteriengemeinschaften. Mikrobiom 7, 160 (2019).
Artikel PubMed PubMed Central Google Scholar
Vignuzzi, M. & López, CB Defekte virale Genome sind wichtige Treiber der Virus-Wirt-Interaktion. Nat. Mikrobiol. 4, 1075–1087 (2009).
Artikel Google Scholar
Bobay, LM, Rocha, EP & Touchon, M. Die Anpassung von gemäßigten Bakteriophagen an ihre Wirtsgenome. Mol. Biol. Entwicklung 30, 737–751 (2013).
Artikel CAS PubMed Google Scholar
Chen, R., Wang, H. & Mansky, LM Rollen von Uracil-DNA-Glycosylase und dUTPase bei der Virusreplikation. J. General Virol. 83, 2339–2345 (2002).
Artikel CAS PubMed Google Scholar
Mara, P. et al. Virale Elemente und ihr potenzieller Einfluss auf mikrobielle Prozesse entlang der permanent geschichteten Redoxkline des Cariaco-Beckens. ISME J. 14, 3079–3092 (2020).
Artikel CAS PubMed PubMed Central Google Scholar
Okazaki, Y., Nishimura, Y., Yoshida, T., Ogata, H. & Nakano, SI Genomaufgelöste virale und zelluläre Metagenome zeigten mögliche wichtige Virus-Wirt-Interaktionen in einem tiefen Süßwassersee. Umgebung. Mikrobiol. 21, 4740–4754 (2019).
Artikel CAS PubMed Google Scholar
McCarty, RM, Somogyi, A., Lin, G., Jacobsen, NE & Bandarian, V. Der Deazapurin-Biosyntheseweg enthüllte: enzymatische In-vitro-Synthese von PreQ(0) aus Guanosin-5'-triphosphat in vier Schritten. Biochemistry 48, 3847–3852 (2009).
Artikel CAS PubMed Google Scholar
Middelboe, M. Bakterienwachstumsrate und Dynamik des Meeresvirus-Wirts. Mikrob. Ökologisch. 40, 114–124 (2000).
Artikel CAS PubMed Google Scholar
Calero-Cáceres, W. & Muniesa, M. Persistenz natürlich vorkommender Antibiotikaresistenzgene in den Bakterien- und Bakteriophagenfraktionen des Abwassers. Wasserres. 95, 11–18 (2016).
Artikel PubMed Google Scholar
Pfeifer, E., Bonnin, RA & Rocha, EPC Phagenplasmide verbreiten Antibiotikaresistenzgene durch Infektion und lysogene Umwandlung. mBio 13, e01851–22 (2022).
Artikel PubMed PubMed Central Google Scholar
Moon, K. et al. Das Metagenom von Süßwasserviren enthüllt neuartige und funktionelle, von Phagen übertragene Antibiotikaresistenzgene. Mikrobiom 8, 75 (2020).
Artikel CAS PubMed PubMed Central Google Scholar
Shen, J., Zhou, J., Xu, Y. & Xiu, Z. Prophagen tragen zur Genomplastizität von Klebsiella pneumoniae bei und könnten an der chromosomalen Integration von ARGs in CG258 beteiligt sein. Genomics 112, 998–1010 (2020).
Artikel CAS PubMed Google Scholar
Hynes, AP et al. Ein Anti-CRISPR aus einem virulenten Streptokokken-Phagen hemmt Streptococcus pyogenes Cas9. Nat. Mikrobiol. 2, 1374–1380 (2017).
Artikel CAS PubMed Google Scholar
Callanan, J. et al. Verzerrungen bei der auf viraler Metagenomik basierenden Erkennung, Katalogisierung und Quantifizierung von Bakteriophagengenomen in menschlichen Fäkalien, eine Übersicht. Mikroorganismen 9, 524 (2021).
Artikel CAS PubMed PubMed Central Google Scholar
Johansen, J. et al. Genom-Binning viraler Entitäten aus Massenmetagenomdaten. Nat. Komm. 13, 965 (2022).
Artikel ADS CAS PubMed PubMed Central Google Scholar
Chng, KR et al. Kartographie opportunistischer Krankheitserreger und Antibiotikaresistenzgene in einer tertiären Krankenhausumgebung. Nat. Med. 26, 941–951 (2020).
Artikel CAS PubMed PubMed Central Google Scholar
Wilkins, D. et al. Tagesschwankungen im menschlichen Hautmikrobiom beeinflussen die Genauigkeit des forensischen Mikrobiomabgleichs. Mikrobiom 9, 129 (2021).
Artikel CAS PubMed PubMed Central Google Scholar
Leung, MHY et al. Die Charakterisierung des Luftmikrobioms und Resistoms des öffentlichen Nahverkehrs zeigt geografische Besonderheiten. Mikrobiom 9, 112 (2021).
Artikel CAS PubMed PubMed Central Google Scholar
Schubert, M., Lindgreen, S. & Orlando, L. AdapterRemoval v2: Schnelles Adapter-Trimmen, Identifizieren und Zusammenführen von Lesevorgängen. BMC Res. Anmerkungen 9, 88 (2016).
Artikel PubMed PubMed Central Google Scholar
Uritskiy, GV, DiRuggiero, J. & Taylor, J. MetaWRAP – eine flexible Pipeline für die genomaufgelöste metagenomische Datenanalyse. Mikrobiom 6, 158 (2018).
Artikel PubMed PubMed Central Google Scholar
Nayfach, S. et al. CheckV bewertet die Qualität und Vollständigkeit von aus Metagenomen zusammengesetzten Virusgenomen. Nat. Biotechnologie. 39, 578–585 (2021).
Artikel CAS PubMed Google Scholar
Arndt, D. et al. PHASTER: eine bessere, schnellere Version des PHAST-Phagensuchtools. Nukleinsäuren Res. 44, W16–W21 (2016).
Artikel CAS PubMed PubMed Central Google Scholar
Kieft, K., Zhou, Z. & Anantharaman, K. VIBRANT: Automatisierte Wiederherstellung, Annotation und Kuration mikrobieller Viren und Bewertung der Funktion der Virusgemeinschaft anhand genomischer Sequenzen. Mikrobiom 8, 90 (2020).
Artikel CAS PubMed PubMed Central Google Scholar
Enright, AJ, Van Dongen, S. & Ouzounis, CA Ein effizienter Algorithmus für die groß angelegte Erkennung von Proteinfamilien. Nucleic Acids Res 30, 1575–1584 (2002).
Artikel CAS PubMed PubMed Central Google Scholar
Hyatt, D. et al. Prodigal: prokaryotische Generkennung und Identifizierung der Translationsinitiationsstelle. BMC Bioinform. 11, 1–11 (2010).
Artikel Google Scholar
Dixon, P. VEGAN, ein Paket von R-Funktionen für die Gemeinschaftsökologie. J. Veg. Wissenschaft. 14, 927–930 (2003).
Artikel Google Scholar
Low, SJ, Džunková, M., Chaumeil, PA, Parks, DH & Hugenholtz, P. Bewertung einer verketteten Proteinphylogenie zur Klassifizierung von doppelsträngigen DNA-Viren mit Schwanz, die zur Ordnung Caudovirales gehören. Nat. Mikrobiol. 4, 1306–1315 (2019).
Artikel CAS PubMed Google Scholar
Capella-Gutierrez, S., Silla-Martinez, JM & Gabaldon, T. trimAl: ein Werkzeug zum automatisierten Alignment-Trimmen in groß angelegten phylogenetischen Analysen. Bioinformatik 25, 1972–1973 (2009).
Artikel CAS PubMed PubMed Central Google Scholar
Price, MN, Dehal, PS & Arkin, AP FastTree: Berechnung großer Bäume mit minimaler Evolution mit Profilen anstelle einer Distanzmatrix. Mol. Biol. Entwicklung 26, 1641–1650 (2009).
Artikel CAS PubMed PubMed Central Google Scholar
Haft, DH Die TIGRFAMs-Datenbank der Proteinfamilien. Nukleinsäuren Res. 31, 371–373 (2003).
Artikel CAS PubMed PubMed Central Google Scholar
Paez-Espino, D. et al. Das Virom der Erde aufdecken. Natur 536, 425–430.
Artikel ADS CAS PubMed Google Scholar
Alcock, BP et al. CARD 2020: Antibiotika-Resistom-Überwachung mit der umfassenden Antibiotika-Resistenz-Datenbank. Nukleinsäuren Res. 48, D517–D255 (2019).
PubMed Central Google Scholar
Shaffer, M. et al. DRAM zum Destillieren des mikrobiellen Stoffwechsels, um die Kuration der Mikrobiomfunktion zu automatisieren. Nukleinsäuren Res. 48, 8883–8900 (2020).
Benler, S. et al. Tausende bisher unbekannte Phagen in Metagenomen des menschlichen Darms einer ganzen Gemeinschaft entdeckt. Mikrobiom 9, 78 (2021).
Artikel CAS PubMed PubMed Central Google Scholar
Hauser, M., Steinegger, M. & Soding, J. MMseqs-Softwaresuite für schnelles und tiefes Clustering und Durchsuchen großer Proteinsequenzsätze. Bioinformatik 32, 1323–1330 (2016).
Artikel CAS PubMed Google Scholar
Deorowicz, S., Debudaj-Grabysz, A. & Gudyś, A. FAMSA: Schnelles und genaues Mehrfachsequenz-Alignment großer Proteinfamilien. Wissenschaft. Rep. 6, 1–13 (2016).
Artikel Google Scholar
Jumper, J. et al. Hochpräzise Vorhersage der Proteinstruktur mit AlphaFold. Natur 596, 583–589 (2021).
Artikel ADS CAS PubMed PubMed Central Google Scholar
Mirdita, M. et al. ColabFold: Proteinfaltung für alle zugänglich machen. Nat. Methoden 19, 679–682 (2022).
Artikel CAS PubMed PubMed Central Google Scholar
Olm, MR, Brown, CT, Brooks, B. & Banfield, JF dRep: ein Tool für schnelle und genaue Genomvergleiche, das eine verbesserte Genomwiederherstellung aus Metagenomen durch De-Replikation ermöglicht. ISME J. 11, 2864–2868 (2017).
Artikel CAS PubMed PubMed Central Google Scholar
Seemann, T. Prokka: Schnelle Annotation des prokaryotischen Genoms. Bioinformatik 30, 2068–2069 (2014).
Artikel CAS PubMed Google Scholar
Huerta-Cepas, J. et al. eggNOG 5.0: eine hierarchische, funktionell und phylogenetisch annotierte Orthologie-Ressource basierend auf 5090 Organismen und 2502 Viren. Nukleinsäuren Res. 47, D309–D314 (2019).
Artikel CAS PubMed Google Scholar
Chaumeil, PA, Mussig, AJ, Hugenholtz, P. & Parks, DH GTDB-Tk: ein Toolkit zur Klassifizierung von Genomen mit der Genom-Taxonomie-Datenbank. Bioinformatik 36, 1925–1927 (2020).
CAS Google Scholar
Couvin, D. et al. CRISPRCasFinder, ein Update von CRISRFinder, enthält eine tragbare Version, verbesserte Leistung und integriert die Suche nach Cas-Proteinen. Nukleinsäuren Res. 46, W246–W251 (2018).
Artikel CAS PubMed PubMed Central Google Scholar
Camacho, C. et al. BLAST+: Architektur und Anwendungen. BMC Bioinform. 10, 421 (2009).
Artikel Google Scholar
Shannon, P. et al. Cytoscape: eine Softwareumgebung für integrierte Modelle biomolekularer Interaktionsnetzwerke. Genomres. 13, 2498–2504 (2003).
Artikel CAS PubMed PubMed Central Google Scholar
Referenzen herunterladen
Diese Forschung wurde vom Hong Kong Research Grants Council Research Impact Fund (R1016-20F) an ACKL, CKC und PKHL und vom General Research Fund (11214721) an PKHL unterstützt. Die Unterstützung erfolgt auch durch die National Institutes of Health (NIH)-Zuschüsse R01AI151059 und U01DA053941 an CEM
School of Energy and Environment, City University of Hong Kong, Sonderverwaltungszone Hongkong, China
[PubMed] Shicong Du, Xinzhao Tong, Alvin CK Lai, Chak K. Chan und Patrick KH Lee
Abteilung für Biowissenschaften, School of Science, Xi'an Jiaotong-Liverpool University, Suzhou, VR China
Xinzhao Tong
Abteilung für Physiologie und Biophysik, Weill Cornell Medicine, New York, NY, USA
Christopher E. Mason
Seine Königliche Hoheit Prinz Alwaleed Bin Talal Bin Abdulaziz Alsaud Institute for Computational Biomedicine, Weill Cornell Medicine, New York, NY, USA
Christopher E. Mason
Die WorldQuant-Initiative für quantitative Vorhersage, Weill Cornell Medicine, New York, NY, USA
Christopher E. Mason
Das Feil Family Brain and Mind Research Institute, Weill Cornell Medicine, New York, NY, USA
Christopher E. Mason
Staatliches Schlüssellabor für Meeresverschmutzung, City University of Hong Kong, Sonderverwaltungszone Hongkong, China
Patrick KH Lee
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
SD führte eine Datenanalyse und Dateninterpretation durch und verfasste das Manuskript. XT und CEM führten eine Datenanalyse durch. ACKL und CKC gaben Ratschläge zur Dateninterpretation. PKHL konzipierte die Studie und überwachte die Forschung. Alle Autoren haben das endgültige Manuskript gelesen und genehmigt.
Korrespondenz mit Patrick KH Lee.
Die Autoren geben an, dass keine Interessenkonflikte bestehen.
Nature Communications dankt Oliver Charity, Eugene Koonin und den anderen, anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit. Eine Peer-Review-Datei ist verfügbar.
Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.
Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.
Nachdrucke und Genehmigungen
Du, S., Tong, X., Lai, ACK et al. Stark wirtsgebundene Virome in der gebauten Umwelt verfügen über eine lebensraumabhängige Diversität und Funktionen für die potenzielle Virus-Wirt-Koevolution. Nat Commun 14, 2676 (2023). https://doi.org/10.1038/s41467-023-38400-0
Zitat herunterladen
Eingegangen: 02. November 2022
Angenommen: 27. April 2023
Veröffentlicht: 09. Mai 2023
DOI: https://doi.org/10.1038/s41467-023-38400-0
Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:
Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.
Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt
Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.