banner

Nachricht

Aug 11, 2023

Genaue und schnelle Identifizierung minimal präparierter Bakterienphänotypen mithilfe von Raman-Spektroskopie, unterstützt durch maschinelles Lernen

Wissenschaftliche Berichte Band 12, Artikelnummer: 16436 (2022) Diesen Artikel zitieren

1997 Zugriffe

4 Zitate

4 Altmetrisch

Details zu den Metriken

Die weltweite Zunahme antimikrobieller Resistenzen (AMR) stellt eine ernsthafte Bedrohung für die menschliche Gesundheit dar. Um die Ausbreitung von AMR zu verhindern, besteht ein ungedeckter Bedarf an schnellen, zuverlässigen Diagnosetools, die eine optimale Antibiotika-Verwaltung ermöglichen. In dieser Hinsicht verspricht die Raman-Spektroskopie eine schnelle markierungs- und kulturfreie Identifizierung und antimikrobielle Empfindlichkeitstests (AST) in einem einzigen Schritt. Obwohl viele Raman-basierte Bakterienidentifizierungs- und AST-Studien beeindruckende Ergebnisse gezeigt haben, müssen einige Mängel behoben werden. Um die Lücke zwischen Proof-of-Concept-Studien und klinischer Anwendung zu schließen, haben wir Techniken des maschinellen Lernens in Kombination mit einem neuartigen Datenerweiterungsalgorithmus entwickelt, um minimal präparierte Bakterienphänotypen schnell zu identifizieren und Methicillin-resistente (MR) Bakterien zu unterscheiden Methicillin-empfindliche (MS) Bakterien. Hierzu haben wir ein Spektraltransformatormodell für hyperspektrale Raman-Bilder von Bakterien implementiert. Wir zeigen, dass unser Modell die Standardmodelle für Faltungs-Neuronale Netzwerke bei einer Vielzahl von Klassifizierungsproblemen übertrifft, sowohl hinsichtlich der Genauigkeit als auch hinsichtlich der Trainingszeit. Wir erreichen eine Klassifizierungsgenauigkeit von mehr als 96 % für einen Datensatz, der aus 15 verschiedenen Klassen besteht, und eine Klassifizierungsgenauigkeit von 95,6 % für sechs MR-MS-Bakterienarten. Noch wichtiger ist, dass unsere Ergebnisse ausschließlich auf der Grundlage schnell und einfach zu erstellender Trainings- und Testdaten erzielt werden.

Übersicht über Hardware (Raman-Mikroskop) und Software (Spektraltransformator-Architektur). (a) Die einfache Probenvorbereitung von Bakterien, bei der die Bakterien von den Agarplatten einfach direkt auf die CaF\(_2\)-Objektträger übertragen und dann gemessen werden. Der Vorgang des Übertragens und Auffindens der Bakterien dauert weniger als eine Minute. (b) Schematische Darstellung des selbstgebauten Raman-Mikroskops. Das Raman-Mikroskop verwendet eine Anregungswellenlänge von 785 nm, da diese sich als optimal für die Identifizierung von Bakterien erwiesen hat, da sie Fluoreszenz weitgehend vermeidet und dennoch ein ausreichend hohes Raman-Signal liefert, um die Erkennung durch ein CCD mit einem angemessenen Signal-zu- Rauschverhältnis (SNR). Ein 100-fach-Mikroskopobjektiv (MO) wird zur Fokussierung des Anregungslasers (Spotgröße \(\sim \) 1 \(\upmu \)m), zur Sammlung des Raman-Streulichts und zur visuellen Bildgebung verwendet. Das Rasterscannen wird mit einem automatisierten XYZ-Tisch erreicht. Ein dichroitischer Spiegel (DM) (Hochpass 750 nm) wird verwendet, um das sichtbare Beleuchtungslicht an ein CCD zu koppeln, um Bakterien abzubilden und zu lokalisieren, während ein weiterer DM (Hochpass 805 nm) das Raman-Streulicht von der Pumpe trennt. Zur Filterung der 785-nm-Pumpe wird ein zusätzlicher Hochpassfilter (HPF, 800 nm) und ein Bandpassfilter (BPF, 785 nm ± 10 nm) verwendet. Das eingebaute Mikroskop hat ein Sichtfeld von etwa 60 \(\upmu \)m \(\times \) 60 \(\upmu \)m und Raman-Spektren werden bei einer Wellenzahlverschiebung von 700–1600 erfasst cm\(^{-1}\) durch ein Horiba-Spektrometer. (c) Das Blockdiagramm des entwickelten maschinellen Lerntools. Der Spektraltransformator (ST) besteht aus einer optionalen Positionseinbettungsschicht, gefolgt von einer Dropout-Schicht. Die nächste Schicht ist ein Transformator-Encoder-Block, der nacheinander Schichtnormalisierung, Mehrkopfaufmerksamkeit, Schichtnormalisierung und dann ein Mehrschichtperzeptron (MLP) mit einer GELU-Nichtlinearität enthält. Auf die Ausgabe des Transformator-Encoders folgt eine Schichtnormalisierung und eine Sequenz-Pooling-Schicht. Schließlich ist die Ausgabeschicht eine vollständig verbundene lineare Schicht.

Während einige Gesundheitskrisen, wie die Corona-Pandemie, unvorhersehbar sind und sofortige Maßnahmen erfordern, entwickeln sich andere langsam und sind von Natur aus hartnäckig, können aber mit der Zeit zu einer größeren Bedrohung für die menschliche Gesundheit werden1,2. Ein Beispiel für Letzteres ist die antimikrobielle Resistenz (AMR)3,4,5,6. AMR tritt auf, wenn Mikroben wie Bakterien und Pilze den Kontakt mit Verbindungen überleben, die normalerweise ihr Wachstum hemmen oder sie abtöten würden. Dies treibt einen Selektionsprozess voran, der es widerstandsfähigen Stämmen ermöglicht, zu wachsen und sich zu verbreiten. Obwohl AMR ein natürlich vorkommender Prozess ist, wird er durch selektiven Druck wie den übermäßigen Einsatz antimikrobieller Mittel dramatisch beschleunigt7,8,9,10,11. Konventionelle Techniken zur Identifizierung von AMR in Bakterien sind Scheibendiffusionstest, Epsilometertest und Mikroverdünnung, die eine Kultivierung erfordern und Tage dauern können12,13. Die lange Verarbeitungszeit dieser Techniken kann für den infizierten Patienten lebensbedrohlich sein, ist aber auch problematisch, da sich die pathogenen Bakterien möglicherweise ausbreiten und weitere Menschen infizieren. Daher ist es üblich, Patienten Breitbandantibiotika zu verschreiben, was zu unnötigen Behandlungen führt14. Daher wird die bereits weit verbreitete und zunehmende Unzulänglichkeit der antimikrobiellen Therapie auf den übermäßigen Einsatz antimikrobieller Mittel im Gesundheitswesen und in der Landwirtschaft zurückgeführt5,8,15. Im Jahr 2019 erklärte die Weltgesundheitsorganisation (WHO) AMR zu „einer der 10 größten globalen Bedrohungen für die öffentliche Gesundheit der Menschheit“ und laut einem von der UN-Ad-hoc-Interagency Coordinating Group on Antimicrobial Resistance (IACG) veröffentlichten Bericht werden keine Maßnahmen ergriffen Wenn antimikrobielle resistente Krankheitserreger eingenommen werden, könnten sie bis zum Jahr 2050 jährlich 10 Millionen Todesfälle verursachen2.

Um die potenzielle Katastrophe einer Post-Antibiotika-Ära abzumildern, fordern Organisationen wie die WHO und die IACG die Entwicklung einer schnellen Point-of-Care-Diagnostik, die die Behandlung mit gezielten antimikrobiellen Mitteln erleichtert1,5. Um dies zu erreichen, wurden viele verschiedene Technologien untersucht12,16,17,18,19. Eine vielversprechende Technologie ist die Raman-Spektroskopie (RS). RS ist eine Technik, die auf inelastischer Streuung basiert, die auftritt, wenn Photonen mit Molekülen kollidieren, und eine einzigartige Signalzerlegung für ein breites Spektrum von Molekülen ermöglicht20. Wichtig ist, dass RS den Vorteil hat, dass es schnell, kostengünstig und markierungsfrei ist und nicht unbedingt eine voranalytische Kultivierung erfordert. Mehrere Studien haben gezeigt, dass die Fähigkeiten von RS erheblich gestärkt werden können, wenn sie durch chemometrische Werkzeuge und maschinelles Lernen (ML) unterstützt werden19,21,22,23,24,25,26,27,28,29,30,31. Dennoch müssen einige Mängel behoben werden, bevor es zu einer brauchbaren Plattform für zuverlässige Bakterienidentifizierung und Point-of-Care-Diagnoseanwendungen wird. RS reagiert vor allem empfindlich auf Faktoren wie das Wachstumsstadium der analysierten Zellen, Änderungen in der Messumgebung und Inkonsistenzen bei der Probenvorbereitung23. Daher ist es praktisch, Proben so vorzubereiten, dass die Schwierigkeit der Klassifizierung verringert wird. Ansätze wie die Vorbereitung einzelner Bakterien oder einlagiger Bakterienmatten sind leider komplex und erfordern Fachwissen und maßgeschneiderte Ausrüstung und können Stunden dauern25,32,33. Darüber hinaus können Inkonsistenzen bei der Probenvorbereitung zu Veränderungen der Raman-Spektren führen, sodass mehr Daten für ML-Modelle erforderlich sind, um die Variationsbreite zu erfassen, die zum Erreichen klinisch relevanter Genauigkeiten erforderlich ist19. Darüber hinaus sind RS-Bakterienstudien mit Patientenproben selten und es kann nicht davon ausgegangen werden, dass die Verwendung von Daten aus im Labor kultivierten Proben eine genaue Identifizierung echter Patientenproben ermöglicht. Darüber hinaus gibt es kaum oder gar keine Unterstützung für Standards für Raman-Messparameter und Probenvorbereitungsmethoden und -parameter22,23. Dieser Mangel behindert die Konsolidierung von Datenbanken enorm und verlangsamt die Aggregation großer Datenmengen, die für klinische Anwendungen genutzt werden könnten. Um mit RS klinisch relevante Genauigkeiten zu erreichen, müssen diese Probleme angegangen werden, und ihre Lösung erfordert gemeinsame Anstrengungen.

In dieser Arbeit konzentrieren wir uns auf die Probleme der einfachen Probenvorbereitung und Änderungen in der Messumgebung34. Wir reduzieren die Probenvorbereitung auf die bloße Übertragung der Bakterien in die Messumgebung (wie in Abb. 1a dargestellt) und minimieren so das Problem der Probeninkonsistenz. Dieses Verfahren bietet den zusätzlichen Vorteil, dass die Probenvorbereitung als hemmender Parameter für die Datenkonsolidierung entfällt. Um die Situation der begrenzten Datenverfügbarkeit für das ML-Modelltraining zu entschärfen, haben wir außerdem ein neuartiges ML-Modell mit Spektraltransformator (ST) entwickelt, das nach dem Training sowohl für kleine als auch für große RS-Bakteriendatensätze effizient ist. Um den ST mit repräsentativen Trainingsdaten zu versorgen, haben wir einen neuartigen Datenerweiterungsalgorithmus entwickelt, der im Folgenden als NoiseMix bekannt ist. Wir zeigen, dass unser ST-Modell in Verbindung mit NoiseMix eine genaue Klassifizierung sowohl einzelner Bakterien als auch mehrschichtiger Bakterienmatten in einem Durchgang ermöglicht und dabei vor allem nur auf schnell und einfach zu erstellenden Trainingsdaten basiert, die auf dicken mehrschichtigen Bakterienmatten erfasst wurden . Nach unserem Kenntnisstand handelt es sich hierbei um einen völlig neuen Ansatz zur Erfassung von Trainingsdaten und der anschließenden Klassifizierung von Bakterien mithilfe von RS, unterstützt durch ML. Explizit demonstrieren wir die Fähigkeiten unseres entwickelten ST ML-Modells und NoiseMix anhand eines Datensatzes, der aus 12 Bakterienklassen aus minimal vorbereiteten Bakterienproben und 3 Nicht-Bakterienklassen besteht. Wir stellen fest, dass NoiseMix die durchschnittliche Klassifizierungsgenauigkeit für die vier verschiedenen Tests um 12,9 % verbessert, verglichen mit der alleinigen Verwendung von Klassenausgleich und Steigungsentfernung. Darüber hinaus zeigen wir, dass das ST-Modell zwischen antibiotikaresistenten und -anfälligen Phänotypen unterscheiden kann, d. h. MR S. epidermidis (MRSE), MS S. epidermidis (MSSE), zwei Arten von MR S. aureus (MRSA) und zwei Arten von MS S. aureus (MSSA). Wir erhalten Identifikationsgenauigkeiten von 97,7\(\%\) bzw. 94,6\(\%\) zwischen MRSE-MSSE- und MRSA-MSSA-Isolaten. Zusätzlich zur Identifizierung minimal vorbereiteter Proben führen wir detaillierte Benchmark-Tests des ST durch, indem wir ihn mit einem Faltungs-Neuronalen Netzwerk (CNN) vergleichen, das in der Arbeit von Ho entwickelt wurde. et al. auf mehreren RS-Bakteriendatensätzen25. Wir stellen fest, dass unser ST-Modell das CNN-Modell in Bezug auf die Rechenzeit, die um eine Größenordnung verbessert wurde, deutlich übertrifft und dass es im Allgemeinen das CNN-Modell in Bezug auf die Klassifizierungsgenauigkeit übertrifft, für die wir eine Verbesserung von 7,5 \( \%\) im Vergleich zum Referenz-CNN-Modell25.

Ein selbstgebautes Raman-Mikroskop wird verwendet, um Trainings- und Validierungsdatensätze minimal vorbereiteter Bakterienproben zu erfassen. Das Schema unseres Raman-Mikroskops zur Erfassung von Raman-Hyperspektralkarten ist in Abb. 1b dargestellt. Der Grund für die Verwendung eines selbstgebauten Systems besteht darin, dass es uns die Möglichkeit gibt, das Signal-Rausch-Verhältnis (SNR) des Raman-Mikroskops zu optimieren und das System an die Aufgabe des Nachweises von Bakterien anzupassen. Hiermit können wir Raman-Spektren mit sehr kurzen Messzeiten von bis zu 0,1 Sekunden aufnehmen und verfügen zudem über ein relativ kostengünstiges System im Vergleich zu kommerziellen Raman-Mikroskopen. Weitere Einzelheiten zum Mikroskop und Spektrometer finden Sie im Abschnitt „Methoden“.

Die erfolgreiche Klassifizierung von Bakterien mithilfe von RS und ML hängt in hohem Maße von einer großen Trainingsdatenbank ab, die in den Trainings- und Validierungsschritten des Modells verwendet wird. Die Datenerhebung wird daher oft genauso wichtig wie die ML-Algorithmen selbst, da über- oder unterrepräsentierte Daten zu verzerrten Vorhersagen führen. Wenn RS für schnelle In-situ-Diagnoseanwendungen in Betracht gezogen werden soll, müssen die Komplexität und der Zeitaufwand der Probenvorbereitung erheblich reduziert werden34,35,36. Um herauszufinden, wie sehr wir die Zeit und Komplexität der Probenvorbereitung vereinfachen und reduzieren können, experimentierten wir mit der einfachen Übertragung von Bakterienproben aus einer Bakterienmonokultur direkt auf einen CaF\(_2\)-Objektträger, gefolgt von Raman-Rasterscan-Messungen. Dieser Ansatz führt dazu, dass die Tiefe der Bakterienproben auf natürliche Weise von ein- bis mehrschichtigen Matten variiert, was zu großen Schwankungen im SNR innerhalb der Probe führt32. Auf diese Weise erstellte Trainingsdatenkarten erfordern eine manuelle Segmentierung, da die Karten Bereiche ohne Bakterien (Hintergrund) enthalten können. Um die Notwendigkeit einer manuellen Segmentierung zu vermeiden, erstellen wir Trainingsdaten stattdessen ausschließlich aus Messungen mehrschichtiger Bakterienmatten. Daten aus Messungen von mehrschichtigen Bakterienmatten weisen jedoch im Vergleich zu Daten, die von ein- bis mehrschichtigen Bakterienmatten erfasst wurden, eine begrenzte SNR-Verteilung auf. Mit dem Ziel, die natürlichen Varianzen, die in Testdaten auftreten können, synthetisch nachzubilden, erstellen wir Trainingsdaten, indem wir die Spektroskop-Integrationszeit von 0,1 bis 1 Sekunde variieren (10 Durchschnittswerte für jede Erfassung). Mit diesem Verfahren und einem automatisierten Raman-Spektroskopie-Aufbau (siehe Methoden) erfassen wir täglich mehrere Tausend Trainingsspektren. Unsere endgültige Referenzbakteriendatenbank enthält über 5200 Raman-Rohspektren für jede der 12 Bakterienarten und 3 Nichtbakterienarten. Alle Rohdaten werden durch ein einfaches Verfahren (siehe Methoden) linear vorverarbeitet, bevor sie entweder zur Datenerweiterung, zum Modelltraining oder zur Modellvorhersage verwendet werden.

Inspiriert durch Computer Vision, bei der „zusätzliche“ Trainingsdaten häufig beispielsweise durch Drehen, Spiegeln, Unschärfe oder Hinzufügen von weißem Rauschen zu Bildern erweitert werden, haben wir einen Datenerweiterungsalgorithmus (NoiseMix) entwickelt, der es uns ermöglicht, zusätzliche Trainingsdaten synthetisch zu erstellen und Dadurch wird die Verallgemeinerung und Leistung des Modells verbessert. Der NoiseMix-Erweiterungsalgorithmus (technische Details siehe Zusatzmaterial) funktioniert, indem er schnell und einfach Raman-Spektren von mehrschichtigen Bakterienmatten erstellt und dann Daten mit noch mehr „Rauschen“ sowohl der Messoberfläche/-umgebung als auch der Rauschdaten einmischt aus Messungen in der Umgebung. Neben der Erhöhung der Menge an Trainingsdatenbeispielen bringt NoiseMix, wie hier implementiert, zwei weitere Vorteile mit sich. Erstens ermöglicht es eine synthetische Erweiterung des RS-Datensatzes in den Bereich niedrigerer SNR-Verteilungen. In diesem Sinne können grundsätzlich Trainingsdaten mit beliebig niedrigem SNR realisiert werden, allerdings wird das SNR in der Praxis über einem bestimmten Mindestwert gehalten, um die Einbeziehung von Trainingsbeispielen zu vermeiden, die aus reinem Rauschen bestehen. Bemerkenswerterweise stellen wir fest, dass der NoiseMix-Augmentationsalgorithmus eine hochgenaue Identifizierung einzelner Bakterien ermöglicht, obwohl die ursprünglichen Trainingsbeispiele ausschließlich aus mehrschichtigen Bakterienmatten stammen. Zweitens bietet der NoiseMix-Algorithmus eine Möglichkeit, alle Daten von Datensätzen mit unausgeglichenen Klassen zu nutzen, indem er sicherstellt, dass alle Klassen in jeder Trainingsepoche durch die gleiche Datenmenge repräsentiert werden.

Leistungsübersicht der Bakterienidentifizierung mit dem ST-Modell und dem NoiseMix-Algorithmus. (a) Zeigt die für die Klassifizierungsaufgabe erhaltene Verwirrungsmatrix einschließlich 12 bakterieller und 3 nichtbakterieller Klassen (Agar, Polystyrol und CaF\(_2\)). Die CaF\(_2\)-Klassifizierungsspalte (rechts) enthält Nicht-Null-Elemente, da die Probenoberflächen in einigen Fällen nur teilweise von Bakterien bedeckt waren. Aus diesem Grund sind die nichtbakteriellen Klassen ausgegraut, da sie nicht in die Genauigkeit der Bakterienidentifizierung einbezogen werden. (b) Zeigt einen Leistungsvergleich zwischen vier verschiedenen ML-Modellen, die sowohl mit als auch ohne Anwendung von NoiseMix trainiert wurden. Die in der Verwirrungsmatrix angezeigten Ergebnisse werden mit dem ST-pe(1,10,3)*-Modell ermittelt, das mit einer Stapelgröße von 300 und dem AdamW-Optimierer trainiert wurde. Die anderen drei Modelle werden ebenfalls mit dem AdamW-Optimierer trainiert, jedoch mit einer kleineren Chargengröße von 100. Die Modellgenauigkeiten (und -dichten) stellen Durchschnittswerte über 10 Trainingsaufteilungen dar. In (c) zeigen wir die Ergebnisse eines Benchmarktests zwischen dem CNN- und dem ST-Modell bei Anwendung auf drei verschiedene Klassifizierungsaufgaben. Die drei Datensätze werden im Zusatzmaterial beschrieben. In diesem Fall stellen die gemeldeten Genauigkeiten den Durchschnitt von 10 Läufen mit einer Trainings-/Validierungsaufteilung von 90\(\%\)/10\(\%\) dar.

Die Bakterienidentifizierung mithilfe von RS hat in den letzten Jahren einen erheblichen Leistungszuwachs erfahren, da sich Deep-Learning-Techniken wie Restverbindungen und CNNs als leistungsfähiger erwiesen haben als klassischere überwachte Lernmethoden wie logistische Regression und Support-Vektor-Maschinen25,37,38. Um dies noch weiter zu verbessern, haben wir ein aufmerksamkeitsbasiertes Deep-Learning-Modell entwickelt, das vom aktuellen Stand der Technik in den Bereichen Computer Vision und Programmierung in natürlicher Sprache inspiriert ist. Das ST-Modell (in Abb. 1c skizziert und unter Methoden ausführlicher erläutert) ist eine kompakte Version des Standard-Transformator-Encoders39, unterscheidet sich jedoch durch die Verwendung von Sequenz-Pooling, um die sequentiellen Ausgänge des Transformators einer einzelnen Klasse zuzuordnen.

Unsere ST-Modellarchitektur wird zunächst durch drei Argumente ST(-pe)(i, j, k) parametrisiert, wobei i die Tiefe des Transformator-Encoders, j die Anzahl der Köpfe in der Multi-Head-Aufmerksamkeitsschicht und k ist Mehrschichtiges Perzeptronverhältnis, und die Einbeziehung von -pe bedeutet eine optionale Positionseinbettung. Die drei Argumente wurden als zusätzliche Hyperparameter unseres Modells behandelt und mithilfe eines baumstrukturierten Parzen-Schätzers ausgewählt, wobei eine Trainings- und Validierungsaufteilung für die Isolatklassifizierungsaufgabe25 verwendet wurde, d. h. wir haben nicht unsere eigenen RS-Daten verwendet, um unsere Modellarchitektur an die anzupassen Aufgabe zur Hand.

Unsere Hauptergebnisse sind in Abb. 2 zusammengefasst. Dort wird die Verwirrungsmatrix der Klassifizierungsaufgabe in 15 Klassen (12 Bakterien und 3 Nicht-Bakterien) angezeigt. Mit einem ST-pe(1,10,3)-Modell, das mit dem AdamW-Optimierer trainiert wurde und NoiseMix anwendet, wird über die 12 Bakterienklassen eine Gesamtgenauigkeit von über 96\(\%\) erreicht. Abbildung 2b zeigt einen Vergleich der Genauigkeit zwischen mehreren verschiedenen ML-Modellen mit und ohne Anwendung von NoiseMix für dieselbe Klassifizierungsaufgabe mit 15 Klassen. Wir stellen fest, dass die Erweiterung der Trainingsdaten mit NoiseMix die Modellleistung in der Testphase sowohl für die drei ST-Modelle als auch für das Referenz-CNN-Modell erheblich verbessert, und wir stellen fest, dass beide ST-Modellarchitekturen das Referenz-CNN-Modell in unserem 15-Klassen-Datensatz übertreffen.

Zusätzlich zur Modellgenauigkeit (angegeben als Verhältnis der korrekten Bakterienklassifizierungen zur Gesamtzahl der Bakterienklassifizierungen) geben wir in Abb. 2b auch eine Dichtemetrik an. Die Dichte (oder Bakterienbedeckung) ist definiert als das Verhältnis der Bakterienklassifizierungen zur Gesamtzahl der in jedem Test vorgenommenen Klassifizierungen. Diese Metrik ist in unserem Fall enthalten, da ein Teil unserer Testdaten für einige Bakterien aus Hintergrunddaten besteht (siehe z. B. Abb. 3 unten) und daher nicht jede Messung einem Bakterientyp zugeordnet werden sollte. Insbesondere wird die Dichtemetrik durch die Anwendung von NoiseMix deutlich erhöht, was auf die Fähigkeit der Algorithmen zurückzuführen ist, die Klassifizierung für Signale mit niedrigem SNR zu verbessern.

Abbildung 2c vergleicht die Modellklassifizierungsleistung für drei verschiedene Bakteriendatensätze (eine Übersicht über die Datensätze und den angewandten Trainingsprozess finden Sie im Zusatzmaterial). Die Datensätze „Bacteria ID 1“ und „Bacteria ID 2“ stammen aus der Arbeit von Ho et. al.25. Für diese Datensätze beobachten wir im Durchschnitt nur eine geringfügige Verbesserung durch die Verwendung eines der beiden getesteten ST-Modelle. Der endgültige Datensatz „E. coli binär“ stammt aus unserer eigenen RS-Datenbank und enthält Raman-Spektren von E. coli ATCC 25922 und E. coli ATCC 35218. Auch bei diesem Datensatz übertreffen die ST-Modelle die CNN-Modelle deutlich, was darauf hindeutet, dass der ST Die Architektur kann bei einer umfassenderen Aufgabe spektroskopischer Klassifizierungsprobleme gut funktionieren.

Als abschließenden Leistungsmaßstab verglichen wir die Rechenzeit des ST-Modells mit der des Referenz-CNN-Modells25 (siehe Zusatzmaterial). Wir beobachten im Allgemeinen eine ungefähre Beschleunigung um eine Größenordnung zugunsten des entwickelten ST-Modells. Es ist jedoch zu beachten, dass ein kleiner Teil dieser Beschleunigung durch Unterschiede in den Modellhyperparametern wie Gewichtsabnahme, Parametermenge und Lernrate verursacht werden kann und dass der Unterschied daher nicht ausschließlich auf die Modellarchitekturen zurückzuführen ist.

Raman-Bildgebung und ST-Identifizierung von E. coli ATCC 25922 und E. coli ATCC 35218. Die erste Spalte zeigt visuelle Bilder der Messbereiche und veranschaulicht Bakterientiefen im Bereich von Einzel- bis Mehrfachschichten (4–6 \(\upmu \) m dick). In der zweiten Spalte werden Raman-Karten für eine Raman-Verschiebung von 1004 cm\(^{-1}\) angezeigt, die den Ringatmungsschwingungen von l-Phe zugeordnet sind, und schließlich werden in der dritten und vierten Spalte ST-Vorhersagekarten angezeigt . Die Größe der Karten beträgt 51 \(\upmu \)m \(\times \) 51 \(\upmu \)m und sie bestehen jeweils aus 2601 Raman-Spektren (700–1600 cm\(^{-1}\) ) mit 1 \(\upmu \)m Abstand zwischen den Punkten. Raman-Spektren werden mit 10-facher Mittelung und 0,5 s Integration erfasst. (a) Raman-Messungen von E. coli ATCC 25922. Die Gesamtvorhersagerate (Dichte-Oberflächenabdeckung) beträgt 49,1 % für E. coli ATCC 25922, 10,4 % für E. coli ATCC 35218 und 40,2 % für CaF\(_2\)-Hintergrund . Für die übrigen Bakterien/Klassen beträgt die Gesamtvorhersagerate 0,3 %. Die Vorhersagekarte rechts zeigt die Vorhersage für die übrigen Klassen, die für >0,5 dargestellt sind, wobei nur E. coli ATCC 35218 Werte über 0,5 aufweist. (b) Messungen von E. coli ATCC 35218. Die Gesamtvorhersagerate beträgt 8,0 % für E. coli ATCC 25922, 49,0 % für E. coli ATCC 35218 und 42,8 % für den Hintergrund. Für den Rest der Bakterien/Klassen summiert sich die Vorhersage auf 0,2 %. Auch hier führt der ST einige Fehlklassifizierungen von E. coli ATCC 25922 durch. (c) Raman-Messungen für eine binäre Mischung aus E. coli ATCC 25922 und E. coli ATCC 35218, was zu einer Vorhersagerate (Oberflächenbedeckung) von 48,8 % bzw. 51,2 % führte. Der ST nimmt in diesem Fall keine Fehlklassifizierungen vor. Alle Vorhersagen über andere Bakterien als die beiden E. coli sind Null. Bei allen drei erfassten Karten stimmen die ST-Vorhersagekarten sehr gut mit der Raman-Karte und der visuellen Karte überein.

Zum besseren Verständnis der Leistungsfähigkeit und Leistung unseres entwickelten ST-Modells und NoiseMix visualisieren wir die Analyse durch die Darstellung der Raman-Karten und ST-Vorhersagekarten. Wir führen Tests sowohl an Monokulturen als auch an Mischungen von Monokulturen durch, wie in Abb. 3 dargestellt. Abbildung 3a und b zeigen visuelle Bilder des Testbereichs für zwei Monokulturen von E. coli ATCC 25922 bzw. E. coli ATCC 35218. Die Raman-Karten werden mit einer Schrittgröße von 1 \(\upmu \)m über eine Fläche von 50\(\upmu \)mx 50\(\upmu \)m erfasst und für die Ringatmungsschwingungen von l-Phe aufgetragen ( Raman-Verschiebung 1004 cm\(^{-1}\)). Jede Raman-Karte besteht aus 2601 Punkten und jeder Punkt (Raman-Spektrum, 700–1600 cm\(^{-1}\)) wird aus 10 Mittelwerten mit einer Integrationszeit von 0,5 Sekunden erfasst, mit einer vollständigen Messzeit von 217 Minuten. Beim Vergleich der visuellen Bilder, Raman-Intensitätskarten und Vorhersagekarten in Abb. 3a, b stellen wir eine hervorragende Übereinstimmung zwischen den verschiedenen Formen der Visualisierung fest. Aus den in Abb. 3 dargestellten Konturkarten der Raman-Intensität geht hervor, dass die Raman-Intensität in der Grenzzone zwischen CaF\(_2\) und Bakterien abnimmt. Dies ist zum Teil auf eine dünnere Bakterienschicht (Monoschicht) und zum Teil auf die geringere Überlappung zwischen Laser und Bakterien zurückzuführen. Ohne die NoiseMix-Methode würden die ST-Vorhersagekarten die Region mit Bakterienbedeckung unterschätzen und zu deutlich mehr Fehlklassifizierungen in der Abgrenzungszone zwischen CaF\(_2\) und Bakterien führen. Die daraus resultierende Verringerung des SNR der Raman-Signale hat daher zur Folge, dass die ML-Modelle, die ausschließlich auf mehrschichtigen Bakterienmatten trainiert werden, den mit Bakterien bedeckten Bereich unterschätzen und in der Demarkationszone zahlreiche Fehlklassifizierungen vornehmen. Durch die Anwendung von NoiseMix in der Trainingsphase wird das ST-Modell jedoch selbst bei der Erkennung und Identifizierung geringer Bakterienkonzentrationen (Monoschichten) äußerst effizient, obwohl die ursprünglichen Trainingsdaten nur Messungen von mehrschichtigen Bakterienmatten enthalten. Dies wird auf die Fähigkeit der NoiseMix-Algorithmen zurückgeführt, die Klassifizierung für Raman-Signale mit niedrigem SNR zu verbessern. Wir definieren eine Genauigkeit für eine Klasse als: richtig/(Kreuze + richtig), wobei Kreuze alle falschen Vorhersagen mit Werten über >0,5 sind und die Vorhersage des Hintergrunds (CaF\(_2\)) ausschließen. Dies ergibt eine Genauigkeit von 87,3 % bzw. 87,9 % für Abb. 3a,b. Beim Vergleich der Genauigkeiten mit der Oberflächenabdeckung stellen wir fest, dass unser ST-Klassifikator für diesen speziellen Fall in etwa 10 % der Fälle unbestimmt ist, wobei die Vorhersagerate unter 0,5 liegt. Der 15-Klassen-ST-Klassifikator nimmt hauptsächlich die Fehlklassifizierungen in der Demarkationszone vor. Beachten Sie, dass eine Erhöhung der Integrationszeit auf 2 Sekunden oder mehr das Auftreten von Fehlklassifizierungen verringern würde, aber zur Folge hätte, dass die vollständige Messzeit einer Raman-Karte mit 2601 Raman-Spektren mehr als 14 Stunden dauern würde.

Abbildung 3c zeigt eine zufällige Mischung aus E. coli ATCC 25922- und E. coli ATCC 35218-Kulturen. Die beiden Monokulturproben werden direkt auf den CaF\(_2\)-Objektträger übertragen, dort gemischt und anschließend gemessen. Aus dem visuellen Bild und der Raman-Karte können keine Informationen über die Mischung aus E. coli ATCC 35218 und E. coli ATCC 25922 gewonnen werden. Die einzige daraus abgeleitete Information besteht darin, dass die Schicht auf der linken Seite etwas dicker ist, was aus der 10-Pixel-Projektion des Konturdiagramms auf die x- und y-Achse ersichtlich ist. Auf der ST-Vorhersagekarte erkennen wir jedoch deutlich die Mischung der beiden E. coli-Bakterien. Wir stellen fest, dass das ST-Modell, bei dem NoiseMix in der Modelltrainingsphase angewendet wurde, keine Fehlklassifizierungen vornahm und nur die korrekten Arten, nämlich E. coli, mit einem geschätzten Dichteverhältnis von 48,8 % für E. coli ATCC 25922 und 51,2 % vorhersagte. von E. coli ATCC 35218. Der Grund für dieses beeindruckende Klassifizierungsergebnis, bei dem nur E. coli vorhergesagt wird, liegt in der dicken Schicht der Bakterienverteilung von 4–6 \(\upmu \)m. Somit ist das Raman-Signal-SNR immer relativ hoch. Darüber hinaus finden wir eine Gesamtgenauigkeit von 98,1 % für E. coli ATCC 25922 und E. coli ATCC 35218, wobei die letzten 1,9 % unbestimmte Datenpunkte mit einer gleichen Vorhersagerate von 0,5 sind, was im Raman etwa 49 Punkte ergibt Karte.

Raman-Messungen und Differenzierung antibiotikaresistenter Phänotypen. Die Abbildung zeigt die visuellen Bilder und die ST-Vorhersagekarten für (a) Methicillin-resistente S. epidermidis ATCC 35984 (MRSE), (b) Methicillin-sensitive S. epidermidis ATCC 14990 (MSSE), (c) Methicillin-resistente S. aureus MRSA ATCC252 und d) Methicillin-empfindlicher S. aureus MSSA ATCC 2752. Die Bakterienverteilung reicht von einem einzelnen Bakterium bis hin zu dicken Bakterienschichten (4–6 µm Dicke). Aus den visuellen Bildern sehen wir, dass a) MRSE und b) MSSE für ein einzelnes (wenige) Bakterium erfasst werden. Die verwendete Integrationszeit betrug 10 Sekunden für die Aufnahme jedes Raman-Spektrums und betrug durchschnittlich 10 Mal. Für MRSE beträgt die Größe der Karten 5 \(\upmu \)m \(\times \) 5 \(\upmu \)m und besteht aus einzelnen 441 Raman-Spektren (700–1600 cm\(^{-1}\ )) mit 0,25 \(\upmu \)m Abstand zwischen den Punkten. Für MSSE beträgt die Größe der Karten 10 \(\upmu \)m \(\times \) 10 \(\upmu \)m mit 1 \(\upmu \)m Abstand zwischen den Punkten und bestehen aus 441 einzelnen Raman-Spektren . Die verwendete Integrationszeit betrug 2 Sekunden für die Aufnahme jedes Raman-Spektrums und betrug durchschnittlich 10 Mal. In beiden Fällen nimmt der ST keine Fehlklassifizierungen vor, es besteht jedoch eine geringe Sicherheit dafür, dass es sich bei den Bakterien um MSSE und MRSE handelt, wie in den MSSE- und MRSE-Vorhersagekarten in (a) bzw. (b) zu sehen ist. In (c) und (d) werden die visuellen und Vorhersagekarten für MRSA und MSSA gezeigt. Die 50 \(\upmu \)m \(\times \) 50 \(\upmu \)m und bestehen aus 2601 Raman-Spektren (700–1600 cm\(^{-1}\)) mit 1 \(\upmu \)m Abstand zwischen den Punkten. Die verwendete Integrationszeit beträgt 0,5 Sekunden und beträgt durchschnittlich 10 Mal für die Aufnahme jedes Spektrums.

Abbildung 4 zeigt Messungen und Tests zur Differenzierung antibiotikaresistenter Bakterien. Für diesen Proof-of-Concept-AST sammeln wir Raman-Karten von klinischen Isolaten von MR S. epidermidis ATCC 35984 (MRSE), MR S. aureus ATCC 252 (MRSA 252), MR S. aureus ATTCC 4951 (MRSA4951) und von MS S . epidermidis ATCC 14990 (MSSE), MS \(\textit{S. aureus}\) ATTCC 4699 (MSSA 4699) und MS \(\textit{S. aureus}\) ATCC 2752 (MSSA 2752). Die Gesamtmodellleistung des 15-Klassen-Klassifikators bei der MR-MS-Klassifizierungsaufgabe ist in der Verwirrungsmatrix in Abb. 2 zu sehen. Der ST-Klassifikator enthält auch S. lugdunensis, S. haemolyticus und S. pettenkoferi, für die diese Stämme ausgewählt wurden stellen biologische Variationen und potenzielle Querinterferenzen dar, um die Klassifizierungsaufgabe für die ST zu erschweren und eine realistische Sicht auf die Möglichkeiten unserer Technik zu schaffen. Insbesondere stellen wir fest, dass der ST zwischen MRSE- und MSSE-Isolaten von S. epidermidis mit einer Vorhersagegenauigkeit von über 99,5\(\%\) unterscheidet. Beispiele für Vorhersagekarten für MRSE, MSSE, MRSA 252 und MSSA 2752 sowie Referenzbakterien sind in Abb. 4 zu sehen. In Abb. 4c, d ist die Messung von MRSA und MSSA für zwei Monokulturen von MRSA 252 und MSSA 2752 dargestellt Referenzbakterien. Abbildung 4c zeigt, dass der ST die Vorhersageraten (Dichte-Oberflächenabdeckung) auf 40,5\(\%\) für CaF\(_2\)-Hintergrund, 56\(\%\) für MRSA 252 und 0,4\(\%\ schätzt. ) für MSSA 2752 und 3,1\(\%\) für E. coli ATCC 25922. Auch hier zeigt sich, dass in der Demarkationszone zwischen CaF\(_2\) und den MRSA-Bakterien die Fehlklassifizierungsraten aufgrund der Abnahme höher sind SNR. Bei dieser Messung führt der ST tatsächlich 69 Fehlklassifizierungen durch, was aus Abb. 4c ersichtlich ist, wo eine Vorhersagerate zwischen 0,5 und bis zu 0,99 für E. coli ATCC 25922 gefunden wird. Dies könnte jedoch auch mit einer Kontamination der Testprobe zusammenhängen. In Abb. 4b sind Messungen von MSSA 2752 dargestellt. Wir stellen fest, dass die Vorhersageraten (Oberflächenbedeckung) 41,6\(\%\) für den CaF\(_2\)-Hintergrund, 55,4\(\%\) für MSSA 2752 und 3\(\%\) für MSSA 4699 betragen ST weist einige Fehlklassifizierungen auf, bei denen der ST die Bakterien als MSSA 4699 vorhersagt, wie in Abb. 4b zu sehen ist. Auch diese sind hauptsächlich in der Demarkationszone zu finden und hängen daher mit dem hier gefundenen niedrigen SNR zusammen. Durch eine Erhöhung der Integrationszeit auf 2 Sekunden oder mehr hätten diese Fehlklassifizierungen umgangen werden können. Da die Karte jedoch aus 2601 Einzelspektren besteht, würde die Aufnahmezeit mehr als 14 Stunden dauern. Aus der Verwirrungsmatrix stellen wir fest, dass die Gesamtleistung des 15-Klassen-ST-Klassifikators eine Vorhersagegenauigkeit von 94,6\(\%\) für die Untermatrix der beiden MRSA- und zwei MSSA-Isolate aufweist. Wenn wir unsere Ergebnisse mit einem in Ref. 25 verwendeten binären Klassifikator vergleichen, der zwischen MRSA und MSSA mit einer Genauigkeit von 89,1\(\%\) unterscheidet, stellen wir fest, dass unser ST-Modell das CNN-Modell deutlich übertrifft. Beachten Sie, dass die ST eine sehr hohe Genauigkeit aufweist, wenn Messungen nur an dicken Schichten von Bakterienmonokulturen durchgeführt werden. Nicht visuell dargestellt, aber wir finden als Beispiel für MSSA 2752 und MRSA 4951 Genauigkeiten von 99,7 % bzw. 99,9 %. Was nicht überraschend sein dürfte, da die Trainingsvalidierungsdatensätze sehr ähnlich sind.

Neben der Unterscheidung zwischen antibiotikaresistenten und antibiotikaempfindlichen Isolaten testen wir unsere entwickelte ST- und NoiseMix-Methode auch an einzelnen Bakterien (wenige Bakterien), wie in Abb. 4a,b zu sehen ist. Die Karten werden mit einer Integrationszeit von 10 Sekunden erfasst. Ohne NoiseMix konnten wir jedoch feststellen, dass das ST-Modell keine Bakterien identifizieren konnte, was zeigt, wie NoiseMix die Empfindlichkeit der ML-Modelle verbessert. Die Vorhersageraten (Dichteoberflächenabdeckung) für Abb. 4a betragen 96,8\(\%\) CaF\(_2\) Hintergrund, 2,9\(\%\) MRSE und 0,3\(\%\) MSSE. Der höchste Vorhersagepeak für MSSE beträgt nur 0,15. Daher nimmt der ST keine Fehlklassifizierung zwischen MRSE und MSSE oder einer anderen Bakterienklasse vor. Für Abb. 4b stellen wir fest, dass die Vorhersageraten 93\(\%\) CaF\(_2\) Hintergrund, 0,2\(\%\) E. coli ATCC 35218, 1,3\(\%\) MRSE und 5,5 betragen \(\%\) von MSSE. Auch hier führt der ST zu keiner Fehlklassifizierung zwischen MRSE und MSSE, da der höchste für MSSE gefundene Vorhersagepeak bei 0,45 liegt. Bemerkenswert ist für uns, dass unser ST zusammen mit NoiseMix auch eine hochgenaue Identifizierung einzelner Bakterien ermöglicht, obwohl die ursprünglichen Trainingsbeispiele ausschließlich aus mehrschichtigen Bakterienmatten stammen.

Raman-Messungen und ST-Klassifikationen von drei kultivierten E. coli-Patientenproben. Die Abbildung zeigt die visuellen Bilder der Messbereiche, aus denen ersichtlich ist, dass die Bakterienverteilung wiederum von einer tiefen Schicht (4–6 \(\upmu \)m dick) bis zur Tiefe einzelner Bakterien reicht, und die ST-Vorhersagekarten für E . coli ATCC 25922 und E. coli ATCC 35218. Die Größe der Karten beträgt 50 \(\upmu \)m \(\times \) 50 \(\upmu \)m und sie bestehen jeweils aus 2601 Raman-Spektren (700– 1600 cm\(^{-1}\)) mit 1 \(\upmu \)m Abstand zwischen den Punkten. Die zur Erfassung der Spektren verwendete Integrationszeit beträgt 0,5 Sekunden und beträgt durchschnittlich 10 Mal pro Punkt/Spektrum. Die Tabelle zeigt die Gesamtvorhersageraten für den CaF\(_2\)-Hintergrund, E. coli ATCC 25922, E. coli ATCC 35218 und die übrigen Klassen. Konkret sehen wir, dass (a) Patientenprobe 1 eine Gesamtvorhersagerate für die anderen Bakterien von 6,9 %, (b) Patientenprobe 2 von 4,7 % und c) Patientenprobe 3 von 8,1 % aufweist. Die Genauigkeiten (Vorhersagerate > 0,5) besagen jedoch für P1: 98,5 %, P2: 99,4 % und P3: 98 %, dass es sich bei der Probe um E. coli handelt.

In Abb. 3 untersuchten wir die Leistung von ST und NoiseMix bei E. coli-Referenzbakterien aus denselben klinischen Monokultur-Isolaten. Um jedoch zu zeigen, dass unser ST möglicherweise auch für klinische Patientenisolate funktioniert, haben wir Tests an drei neuen klinischen E. coli-Patientenisolaten durchgeführt, die von der Abteilung für klinische Mikrobiologie des Universitätsklinikums Odense bezogen wurden. Die E. coli-Isolate P1, P2 und P3 (dargestellt in Abb. 5) werden aus Urin isoliert und waren Spezies, die durch Indol-Spot-Test (positiv) und durch Ausplattieren auf CHROMID®CPS ELITE-Agarplatten (Biomérieux, USA) identifiziert wurden. Beachten Sie, dass der ST diese Raman-Spektren noch nie zuvor gesehen hat. Daher haben die Patientenproben einen leicht anderen Phänotyp als die E. coli-Referenzbakterien, die für das Training des ST verwendet wurden, oder könnten einen solchen haben. Wir würden daher erwarten, dass der ST Vorhersagen für eine Mischung der beiden E. coli-Referenzbakterien liefert. Die visuellen Bilder und Vorhersagekarten für die 3 E. coli-Patientenisolate sind in Abb. 5 dargestellt. Aus den ST-Vorhersagekarten können wir die Überlappung (Vorhersageraten) mit E. coli ATCC 25922 und E. coli ATCC 35218 abschätzen. Wir finden dass die durchschnittliche Fehlklassifizierung für die 3 Patientenproben 1,4 % beträgt und teilweise auf die Tatsache zurückzuführen ist, dass der ST zuvor keine Trainingsdaten für die 3 Patientenproben gesehen hat. Wir sehen erneut, dass die Fehlklassifizierung hauptsächlich in der Demarkationszone zwischen dem CaF\(_2\)-Hintergrund und der Bakterienmatte auftritt und daher auch mit dem niedrigen Raman-SNR zusammenhängt. Mithilfe des Scheibendiffusionstests wurden auch Antibiotikaresistenzprofile für die drei klinischen Isolate und für die beiden E. coli ATCC-Stämme erstellt. Aus diesen Daten (siehe ergänzende Materialien) könnte man schließen, dass P1 in Bezug auf das Antibiotikaresistenzprofil tatsächlich die größte Ähnlichkeit mit E. coli ATCC 25922 aufweist, während P2 und P3 ein ähnliches Resistenzmuster wie E. coli ATCC 35218 aufweisen. So wie es ist Wie aus Abb. 5 hervorgeht, bevorzugt die ST-Klassifizierung auch die Klassifizierung des P1-Isolats als E. coli ATCC 25922, während P2 und P3 häufiger als E. coli ATCC 35218 klassifiziert werden, was auf eine Tendenz des Resistenzprofils der Isolate hindeutet Führen Sie die Raman-Messungen durch. Um dies zu überprüfen und eine Schlussfolgerung zu ziehen, müssen jedoch weitere Proben und Messungen durchgeführt werden. Wir können jedoch den Schluss ziehen, dass unser ST tatsächlich innerhalb weniger Sekunden/Minuten mikrobielle Phänotypen von E. coli mit einer durchschnittlichen Klassifizierungsgenauigkeit von 98,6 % für die drei Patientenproben unterscheiden kann.

Zur schnellen Identifizierung von Bakterien und zur Bekämpfung der Ausbreitung von AMR haben wir ein Proof-of-Concept-Experiment mit RS und ML-Unterstützung durchgeführt. Wir haben gezeigt, dass RS eine vielversprechende Technologie für mikrobiologische Studien ist. Zu diesem Zweck haben wir ein aufmerksamkeitsbasiertes ML-Modell und einen neuartigen Datenerweiterungsalgorithmus (NoiseMix) entwickelt, um modernste Ergebnisse bei der Bakterienidentifizierung zu erhalten. Die in dieser Arbeit verwendete ST-Modellarchitektur ist vom Erfolg des visuellen Transformators (VIT)40 und des kompakten Faltungstransformators (CCT) inspiriert, da sie beim Training mit kleinen Datensätzen gut verallgemeinern können41. Im Gegensatz zu VITs und CCTs haben wir festgestellt, dass bei der Verarbeitung von RS-Daten sowohl die Aufteilung der Raman-Spektren in Patches als auch die Implementierung von Faltungen zur Erzeugung einer induktiven Vorspannung der Modellleistung abträglich ist. Darüber hinaus haben wir herausgefunden, dass die Begrenzung der Modelltiefe die Wirksamkeit des Modells erheblich steigert, zumindest bei Problemen mit begrenzter Datenverfügbarkeit. Wir vermuten, dass dies auf die Überanpassungsfähigkeit von Deep-Transformer-Modellen zurückzuführen ist, die zu einem begrenzenden Faktor wird, wenn die Varianz innerhalb der Stichprobe hoch ist, wie wir es bei unseren Datensätzen beobachten. Dies gilt auch für praktische Implementierungen von RS für In-situ-Messungen in Kliniken und Krankenhäusern. Wir sind fest davon überzeugt, dass unsere Methode der neuartigen Datenerweiterung und RS, unterstützt durch unser entwickeltes ST, die Lücke zwischen Grundlagenforschung und praktischer Anwendung in klinischen Labors schließen kann42. Wir haben ausdrücklich gezeigt, dass unser ST ein hochmodernes domänenspezifisches Rest-CNN sowohl hinsichtlich der Genauigkeit als auch der Rechenzeit übertrifft25. Durch die erhebliche Reduzierung der Rechenzeit werden sowohl die Diagnosezeit als auch die Kosten des Diagnosegeräts erheblich reduziert, da die Inferenzzeit des ST selbst auf kostengünstiger Hardware schnell ist. Die in dieser Arbeit verwendeten ST-Modelle könnten auch auf andere spektroskopisch basierte Klassifizierungsprobleme wie die Krebserkennung oder die Mineralidentifizierung angewendet werden. Unser vom ST-Modell unterstütztes Raman-System unterscheidet zwischen 15 verschiedenen Klassen mit einer Gesamtklassifizierungsgenauigkeit von mehr als 96\(\%\), während das CNN eine etwas geringere Gesamtklassifizierungsgenauigkeit von 88,6 % aufweist. Da dies ein Proof-of-Concept war, enthält unser Datensatz nur 15 Klassen, die Datenbank kann jedoch problemlos erweitert werden, um eine beliebige Anzahl von Bakterien und Nicht-Bakterien aufzunehmen.

Vergleicht man unsere Methode mit Methoden, die derzeit in Krankenhäusern verwendet werden, nämlich arbeits- und zeitintensive Tests in Labors, stellt RS assisted by ML eine Verbesserung in Bezug auf Geschwindigkeit, Abdeckung, Preis und Handhabung dar. Andere Technologien wie Durchflusszytrometrie, Polymerasekettenreaktion und MALDI-TOF-Massenspektrometrie werden ebenfalls intensiv auf ihr Potenzial als schnelle und zuverlässige Diagnosetechnologien untersucht12,16,17,18. Der Nachteil dieser Technologien besteht darin, dass sie große, teure Geräte erfordern, speziell geschultes Personal erfordern und nicht vor Ort als Diagnose-/Screening-Tool am Behandlungsort eingesetzt werden können. Wichtig ist, dass Massenspektrometer eine Kultivierung erfordern und Schwierigkeiten haben, eng verwandte Bakterienarten zu unterscheiden und einige Antibiotikaresistenz-Phänotypen wie MRSA und MSSA19 zu unterscheiden. Im Gegensatz dazu zeigen wir, dass unser RS, unterstützt durch den ST- und NoiseMix-Ansatz, eine genaue Klassifizierung verschiedener Bakterienphänotypen ermöglicht, nämlich E. coli, S. Epidermidis und S. Aureus. Wichtig ist, dass unser Ergebnis mit einfach zu erstellenden Raman-Trainingsdaten erzielt wird, die aus tiefen Monokulturmatten von Bakterien gesammelt wurden. Mit diesem einfachen Vorbereitungsansatz zur Erfassung von Trainingsdaten erreichen wir durchweg Diagnosezeiten von weniger als wenigen Minuten, wenn man von der Kultivierung absieht. Die Bedeutung unserer Datenerfassungsmethode ist von größter Bedeutung, da unser Ansatz die einfache, schnelle und kostengünstige Entwicklung großer Datensätze ermöglicht, was für die klinische Anwendung von entscheidender Bedeutung ist. Folglich ist es möglich, einfach Trainingsdaten aus kultivierten Bakterien zu erstellen und dann Hintergrund- und Schadstoffrauschen mit NoiseMix in die schnell und einfach zu erstellenden Trainingsdaten einzubetten. Dies würde sowohl eine schnelle Datenproduktion als auch eine schnelle Probenvorbereitung ermöglichen und wäre keinerlei Filterung oder Kultivierung der Bakterien erforderlich. Es ist daher vernünftig anzunehmen, dass unser Ansatz problemlos und ohne Vorkenntnisse für die direkte Diagnose einer Sepsis anhand echter Patientenproben übernommen werden kann. Unter dieser Voraussetzung kann eine genaue Diagnose und damit eine Behandlung mit einem gezielten antimikrobiellen Mittel innerhalb weniger Minuten erreicht werden.

Die Bakterien stammen aus Bakterienisolaten, die über Nacht auf Agarplatten kultiviert und mit Parafilm versiegelt und bis zur Probenvorbereitung bei 5 °C gelagert wurden. Die Lagerungsdauer variierte, es wurde jedoch nicht festgestellt, dass sie zu spektralen Veränderungen der Stamm- oder Phänotypeigenschaften führte. Alle anderen Probenvorbereitungsbedingungen wurden zwischen den Proben konsistent gehalten. Die Testproben wurden getrennt von den für das Training verwendeten Proben vorbereitet, um sicherzustellen, dass die Klassifizierung nicht durch Unterschiede in der Probenvorbereitung beeinflusst wurde. Um Proben für die Raman-Messung vorzubereiten, wurde eine Probe einfach von einer einzelnen Kolonie direkt auf einen sterilisierten CaF\(_2\)-Objektträger mit Raman-Qualität übertragen.

Bacteria-surface + NoiseMix und Bacteria-surface: Der Bacteria-surface-Trainingsdatensatz besteht aus drei Integrationszeiten für jede Klasse. Der Datensatz besteht aus 12 Bakterienklassen (E. coli ATCC 35218, E. coli ATCC 25922, Methicillin-resistenter S. epidermidis ATCC 35984 (MRSE), Methicillin-sensitiver S. epidermidis ATCC 14990 (MSSE), Micrococcus luteus, S. lugdunensis, S. haemolyticus, S. pettenkoferi, Methicillin-resistenter S. aureus ATCC 252, Methicillin-resistenter S. aureus ATTCC4951, Methicillin-empfindlicher S. aureus ATTCC4699, Methicillin-empfindlicher S. aureus ATCC 2752 und 3 Nicht-Bakterien-Klassen , Calciumfluorid, (CaF\(_2\)), Agar und Polystyrolkügelchen. Die Daten der Bakterienklassen im Bakterienoberflächen-Trainingsdatensatz wurden durch Messung über CaF\(_2\)-Objektträgern erfasst, die vollständig von abgedeckt waren mehrschichtige Bakterienmatten. Die Daten der CaF\(_2\)-Hintergrundklasse im Trainingsdatensatz für Bakterienoberflächen wurden durch Messung sauberer CaF\(_2\)-Objektträger erfasst. Die Daten der Agarklasse im Trainingsdatensatz für Bakterienoberflächen , wurde durch Messung über CaF\(_2\)-Objektträgern erfasst, die mit einer tiefen Agarschicht bedeckt waren. Die Daten der Polystyrolklasse im Bakterienoberflächen-Trainingsdatensatz wurden durch Messung über CaF\(_2\)-Objektträgern erfasst, die waren komplett mit Styroporkügelchen bedeckt. Für Tests mit NoiseMix zB in Abb. 2,3,4, die CaF\(_2\)- und Agar-Bakterienoberflächen-Trainingsdaten, werden als Mischeingaben für den Algorithmus verwendet. Der in Abb. 2 verwendete Datensatz für Bakterienoberflächentests besteht aus 12 Bakterienklassen und 3 Nichtbakterienklassen. Jede Klasse im Testdatensatz „Bakterienoberfläche“ wird durch eine Messung auf einer teilweise bedeckten CaF\(_2\)-Oberfläche dargestellt. Die Bakterienklassen im Datensatz „Bakterienoberflächentest“ werden daher nicht durch die gleiche Anzahl von Bakterien-Raman-Spektren repräsentiert. Der Datensatz zur Validierung der Bakterienoberfläche wird auf die gleiche Weise erstellt wie der Datensatz zum Test der Bakterienoberfläche, enthält jedoch nicht alle 15 Klassen. Die in den Abb. 3,4,5 werden nach dem gleichen Verfahren erfasst, das auch zur Erstellung des Datensatzes zum Bakterienoberflächentest verwendet wurde. Die Vorverarbeitung der Daten des Bakterienoberflächen-Trainingsdatensatzes besteht aus der Normalisierung jedes Spektrums zwischen 0 und 1. Vorverarbeitung der in den Abbildungen gezeigten Daten. 3,4,5 der Test- und Validierungsdaten für Bakterienoberflächen bestehen aus zwei Schritten. (i) die Steigung der Spektren wird entfernt, indem die lineare Funktion zwischen den Start- und Endwerten der Spektren subtrahiert wird, und (ii) ein Normalisierungsschritt, in dem jedes Raman-Spektrum zwischen 0 und 1 normiert wird. Für die in Abb . 3,4,5 verwenden wir 100\(\%\) der Daten aus dem Bakterienoberflächen-Trainingsdatensatz für das Training und verwenden dann den zurückgehaltenen Bakterienoberflächen-Validierungsdatensatz für die Modellauswahl. Da der Validierungssatz mit dem gleichen Verfahren wie der eigentliche Testdatensatz erstellt wird, ist er ein besserer Indikator für die Wirksamkeit der Modellklassifizierung.

Bakterien-ID 1: Die Modelle werden anhand des Referenzdatensatzes von Stanford25 trainiert, der aus 30 Bakterien- und Hefeisolaten mit 2000 Spektren für jedes der 30 Isolate besteht. Anschließend wurden die Modelle anhand des Referenz-Feinabstimmungsdatensatzes verfeinert, der aus 30 Bakterien- und Hefeisolaten mit 100 Spektren für jedes der 30 Isolate besteht25. Anschließend werden die Modelle anhand des Referenztestdatensatzes getestet, der aus 30 Bakterien- und Hefeisolaten mit 100 Spektren für jedes der 30 Isolate besteht25.

Bakterien-ID 2: Die Modelle wurden nur mit dem Referenz-Feinabstimmungsdatensatz trainiert und anschließend mit dem Referenztestdatensatz getestet25.

E. coli-Binärdatensätze: Die Modelle wurden an binären Datensätzen bestehend aus E. coli ATCC 35218 und E. coli ATCC 25922 trainiert und getestet. Die Daten der E. coli-Binärdatensätze wurden durch Messung über CaF\(_2\)-Objektträgern erfasst. die mit mehrschichtigen Bakterienmatten abgedeckt waren. Der binäre Trainingsdatensatz von E. coli enthält 5180 Spektren für jede Klasse, und jede Klasse besteht aus zwei unterschiedlichen Integrationszeiten, die jeweils 2590 Spektren enthalten. Der binäre E. coli-Testdatensatz enthält 2590 Spektren für jede Klasse und die Integrationszeiten unterscheiden sich von denen des Trainingssatzes. Die Vorverarbeitung für die E. coli-Binärdatensätze besteht aus zwei Schritten, die automatisch ohne Benutzereingriff durchgeführt werden: (i) einem Basislinienkorrekturschritt mit Zhangfit43 und (ii) einem Normalisierungsschritt, in dem jedes Raman-Spektrum zwischen 0 und 1 normalisiert wird .

Das Raman-Mikroskop zur Erfassung von Raman-Daten ist in Abb. 1b dargestellt. Das Raman-Mikroskop verwendet einen 785-nm-Anregungslaser (TA pro, Toptica, Deutschland) mit 60 mW Leistung. Der Pumpstrahl wird mit einer 1 Meter langen Singlemode (SM)-Faser (PANDA PM FC/PC zu FC/APC Patchkabel) mit 5,3 \(\upmu \)m Modenfelddurchmesser räumlich gereinigt. Ein Mikroskopobjektiv (MO) mit großem Arbeitsabstand (100x) (LMPLN-IR/LCPLN-IR, numerische Apertur NA = 0,85) von Olympus wird sowohl für die Bildgebung als auch für die Fokussierung des Anregungslasers und das Sammeln des rückgestreuten Lichts verwendet . Die Bakterienproben werden auf Objektträger aus Kalziumfluorid (CaF\(_2\)) mit Raman-Gradierung platziert und die Position wird mit einem automatisierten XYZ-Scantisch kontrolliert. Ein dichroitischer Spiegel (DM) (Hochpass 750 nm, Semrock) wird verwendet, um das sichtbare Beleuchtungslicht zur Bildgebung an ein ladungsgekoppeltes Gerät (CCD) zu koppeln. Ein zweiter DM (Hochpass 800 nm) wird verwendet, um das Raman-Signal von der Pumpe zu trennen. Zur Filterung der 785-nm-Pumpe werden zusätzliche Filter (Hochpass, 800 nm, Semrock) und (Bandpass, 785 nm ± 10 nm, Semrock) verwendet. Eine 5 m lange Multimode-Faser (MM) (ø200 m, 0,39 NA, FC/PC-zu-FC/PC-Patchkabel) sammelt das Raman-Signal und leitet es an das Spektrometer. Zur Aufnahme von Raman-Spektren verwenden wir ein Horiba-Spektrometer HR320. Alle Messungen wurden mit einer Spaltgröße von 300 \(\upmu \)m durchgeführt und das verwendete Gitter hat eine Liniendichte von 950 L/mm. Zur Detektion wird ein thermoelektrisch gekühltes ladungsgekoppeltes Bauelement (CCD) verwendet (Synapse, 1024 256 mit einer Pixelgröße von jeweils 26 \(\upmu \)m). Die CCD-Pixel werden in Cluster von 2x20 Pixeln zusammengefasst, um das Rauschen zu reduzieren und dadurch das SNR zu erhöhen. Da jedes erfasste Raman-Spektrum aus 480 Punkten im Bereich von 700–1600 cm\(^{-1}\) besteht, beträgt die spektrale Auflösung des Spektrometers etwa 10 cm\(^{-1}\).

Um die Position zu steuern und den Abtastpunkt für RS zu ändern, verwenden wir einen XYZ-Scantisch von Applied Scientific Instrumentation (ASI). Die ASI-Schrittmotoren ermöglichen eine präzise Steuerung durch den Einsatz von DC-Servomotoren mit geschlossenem Regelkreis und hochauflösenden Encodern für Positionierung und Rückmeldung. Der XY-Tisch hat einen Verfahrbereich von 100 mm \(\times \) 100 mm und eine Positionsgenauigkeit von etwa 200 nm. Für die Automatisierung des gesamten Raman-Mikroskops wurde eine maßgeschneiderte Python-Software entwickelt, um den Scantisch und das Horiba-Spektrometer zur Erfassung hyperspektraler Raman-Karten der Bakterienproben asynchron zu steuern.

Zur spektralen Kalibrierung (und Optimierung) des Raman-Mikroskops und zur Kalibrierung des Translationstisches verwenden wir Polystyrolkügelchen mit einer Größe von 1–5 \(\upmu \)m. Die Polystyrolkügelchen sind in ihrer Größe mit Bakterien vergleichbar und bilden mehrere Raman-Peaks im gleichen Raman-Verschiebungsbereich wie die Bakterien. Aus den Messungen und ST-Vorhersagekarten schätzen wir, dass die räumliche Auflösung der Raman-Karten \(\ approx \) 2 \(\upmu \)m \(\pm 500\) nm) und für die ST-Vorhersagekarte \( \ approx \) 3 \(\upmu \)m \(\pm 500\) nm).

Die rohen Raman-Spektren wurden zunächst von kosmetischen Spitzen befreit. Anschließend wird die lineare Funktion zwischen den Start- und Endwerten jedes Spektrums identifiziert und subtrahiert. Als letzten Vorverarbeitungsschritt wurden die Spektren einzeln auf den Bereich zwischen Null und Eins normiert. Insbesondere haben wir auch Basislinienkorrekturmethoden mit Zhangfit [36] untersucht. Wir haben jedoch festgestellt, dass jede Art der nichtlinearen Basislinienentfernung die Modellleistung beeinträchtigt, insbesondere wenn sie in Verbindung mit NoiseMix verwendet wird.

Um die Modellleistung in der Testphase zu verbessern, wenden wir in der Modelltrainingsphase eine Datenerweiterung an. Der Algorithmus NoiseMix funktioniert durch zufällige Auswahl und anschließende Mischung von Bakterienspektren \(S_{bacteria}(\nu )\) und Hintergrundspektren \(S_{bg}(\nu )\). Ein erweitertes Raman-Spektrum \(S_{bacteria}^{(aug)}(\nu )\) ist dann gegeben durch

wobei \(\alpha \) zufällig aus einer gleichmäßigen Verteilung im Bereich \([0, \alpha _{max}]\) ausgewählt wird und \(\alpha _{max} <1\) eine Obergrenze für ist der Beitrag von Hintergrundspektren.

Das hier entwickelte ST ML-Modell ist eine kompakte Version des Standard-Transformator-Encoders39, unterscheidet sich jedoch dadurch, dass es Sequenz-Pooling verwendet, um die sequentiellen Ausgaben einer einzelnen Klasse zuzuordnen. Die Struktur des ST-Modells ist in Abb. 1c zu sehen. Es besteht aus einer optionalen Positionseinbettungsschicht (ST-pe), gefolgt von einer Dropout-Schicht. Die nächste Schicht ist ein Block, der nacheinander Schichtnorm, Mehrkopfaufmerksamkeit (MHA), Schichtnorm und dann ein Mehrschichtperzeptron (MLP) mit einer GELU-Nichtlinearität enthält. Darauf folgt die Schichtnorm und dann eine Sequenz-Pooling-Schicht. Schließlich ist die Ausgabeschicht eine vollständig verbundene lineare Schicht. Unsere ST-Architektur wird durch drei Argumente ST(i,j,k) parametrisiert, wobei i die Tiefe des Transformator-Encoders, j die Anzahl der Köpfe in der MHA-Schicht und k das Mehrschicht-Perzeptronverhältnis ist. Daher hat in der ST(1,2,7)-Version der Transformator-Encoder eine Tiefe von 1, die MHA-Schicht hat 2 Köpfe und die verborgene Schichtdimension des MLP ist siebenmal größer als die MLP-Eingabedimension. Diese Hyperparameter sowie alle für das Training verwendeten Hyperparameter wurden mithilfe eines baumstrukturierten Parzen-Schätzers ausgewählt, wobei eine Trainings- und Validierungsaufteilung für die Isolatklassifizierungsaufgabe verwendet wurde25.

Da wir Hintergrundklassen, die keine Bakterien sind, in unser Modell einbezogen haben, haben wir uns für die Verwendung von zwei Leistungsmetriken entschieden: Genauigkeit und Dichte. Genauigkeit wird im üblichen Sinne als das Verhältnis der korrekten Bakterienklassifizierungen zur Gesamtzahl der Bakterienklassifizierungen definiert. Die Dichte hingegen ist ein Maß für die Bakterienbedeckung und wird als Anzahl der Bakterienklassifizierungen im Verhältnis zur Gesamtzahl der Klassifizierungen angegeben.

Die Daten, die die Ergebnisse dieser Studie stützen, sind auf begründete Anfrage beim entsprechenden Autor erhältlich.

Weltgesundheitsorganisation. Globaler Aktionsplan zur Antibiotikaresistenz (2015).

on Antimicrobial Resistance, ICG-Bericht an den Generalsekretär der Vereinten Nationen (2019).

Stekel, D. Der erste Bericht über antimikrobielle Resistenzen stammt aus der Zeit vor Penicillin. Natur 562, 1 (2018).

Artikel Google Scholar

O'Neill, J. Bekämpfung arzneimittelresistenter Infektionen weltweit: Abschlussbericht und Empfehlungen (2016).

Murray, CJ et al. Globale Belastung durch bakterielle antimikrobielle Resistenzen im Jahr 2019: Eine systematische Analyse. Die Lanzette (2022).

Bankgruppe, W. Arzneimittelresistente Infektionen: Eine Bedrohung für unsere wirtschaftliche Zukunft (2017).

Tenover, FC Mechanismen antimikrobieller Resistenz bei Bakterien. Bin. J. Med. 119, S3–S10 (2006).

Artikel CAS Google Scholar

Holmes, AH et al. Verständnis der Mechanismen und Treiber antimikrobieller Resistenzen. The Lancet 387, 176–187 (2016).

Artikel CAS Google Scholar

Dadgostar, P. Antibiotikaresistenz: Auswirkungen und Kosten. Infizieren. Drogenresistent. 12, 3903 (2019).

Artikel CAS Google Scholar

Nathan, C. Widerstand gegen antimikrobielle Resistenzen. Nat. Rev. Microbiol. 18, 259–260 (2020).

Artikel CAS Google Scholar

Aslam, B. et al. Antibiotikaresistenz: Ein Überblick über eine globale Krise. Infizieren. Drogenresistent. 11, 1645 (2018).

Artikel CAS Google Scholar

Khan, ZA, Siddiqui, MF & Park, S. Aktuelle und neue Methoden zur Antibiotika-Empfindlichkeitsprüfung. Diagnostik 9, 49 (2019).

Artikel CAS Google Scholar

Reverter, M. et al. Aquakultur im Spannungsfeld von globaler Erwärmung und antimikrobieller Resistenz. Nat. Komm. 11, 1870 (2020).

Artikel ADS CAS Google Scholar

Amann, S., Neef, K. & Kohl, S. Antimikrobielle Resistenz (amr). EUR. J. Hosp. Pharm.: Sci. Üben. 26, 175–177 (2019).

Artikel Google Scholar

Abushaheen, MA et al. Antibiotikaresistenz, Mechanismen und ihre klinische Bedeutung. Dis. Mo. 66, 100971 (2020).

Artikel Google Scholar

Barghouthi, SA Eine universelle Methode zur Identifizierung von Bakterien basierend auf allgemeinen PCR-Primern. Indian J. Microbiol. 51, 430–444 (2011).

Artikel CAS Google Scholar

Florio, W., Tavanti, A., Barnini, S., Ghelardi, E. & Lupetti, A. Jüngste Fortschritte und anhaltende Herausforderungen bei der Diagnose mikrobieller Infektionen mittels Maldi-Tof-Massenspektrometrie. Vorderseite. Mikrobiol. 9, 1097 (2018).

Artikel Google Scholar

Hou, T.-Y., Chiang-Ni, C. & Teng, S.-H. Aktueller Stand der Maldi-Tof-Massenspektrometrie in der klinischen Mikrobiologie. J. Food Drug Anal. 27, 404–414 (2019).

Artikel CAS Google Scholar

Wang, L. et al. Anwendungen der Raman-Spektroskopie bei bakteriellen Infektionen: Prinzipien, Vorteile und Mängel. Vorderseite. Mikrobiol. 12, 1 (2021).

Google Scholar

Jones, RR, Hooper, DC, Zhang, L., Wolverson, D. & Valev, VK Raman-Techniken: Grundlagen und Grenzen. Nanoskalige Res. Lette. 14, 1–34 (2019).

Artikel Google Scholar

Ralbovsky, NM & Lednev, IK Auf dem Weg zur Entwicklung einer neuartigen universellen medizinischen Diagnosemethode: Raman-Spektroskopie und maschinelles Lernen. Chem. Soc. Rev. 49, 7428–7453 (2020).

Artikel CAS Google Scholar

Guo, S., Popp, J. & Bocklitz, T. Chemometrische Analyse in der Raman-Spektroskopie vom experimentellen Design bis zur auf maschinellem Lernen basierenden Modellierung. Nat. Protokoll. 16, 5426–5459 (2021).

Artikel CAS Google Scholar

Lorenz, B., Wichmann, C., Stöckel, S., Rösch, P. & Popp, J. Cultivation-free raman spectroscopic investigations of bacteria. Trends Microbiol. 25, 413–424 (2017).

Artikel CAS Google Scholar

Novelli-Rousseau, A. et al. Kulturfreie Antibiotika-Empfindlichkeitsbestimmung aus Einzelbakterien-Raman-Spektren. Wissenschaft. Rep. 8, 1–12 (2018).

Artikel CAS Google Scholar

Ho, C., Jean, N. & Hogan, C. Schnelle Identifizierung pathogener Bakterien mithilfe von Raman-Spektroskopie und Deep Learning. Nat. Komm. 10, 4927 (2019).

Artikel ADS Google Scholar

Ashton, L., Lau, K., Winder, CL & Goodacre, R. Raman-Spektroskopie: Die Zukunft der mikrobiellen Identifizierung beleuchten. Fut. Mikrobiol. 6, 991–997 (2011).

Artikel CAS Google Scholar

Eberhardt, K., Stiebing, C., Matthäus, C., Schmitt, M. & Popp, J. Vorteile und Grenzen der Raman-Spektroskopie für die molekulare Diagnostik: Ein Update. Experte Rev. Mol. Diag. 15, 773–787 (2015).

Artikel CAS Google Scholar

Chang, K.-W. et al. Antibiotika-Empfindlichkeitstest mit oberflächenverstärkter Raman-Streuung in einem Mikrofluidiksystem. Anal. Chem. 91, 10988–10995 (2019).

Artikel CAS Google Scholar

Strola, SA et al. Identifizierung einzelner Bakterien mittels Raman-Spektroskopie. J. Biomed. Opt. 19, 111610 (2014).

Artikel ADS Google Scholar

de Siqueira e Oliveira, FS, da Silva, AM, Pacheco, MTT, Giana, HE & Silveira, L. Biochemische Charakterisierung pathogener Bakterienarten mittels Raman-Spektroskopie und Diskriminierungsmodell basierend auf ausgewählten Spektralmerkmalen. Las. Med. Sci.36, 289–302 (2021).

Duraipandian, S., Petersen, J. & Lassen, M. Authentizitäts- und Konzentrationsanalyse von nativem Olivenöl extra mittels spontaner Raman-Spektroskopie und multivariater Datenanalyse. Appl. Wissenschaft. 9, 2433 (2019).

Artikel CAS Google Scholar

García-Timermans, C. et al. Die markierungsfreie Raman-Charakterisierung von Bakterien erfordert standardisierte Verfahren. J. Mikrobiol. Methoden 151, 69–75 (2018).

Artikel Google Scholar

Rousseau, AN et al. Schnelle Antibiotika-Empfindlichkeitsprüfung mittels Raman-Mikrospektrometrie an einzelnen Bakterien: Eine MRSA-Fallstudie. ACS Omega 6, 16273–16279 (2021).

Artikel CAS Google Scholar

Kloß, S., Rösch, P., Pfister, W., Kiehntopf, M. & Popp, J. Auf dem Weg zur kulturfreien Raman-spektroskopischen Identifizierung von Krankheitserregern in Aszitesflüssigkeit. Anal. Chem. 87, 937–943 (2015).

Artikel Google Scholar

Franco-Duarte, R. et al. Fortschritte bei chemischen und biologischen Methoden zur Identifizierung von Mikroorganismen – von der Vergangenheit bis zur Gegenwart. Mikroorganismen (2019).

Pahlow, S. et al. Isolierung und Identifizierung von Bakterien mittels Raman-Spektroskopie. Adv. Drogenlieferung Rev. 89, 105–120 (2015).

Artikel CAS Google Scholar

Lussier, F., Thibault, V., Charron, B., Wallace, GQ & Masson, J.-F. Methoden des Deep Learning und der künstlichen Intelligenz für Raman und oberflächenverstärkte Raman-Streuung. TrAC, Trends Anal. Chem. 124, 115796 (2020).

Artikel CAS Google Scholar

Lu, W., Chen, X., Wang, L., Li, H. & Fu, YV Kombination eines Ansatzes künstlicher Intelligenz und Laserpinzetten-Raman-Spektroskopie zur mikrobiellen Identifizierung. Anal. Chem. 92, 6288–6296 (2020).

Artikel CAS Google Scholar

Parmar, N. et al. Bildtransformator 4055–4064 (2018).

Shao, R., Shi, Z., Yi, J., Chen, P.-Y. & Hsieh, C.-J. Zur gegnerischen Robustheit visueller Transformatoren. arXiv-E-Prints arXiv–2103 (2021).

Hassani, A. et al. Mit kompakten Transformatoren dem Big-Data-Paradigma entfliehen. arXiv-Vorabdruck arXiv:2104.05704 (2021). https://arxiv.org/pdf/2104.05704.pdf.

Kong, K., Kendall, C., Stone, N. & Notingher, I. Raman-Spektroskopie für die medizinische Diagnostik – von In-vitro-Bioflüssigkeitstests bis hin zur In-vivo-Krebserkennung. Adv. Drogenlieferung Rev. 89, 121–134 (2015).

Artikel CAS Google Scholar

Zhang, ZM, Chen, S. & Liang, YZ Basislinienkorrektur unter Verwendung adaptiver iterativ neu gewichteter bestrafter kleinster Quadrate. Analyst 135, 1138–1146 (2010).

Artikel ADS CAS Google Scholar

Referenzen herunterladen

Wir bedanken uns für die fruchtbaren Gespräche mit Poul A. Jessen von BacAlert. RBG war zum Zeitpunkt der Studie mit der Universität Süddänemark verbunden und ist derzeit mit dem Diagnosezentrum der medizinischen Abteilung des Universitätskrankenhauses Odense in Svendborg, Dänemark, verbunden. Diese Forschung wurde von der dänischen Agentur für Institutionen und Bildungsstipendien und dem Innovationsfonds Dänemark (IFD) im Rahmen des Eurostars-Projekts Bacsens (Fall Nr. 9046-00032A) finanziert.

Danish Fundamental Metrology, Kogle Allé 5, 2970, Hørsholm, Dänemark

Benjamin Lundquist Thomsen, Jesper B. Christensen, Olga Rodenko und Mikael Lassen

Institute of Optics and Atomic Physics, Technische Universität Berlin, Straße des 17. Juni 135, 10623, Berlin, Germany

Iskander Usenow

Art photonics GmbH, Rudower Ch 46, 12489, Berlin, Deutschland

Iskander Usenow

Forschungseinheit für klinische Mikrobiologie, Universität Süddänemark und Universitätskrankenhaus Odense, JB Winsløws Vej 21.2, 5000, Odense, Dänemark

Rasmus Birkholm Grønnemose & Thomas Emil Andersen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

JBC, IU und ML haben das Raman-Mikroskop entworfen und gebaut. RBG und TEA bereiteten die Bakterien für die Experimente vor. JBC, OR und ML erzielten die wichtigsten experimentellen Raman-Ergebnisse. BLT hat die Software für die maschinelle Lernanalyse entworfen und entwickelt. Der Artikel wurde von BLT, JBC und ML mit Beiträgen aller Autoren verfasst. ML konzipierte und betreute die Forschung.

Korrespondenz mit Mikael Lassen.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Thomsen, BL, Christensen, JB, Rodenko, O. et al. Genaue und schnelle Identifizierung minimal präparierter Bakterienphänotypen mithilfe von Raman-Spektroskopie, unterstützt durch maschinelles Lernen. Sci Rep 12, 16436 (2022). https://doi.org/10.1038/s41598-022-20850-z

Zitat herunterladen

Eingegangen: 26. Juni 2022

Angenommen: 20. September 2022

Veröffentlicht: 30. September 2022

DOI: https://doi.org/10.1038/s41598-022-20850-z

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.

AKTIE