01.03.2022
Künstlerische Darstellung der Klassifizierung verschiedener technischer Lignine.

Künstlerische Darstellung der Klassifizierung verschiedener technischer Lignine.

Quelle: BAM

Lignin ist eine der größten aromatischen Kohlenstoffquellen auf unserem Planeten. Es kommt in allen verholzenden Pflanzen sowie vielen Gräsern vor und schützt sie vor UV-Strahlung, Fressfeinden und Austrocknung und verleiht ihnen Stabilität. Technisches Lignin wird hauptsächlich als Nebenprodukt bei der Zellstoff- und Papierherstellung gewonnen und stellt den Startpunkt dar, ab dem es für potenzielle Anwendungen weiterverarbeitet werden kann. In dieser Arbeit wurden technische Lignine mit abgeschwächter Totalreflexion Infrarotspektroskopie (ATR-IR) gemessen und anschließend ein mathematisches Modell zur Klassifizierung dieser Modelle erstellt, mit dem unbekannte Proben schnell und zuverlässig ihren übergeordneten Pflanzengruppe (Nadelhölzer, Laubhölzer, Stroh & Gräser) zugeordnet werden können. Das Modell basiert auf der Anwendung der Hauptkomponentenanalyse (PCA) gekoppelt mit der Klassifizierung durch die k-nearest neighbour Methode (k-NN). Nach Aufnahme der IR-Daten müssen die Spektren mathematisch bearbeitet werden. Es wurde verglichen wie sich verschiedene Stadien der Spektrenbearbeitung auf die Vorhersagekraft des Modells auswirken. Gegenübergestellt wurden die mittenzentrierten Rohdaten, eine zweite Ableitung sowie eine zweite Ableitung kombiniert mit einer Einheitsvektornormierung der Daten. Als Distanzmaß für k-NN wurde euklidisches Distanzmaß verwendet. Zur Evaluierung der Vorhersagekraft wurden die Gütekriterien Genauigkeit (Acc), Empfindlichkeit (TPR) und Spezifizität (TNR) verwendet. Die verschiedenen Datensätze wurden für k = 1…20 getestet. Zur Validierung wurde eine 5-fach Kreuzvalidierung verwendet. Es konnte nicht nur gezeigt werden, dass eine Klassifizierung mittels ATR-IR möglich ist, sondern auch, dass mit voranschreitender Datenbearbeitung die Vorhersagekraft des Modells zunimmt. Für das optimierte Modell mit k = 4 erhält man für die Gütekriterien folgende Werte: Acc = 98.9%, TPR = 99.2%, TNR = 99.6%.

Identification and Classification of Technical Lignins by means of Principle Component Analysis and k-Nearest Neighbor Algorithm
Friedrich Fink, Franziska Emmerling, Jana Falkenhagen
veröffentlicht in Chemistry-Methods, Band 1, Heft 8, S. 350 - 396, 2021
BAM Fachbereich Strukturanalytik