Als Alternative zu herkömmlichen Speichermedien werden synthetische Polymere attraktiver, denn die bisherige Beschränkung der Kettenlänge (und damit der Speicherkapazität) darf als überwunden gelten.
Immer mehr Daten müssen, oft auch langfristig, gespeichert werden (z. B. Prozessüberwachung, Qualitätssicherung). Makromoleküle mit definierter Sequenz sind eine Alternative zu herkömmlichen Speichermedien, da sie gespeicherte Informationen mit deutlich geringerem Platz- und Energiebedarf aufrechterhalten. Das massenspektrometrische Datenauslesen beschränkt jedoch die Länge und damit die Speicherkapazität der einzelnen Polymerketten. In der Zeitschrift Angewandte Chemie stellt ein Forschungsteam einen neuen Ansatz vor, der diese Limitierung überwindet und einen direkten Zugriff auf interessierende Bits ohne Auslesen der gesamten Kette ermöglicht.
Insbesondere für die langfristige Archivierung grosser Datenmengen, auf die nur selten zugegriffen werden muss, sind Makromoleküle mit definierter Sequenz, wie DNA und synthetische Polymere, eine interessante Alternative. Gegenüber DNA bieten synthetische Polymere Vorteile: eine einfache Synthese, höhere Speicherdichte und Stabilität unter rauen Bedingungen. Der Nachteil: Die in Polymeren kodierte Information wird durch Massenspektrometrie (MS) bzw. Tandem-Massen-Sequenzierung (MS2) ausgelesen. Hierfür dürfen die Moleküle nicht zu gross werden, was die Speicherkapazität pro Kette stark beschränkt. Ausserdem wird die komplette Kette Baustein für Baustein ausgelesen, es kann nicht direkt auf interessierende Bits zugegriffen werden – so als ob man ein Buch, statt auf der relevanten Seite etwas nachzusehen, komplett durchlesen muss.
Kyoung Taek Kim und sein Team vom Fachbereich Chemie der Seoul National University haben darum einen neuen Ansatz entwickelt. Damit lassen sich sehr lange synthetische Polymerketten, deren Molekulargewichte die analytische Grenze der MS bzw. MS2 deutlich überschreiten, effizient auslesen. Als Beispiel codierte die Forschergruuppe ihre Universitäts-Adresse in einem ASCII-Code und übersetzten diesen – zusammen mit einem Fehler-Detektions-Code (CRC, gängiges Verfahren zur Prüfung der Datenintegrität) – in einen Binärcode, d. h. eine Abfolge von 1 und 0. Die so erzeugte 512-Bit-Information speicherten sie in einer Polymer-Kette aus zwei verschiedenen Monomeren: Milchsäure codiert 1 und Phenyl-Milchsäure 0. An unregelmässigen Stellen bauten sie zudem Mandelsäure enthaltende Fragmentierungscodes ein. Bei chemischer Aktivierung werden die Ketten dort gespalten, im Beispiel in 18 verschieden grosse Fragmente, die einzeln durch MS2-Sequenzierung entschlüsselt werden können.
Eine speziell entwickelte Software identifiziert die Fragmente zunächst anhand ihrer Masse sowie ihrer Endgruppen aus den MS-Spektren. Während der MS2 „zerbrechen“ bereits gemessene Molekülionen weiter und die Bruchstücke werden erneut analysiert. Anhand deren Massen-Differenzen lassen sich die Fragmente sequenzieren. Unter Zuhilfenahme der CRC-Fehler-Detektions-Codes rekonstruiert die Software daraus die Sequenz der gesamten Kette. Damit ist die Längen-Limitierung für Polymerketten überwunden.