
Datenschutz im neuen PDF-Editor
Seit kurzem wird an der RUB ein neuer PDF-Editor verwendet: Tungsten PowerPDF. Wie sieht es bei dem Editor mit Blick auf Datenschutz aus und welche Funktionen bietet die Software in dieser Hinsicht?
Für diesen Beitrag haben wir uns einige der Funktionen der Software und die von ihr erstellten PDF-Dateien angesehen. Neben der Möglichkeit, Inhalte zu Schwärzen, bietet Tungsten PowerPDF die Möglichkeit, Metadaten zu löschen. Das sind Daten, die nicht bei der normalen Ansicht einer PDF-Datei zu sehen sind, sondern beispielsweise in den Eigenschaften zu finden sind. Das kann neben dem Autor auch das Erstellungsdatum sein. Da im Dokument selbst und in den Metadaten personenbezogene Daten enthalten sein können, sind das aus unserer Sicht besonders spannende Funktionen.
Schwärzen von Inhalten
Direkt in einer PDF-Datei Elemente zu schwärzen ist ein attraktives Feature um z.B. personenbezogene Daten schnell aus einem Dokument zu entfernen, ohne dieses sonst zu ändern. Dies erleichtert die Weitergabe von Dokumenten. Ein übliches Problem ähnlicher Funktionen ist, dass Elemente im Dokument zwar überdeckt werden, aber nicht gelöscht. So können auch geschwärzte Inhalte in den Metadaten der Dokumente immer noch zu finden sein. Tungsten verspricht hier, dass geschwärzte Elemente komplett aus dem Dokument gelöscht werden.
Die Funktion zum Schwärzen findet sich unter Sicherheit -> Schwärzung.

Wir haben uns die Funktion daher genauer angesehen. Eine genaue Anleitung, wie diese Funktion genutzt wird, befindet sich auf der Website von Tungsten (Externer Link). Hier ein Beispiel, wie die Funktion genutzt werden kann:


Neben dem überdecken in Schwarz sind auch die Nutzung anderer Farben, einschließlich weiß, möglich. Die Funktionalität ändert sich dabei nicht. Wichtig ist, dass die Änderungen gespeichert werden, damit sie auch tatsächlich angewendet werden.

Unser Test zeigt, dass tatsächlich die geschwärzten Inhalte nicht nur überdeckt, sondern vollständig entfernt werden.
Die PDF-Dateien haben wir uns angesehen, indem zuerst mit qpdf [Website] die PDFs entpackt und dann mit Diffuse [Website] verglichen haben. Dieser Beitrag bezieht sich auf die Version 5.1.1.4.0.25125.

Beim Vergleich der entpackten PDF-Dateien ist ersichtlich, dass sowohl geschwärzter Text (siehe Bild), als auch geschwärzte Bilder, aus der Datei entfernt sind.
Entfernen von Metadaten
Es ist zusätzlich möglich auch andere Metadaten aus dem Dokument zu entfernen. Wir haben uns angesehen, welche Metadaten von Tungsten gespeichert werden und welche entfernt werden können.
Wenn mit PowerPDF eine Datei erstellt oder bearbeitet wird, werden dem Dokument diverse Metadaten hinzugefügt. Neben einer Dokumenten-ID wird unter anderem der Anmeldename der Person gespeichert, die die PDF-Datei erstellt. Das ist ein personenbezogenes Datum. Es empfiehlt sich daher, die Metadaten mit der Funktion „Dokument bereinigen“ manuell zu entfernen.
Die Funktion mit der sich die Metadaten entfernen lassen findet sich unter Sicherheit -> Sicherheit -> Dokument bereinigen

Die Funktion ruft ein Fenster auf, in dem ausgewählt werden kann, welche Daten bereinigt werden sollen. Gelöschter Inhalt bedeutet dabei die zuvor geschwärzten Inhalte, die so endgültig gelöscht werden.


Auch hier entfernt die Funktion die Metadaten tatsächlich vollständig.
Das Handbuch äußert sich nur darüber, dass die Funktion existiert, aber nicht was genau sie macht.

Die entpackten PDF-Dateien wurden auch hier wieder verglichen. Metadaten, vor allem die die personenbezogene Daten enthalten, werden durch das Feature entfernt.
Tungsten hat sich in unseren Tests als eine datenschutzfreundliche Software erwiesen. Die Funktion zum Schwärzen und Löschen von Elementen in PDF-Dokumenten hält, was sie verspricht: Geschwärzte Inhalte werden tatsächlich aus dem Dokument entfernt. Die Möglichkeit, Metadaten zu bereinigen, stellt sicher, dass keine sensiblen Informationen in den verborgenen Daten des Dokuments verbleiben.