Kaum ein Programm kann sich heutzutage noch vor KI-Funktionen retten, doch nicht alle davon müssen in der Cloud laufen.
Gesichtserkennung wird verbessert
Die freie Fotoverwaltungssoftware digiKam ist in Version 8.7.0 erschienen. Die neue Ausgabe bringt unter anderem erweiterte KI-Funktionen, GPU-Beschleunigung sowie zahlreiche weitere technische Aktualisierungen. Alle KI-Prozesse laufen ausschließlich lokal auf dem eigenen System. Ihr behaltet dadurch die volle Kontrolle über eure Daten und bleibt unabhängig von Internetverbindungen oder externen Diensten.
Ein Schwerpunkt liegt auf der verbesserten Gesichtserkennung. Diese nutzt maschinelles Lernen, um Personen in Bildern automatisch zu identifizieren. Neu ist die automatische Fortsetzung der Gesichtsanalyse beim Taggen oder Bestätigen eines Gesichts. Wird ein Vorschlag abgelehnt, zeigt digiKam nun automatisch den nächstbesten Treffer an.
Die zugrunde liegende Architektur wurde in der vorherigen Version komplett neu geschrieben und setzt auf K-Nächste-Nachbarn- und Support-Vektor-Maschinen-Verfahren, die präziser und robuster arbeiten sollen als in früheren Versionen.
digiKam kann ab sofort auch Grafikprozessoren zur Bildverarbeitung einsetzen. Bilder werden bei Bedarf an die GPU übergeben, um Größenänderungen und Farbraumkonvertierungen zu beschleunigen. Die Verarbeitung erfolgt über die OpenCV-Bibliothek mit OpenCL oder bei Nvidia-Hardware über CUDA mit CuDNN. Eine neue Testfunktion prüft, ob die Systemtreiber korrekt installiert sind. Die GPU-Beschleunigung ist optional und lässt sich auch gezielt deaktivieren.
Ausrichtung bei vielen Fotos korrigieren
Ein neues Plugin erkennt automatisch die richtige Ausrichtung von Bildern. Die Analyse erfolgt per Deep-Learning-Modell auf Basis der Bildinhalte und ersetzt damit das bisherige manuelle Rotationswerkzeug im Batch-Verarbeitungsmanager.

Zahlreiche interne Komponenten wurden ebenfalls aktualisiert. Der RAW-Decoder LibRaw unterstützt nun mehr als 1260 Kameramodelle. Auch ExifTool für Metadatenverwaltung sowie das Qt-Framework wurden auf neue Versionen gebracht. Das G’MIC-Plugin ermöglicht nun erstmals das Stapeln und kombinieren von Bildern, etwa für Montagen.

Insgesamt wurden 241 Fehler behoben, darunter Probleme in der Gesichtserkennung, Datenbankfunktionen, Benutzeroberfläche und Installationsroutinen. digiKam unterstützt jetzt 61 Sprachen in der Oberfläche, die Online-Dokumentation liegt in 16 Sprachen vor.
Für Oktober 2025 ist eine weitere Wartungsversion geplant. Darüber hinaus prüft das Projektteam den lokalen Einsatz neuronaler Netze für Aufgaben wie Rauschminderung und Farbkorrektur. Auch eine Schnittstelle zur Bildsuche in natürlicher Sprache ist in der Diskussion – das fände ich vor allem bei lokaler Anwendung sehr spannend, wäre aber wahrscheinlich auch sehr rechenintensiv.
digiKam 8.7.0 steht für Windows, macOS und Linux ab sofort zum kostenlosen Download bereit. Habt ihr digiKam schonmal ausprobiert oder vermisst ihr bestimmte Features?
via: PetaPixel