Smartphones & Apps

Fotografen bald überflüssig? KI macht “Fotos” aus Texteingaben

Müssen Profi-Fotografen jetzt um ihren Job fürchten? Solche Gedanken kommen schnell auf, wenn man ein paar Minuten mit der AI-Engine von NVIDIA verbringt.

KI-Tool GauGAN2 akzeptiert jetzt auch Text

Das amerikanische Unternehmen NVIDIA ist eigentlich vor allem für seine Grafikeinheiten bekannt, die unter anderem in PCs oder Spielekonsolen stecken. Doch schon seit Jahren macht man auch große Fortschritte darin, Visualisierungen mithilfe künstlicher Intelligenz zu erzeugen.

2019 hatte NVIDIA die Software GauGAN, benannt nach dem post-impressionistischen Maler Paul Gauguin, eingeführt. Damals war sie nur dazu in der Lage, aus Paint-artigen Zeichnungen mal mehr, mal weniger gute “Fotos” zu basteln. Jetzt akzeptiert GauGAN in Version 2 sogar Text-Eingaben, um in Windeseile ein passendes Bild zu zaubern, kündigen die Entwickler im Blog an.

Einfache Beschreibungen erzeugen fotorealistische Bilder

Um die eingangs gestellte Frage gleich mal selbst zu beantworten und wütenden Kommentaren zuvorzukommen: Nein, Fotografen braucht man natürlich noch immer. Für GauGAN dürfen es nicht allzu komplexe Sätze sein, sondern eher kurze Beschreibungen wie “Berg neben einem See” oder “Wellen treffen auf Steinstrand” (auf Englisch).

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

Nichtsdestotrotz ist es geradezu beängstigend, wie treffsicher und vor allem mit was für einer Geschwindigkeit die Engine Bilder zu lediglich rudimentären Eingaben produziert. Verschiedene Arten von Eingaben, also beispielsweise Text und Zeichnungen, lassen sich sogar miteinander kombinieren, um das Ergebnis zu verbessern. Neben fotorealistischen Visualisierungen können außerdem auch übernatürliche Landschaften kreiert werden.

NVIDIA GauGAN2 kostenlos im Browser ausprobieren

Obwohl allerneuste Technik hinter der Fassade steckt, ist die Benutzeroberfläche ziemlich einsteigerfreundlich. Nach dem Generieren eines Bildes lassen sich verschiedene Stile auswählen oder einzelne Elemente hinzufügen oder entfernen. Das vielleicht Beste an der Geschichte habe ich noch gar nicht erwähnt: GauGAN2 könnt ihr absolut kostenfrei und ohne Installation einfach in eurem Browserfenster ausprobieren. Rechenleistung benötigt ihr auch nicht, denn schließlich kommen die Bilder direkt aus der Cloud auf euren Bildschirm. Das “GAN” im Namen steht übrigens für “Generative Adversarial Networks”, ohne technisch zu sehr ins Detail gehen zu wollen. NVIDIA erklärt an dieser Stelle mehr über die zugrundeliegende Funktionsweise.

Was glaubt ihr: Können solche KI-Tools irgendwann mal eine ernsthafte Bedrohung für die fotografierende Zunft sein?

via: PetaPixel

guest
21 Kommentare
älteste
neueste
Feedback
Zeige alle Kommentare
Rolf Carl

Tja, für Studio- und Werbefotografen wird es langsam eng. Die Agenturen geben einfach die gewünschten Motive ein und fertig ist das Bild, und das vermutlich noch halb gratis. Sportfotografen sind natürlich privilegiert, denn wenn ich eingebe: Das 3:1 Bayern gegen Dortmund, kommt vermutlich erst am nächsten Tag die KI zum tragen, wenn die Sache längst gelaufen und abgehakt ist. Auch die Hochzeitsfotografen dürfen sich die Hände reiben, denn wenn ich eingebe: Bräutigam küsst Braut, sind garantiert die Falschen auf dem Foto.
Anfänger, Hobbyisten, Amateure und Edelamateure sind davon sowieso nicht betroffen, da sie ja nicht fotografieren müssen, sondern nur dürfen, und Kohle verdienen die ja eh mehr auf ihrem Beruf, als die übrig gebliebenen Profis es sich jemals erträumen können.

Frank

Nee Rolf, wenn die Bayern gegen den BVB nur noch 6 Spieler auf den Platz bekommen, weil der Rest gerade in Quarantäne ist, dann gewinnen natürlich die Dortmunder. So intelligent ist das Programm dann aber.

Aber für die Werbefotografen könnte es dann schon eng werden. Wir hatten mal eine Werbefotografin aus Montpellier hier in der Gegend, die etwas über ihre Arbeit erzählt hat. Wie man Aufnahmen im Hochsommer mit den leicht geschürzten Models von einem winterlichen Hintergrund macht. Was für ein Aufwand dahinter steckt. Allein von Bühnenbau.
Fiele dann alles flach. Du brauchst nur vom Model Fotodaten, alles andere besorgt die KI.

Rolf Carl

Nee Frank, eben genau nicht. Das Programm ist ziemlich blöd und muss dauernd mit Informationen gefüttert werden, sonst versagt es auf der ganzen Linie. Also beim Fussball wird das in den nächsten 200 bis 500 Jahren noch nicht klappen.
Die Models sind natürlich das perfekte Beispiel dafür, wo KI sinnvoll eingesetzt werden kann. Wenn den Dämchen im Sommer der Schweiss runterläuft, gibst du einfach Winter ein, und die Schweisstropfen werden zu Eiskristallen. Man braucht übrigens auch keine Models mehr, Gummipuppen gehen auch, hat übrigens sogar den Vorteil, dass die nicht dauernd rummeckern.

Leonhard

Gummipuppen haben eigentlich nur Vorteile!

Mit einer Gummipuppe auf dem Beifahrersitz fällt man sicherlich mehr auf als mit jedem Model, beim Geschäftsessen kann man die kleinen Portionen mit dem Teller der Puppe aufbessern und wer eine Luftpumpe dabei hat braucht sich auf keine Sorgen zu machen, dass seine Begleitung zu später Stunde Falten bekommt.

Langer Rede kurzer Sinn: Solange einem keiner mit einem Luftgewehr ein Loch in die Dame schießt sind Gummipuppen die geniale Partnerin und viel vielseitiger als jeder Gummiball!

Rolf Carl

Kann leider nicht mehr antworten, der Zensurstift ist schon unterwegs.

Mark Göpferich

Hab ihn schon gezückt Rolf 😉 Von künstlicher Intelligenz zu Gummipuppen, das muss man erstmal schaffen. Ihr dürft das Thema jetzt aber gerne wieder zu fotografischen Themen zurücklenken 😉

Rolf Carl

Musste gleich herzhaft lachen, Mark! Du bist aber sehr aufmerksam heute.

Alfred Proksch

Servus Rolf leider ist das so.

Im Prinzip geht es darum mit Bildern Gefühle beim Betrachter auszulösen. Dabei reicht schon ein gut geschriebener Text oder eine einfache Kinderzeichnung aus um diesen Effekt zu generieren.

Schon länger geht es den Produktfotografen an den Kragen weil fast alle Gegenstände sehr realistisch gerendert aus dem Rechner kommen, deswegen sterben die herkömmlichen konservativen Studios langsam aber sicher aus.

Bei jeder Hochzeit ist ein fotografierender „Onkel Heinz“ anwesend der neben den vielen Smartphone Videos ordentliche Bilder mit der KI Kamera macht. So wie ich das weiß sind die Sport filmenden Firmen mit dem Aufbau und der Strukturierung einer Bildagentur beschäftigt die den Verkauf von diversen „Standbildern“ übernehmen soll.

Also ihr lieben Event Fotografen seit euch nicht zu sicher ob ihr in 2-3 Jahren noch genügend Arbeit habt. Der Wandel geht weiter als so mancher denkt!

Rolf Carl

Sehr schön beschrieben, Alfred. Die neuen Privilegierten sind doch wir Edelamateure, die nur noch aus Spass an der Sache fotografieren, und zwar wie und wann wir Lust dazu haben. Wir sind die neuen VIP-Kunden der Kameraindustrie!

Alfred Proksch

Ja- wir Privatiers mit den etwas gefüllten Taschen sind die neue umworbene Kundschaft für die „gehobenen“ Standard Artikel.

Geiz ist geil gilt notgedrungen in den unteren Einkommensschichten, da sind diejenigen welche ohne Überprüfung und nachdenken auf die Black Friday Angebote abgehen zu finden. Ist nicht despektierlich gemeint!!!

Für mich umfasst ein Angebot alle entstehenden Kosten und die damit verbundenen Leistungen sowie den ausgehandelten Sondervereinbarungen.

GauGAN2 ist Software für faule abgestumpfte Menschen ohne Vorstellungsvermögen. Wir Fotografen überflüssig? Keine Maschine kann gefühlvolle Bildgeschichten erzählen wir Kreative können das!

joe

…Keine Maschine kann gefühlvolle Bildgeschichten erzählen wir Kreative können das!… Alfred, da wäre ich mir nicht so sicher. Was denkst du warum es so viele herzige Kätzchen Videos oder Baby Videos auf z.B. Youtube gibt? Die KI wählt aus, was Erfolg hat!

Rolf Carl

joe, was Erfolg hat, ist aber leider selten das Beste. Ich vermute jetzt mal, dass die italienischen Spaghetti von Barilla die meistverkauften sind, die von Delverde aber vermutlich die besten. Die Liste lässt sich endlos verlängern. Was ist besser: Das spanische Weingut mit mehreren Millionen Flaschen oder Château Latour? Beide haben ziemlich sicher grossen Erfolg. Jetzt müsste man letzteres einfach noch definieren; Masse oder Klasse?

Leonhard

Diese Frage stellt sich aus meiner Sicht so nicht, lieber Rolf, da ist es wie bei Kameras!

Brauche ich einen Wein zum Saufen oder zum Genießen, so sehe ich die Frage.

Wer mit 2 Promille Standgas aufsteht und dann “Frühstücken” muss, der dürfte sogar mit dem Spanier besser bedient sein, unabhängig vom Preis! Bei zu langem Standgas tritt ja auch das Problem auf, dass sich der Geschmack auf “genug Allohol” beschränkt, da wären solche Edeltropfen nur Perlen vor die Säue geworfen. Ergo, mein lieber, genieße Du Deinen Edelwein und lasse andere die Brühe schlucken, die damit die Finger ruhig bekommen wollen, so ist jedem geholfen.

Ist doch wie bei der KI! Soll Leute geben, wenn die die KI nicht über jede Menge Drehräder einstellen können, dann taugt die nichts, quasi aus der Kamerawelt übertragen.

Leonhard

Ein weiterer Meilenstein bei der KI wäre es sicherlich, wenn diese KI für den Bereich der Emotionen direkt vom Menschen lernen könnte. Bringt man der Maschine bei, welche Hirnteile bei welchen Gefühlen angesprochen werden, zeigt sowohl dem Rechner als auch einem verkabelten Probanden Bilder, spielt Musik ab und und und …. und der Rechenknecht kann aus den Hirnströmen des Menschen lernen, was die Überzahl bei welchen Reizen “empfindet”, dann könnte dieses System der künstlichen Intelligenz weitere Berechnungen anstellen, wie man einen Menschen entweder erfreuen oder eben auch ärgern kann. Alleine im Bereich der bewussten und unterbewussten Wahrnehmung wären dann Werbeattacken möglich, dagegen wäre diese nur unterbewusst wahrgenommene Eiseinblendung im Fernsehen, die uns auf die Pilgerreise zum Kühlschrank brachte wahrer Kinderkram! Ein solcher Rechenpsychopath könnte sicherlich recht gut einen sympathischen Zeitgenossen spielen, ohne dabei als Maschine natürlich jemals irgend welche Gefühle zu haben. Positiv eingesetzt könnte man hiermit einen Kameraden gegen Alterseinsamkeit herstellen, was man negativ mit so was anstellen könnte möchte ich mir hier nun gar nicht ausdenken! Beim Bereich “Bild” sind wir sicherlich noch ganz am Anfang, irgendwann wird es in Zukunft (nicht die nächsten paar Jahre) möglich sein, zum Beispiel die beiden Klöster aus dem Film “im Namen… Weiterlesen »

Alfred Proksch

Besser erfolgreich verdrängen! Was machbar ist wird gemacht. China praktiziert das völlig ungeniert.

Leonhard

Vollkommen richtig, lieber Alfred,

wenn hier jemand auf den Gedanken käme, Elektronikchips ins menschliche Gehirn einzupflanzen, um eine Drahtloskommunikation zwischen Rechner und Mensch zu ermöglichen, dann gäbe es hier einen gewaltigen Aufschrei der “so was kann man nicht mal andenken Fraktionen”, geht der Gedanke nach China, dann machen die dies einfach!

Erklärt würde es den Leuten mit “dann könnt ihr im Schlaf noch lernen und seit besser als jeder Taschenrechner”, der Sinn für den Staat wäre wohl, dies wäre besser als jede Überwachungskamera!

Alfred Proksch

Nein der Mensch mit seinem programmierten „Kindchenschema“ hat die Klicks für die Youtube KI geliefert!

Rüdiger

Neu ist hier nur die Eingabe und die Geschwindigkeit durch die nVidia Chips. Landschaften kann man seit mindestens 30 Jahren generieren, z. Bsp. mit Terragen (https://planetside.co.uk/terragen-feature-tour/)

Für Fotografen ändert sich damit wenig bis nichts.

Knut

Ja, im Amateurbereich sieht man das ja mit Luminar. Der Weg ist ganz klar. Berufsfotografen wird es immer weniger geben. Kenne schon zwei die aufgegeben haben. Im Film sieht man das auch sehr deutlich. Häufig sind die Schauspieler nur noch Platzhalter für die darauffolgende Bearbeitung. Ja, der Weg ist unumkehrbar. Als Hobbyist kann es ein Segen sein. Viel weniger Stunden vor dem Kasten sitzen, viel mehr Stunden draußen mit der Kamera unterwegs. Gedanken sind leichter fotografisch umzusetzen wenn man sich aufs Sehen versteht. Wieviel Ki oder Automatisierung man haben möchte soll jeder für sich selbst entscheiden. Für mich ist nur entscheidend, wieviel von einem Bild hab ich gemacht, ist das Ergebnis so wie ich es mir vorstellte als ich auf den Auslöser drückte. Schnell klicken den Rest macht ein Programm, womöglich noch vollautomatisch ist nicht meine Welt. Da kann man ja nicht mal behaupten das Foto hab ich gemacht. So gesehen wird es wohl zwei Personenkreise geben. Die einen sehen ein Motiv und machen das Bild wie es ihren Vorstellungen entspricht und die anderen machen ein Bild bis sie es schön finden. Ob man damit Geld verdient oder nicht ist egal. Der eine malt was weil er malen will und… Weiterlesen »

joe

Also bei aller Künstlichen Intelligenz, selbst die muss irgendwelche Vorlagen haben und die kann sie ja nicht aus sich selbst heraus sozusagen aus dem Nichts kreieren. Im Sommer Winterbilder erzeugen ist auch schon heute nicht wirklich schwierig, geübte Photoshopler schaffen das in wenigen Minuten. Wenn die Person oder das Produkt keine Rolle spielen ist es für künstliche Intelligent sicherlich möglich und relativ einfach aus unzähligen Bildern neue zu konstruieren, aber irgendwer muss da schon mal was geleistet haben. Ist ja auch nicht so, dass Kameras Personen bzw. Augen erkennen, da werden zigtausende Bilder vorher eingegeben und die KI lernt dann, was ein Kopf, ein Auge, ein Mensch ist – und trotzdem liegt sie gerne auch mal daneben!

Robin

KI schreibt auch Romane.