Künstliche Intelligenz bzw. Artifical Intelligence (KI, AI) für Unternehmen und Kreative

Seit November 2022 haben wir die KI nun durchgängig im Einsatz und sie bereitet jeden Tag mehr Freude.
Doch wofür ist sie schlussendlich unverzichtbar geworden, bzw. hat alte Prozesse wirklich verbessert?

Das führe ich hier gerne nach Programmen auf:

ChatGPT

https://chat.openai.com/

Das wohl bekannteste KI Tool ist die erste Anlaufstelle für Textgenerierung aller Art.

Wir verwenden es unter anderem als:

 

  • Ideenratgeber für Themen aller Art
  • Generierung von Promts für Midjourney
  • Generierung von Keywords und Texten
  • Erstellung von rechtlichen Texten
  • Entwicklung von HTML, CSS und Javascript
  • Verfassen von Blogartikeln und kleinen Geschichten
  • Zielführende kurze Erklärung von Software, Funktionen…
  • Erstellung von Listen

Google Bard

Diese innovative Alternative zu ChatGPT bietet ähnliche Möglichkeiten und ist eine spannende Ergänzung. Mit Google Bard kannst du mühelos Texte kürzen, übersetzen, Prompts erstellen und sogar Songs, Drehbücher und Gedichte schreiben lassen. Die Resultate sind beeindruckend und können dein Unternehmen effektiv unterstützen.

https://bard.google.com/

Midjouney

https://www.midjourney.com

Wir nutzen Midjourney seit Version 3 und damit seit über einem Jahr auch für gewerbliche Projekte und zur Generierung von Stock Content. Es wird mit jeder Version besser und erlaubt seit Version 6 auch Texte in Bildern.

 

  • Schnelle Umsetzung von Ideen – Final als Vorlage
  • Grundlage für weitere Composingarbeiten
  • Logoentwürfe
  • Illustrationen nach vorgegebenen Inhalten
  • Mockup Vorlagen für transparente PNGs
  • Schnelle Designgrundlagen / Vorentwurf oder Final
  • Webseitenentwürfe
  • Aussagekräftige Webseitenbilder unterschiedlichster Themen
  • Stock Fotos für Adobe und eigene Projekte

DALL-E 3

https://www.bing.com/images/create

Microsoft stellt DALL-E 3 in Bing Create kostenfrei zur Verfügung.

Mittlerweile liefert auch DALL-E 3 gute Bilder!

Adobe Firefly:

Firefly wird analog zu Midjourney arbeiten. Es ist aktuell in einer Beta Phase und kann daher bereits breit getestet werden. Auch ich bin Beta Tester und bin mit dem Ergebnis schon recht zufrieden. Es noch etwas dauern, bis die Qualität von Midjourney erreicht wird, dafür ist es absolut rechtssicher, da die KI ausschließlich durch freie oder Fotos aus Adobe Stock generiert wurden.

Da es nicht über Discord läuft, sind auch klick Funktionen möglich, was die Bedienung erleichtert. Ebenso habe ich schon in Videos gesehen, dass auch direkt in die 3D Bilder z.B. für eine eigene Positionierung eingegriffen werden kann. 

Photoshop (Beta):

Als Nutzer der ersten Stunde kann ich sagen, dass man schon nach wenigen Stunden nur noch in der beta Version arbeiten wird. Sie hat eine Firefly integration zum generativen Füllen von Inhalten z.B. für das interaktive Füllen und dem erweitern von Bildinhalten.

Die Qualität und Geschwindigkeit der AI Inhalte ist super und so nutze ich es um z.B. Gesichter, Himmel, weisse Blitzer etc… zu ersetzen. Als Webentwickler habe ich auch schon Fotos zu Bannern umgewandelt und würde ohne dieses Funktionen nicht mehr arbeiten wollen.

KI Software und Funktionen im Allgemeinen:

KI verwenden wir eigentlich schon immer, aber speziell für Midjourney und Co. ist eine Skalierung, Colorgrading und Konvertierung zu sRGB erforderlich. Daher nutzen wir auch:

  • Topaz AI (Gigapixel, Photo, DeNoise, Sharpener)
  • Capture One Pro (Farbkorrektur der Monitor RGB in sRGB)
  • Photoshop (Objektaustausch, Transparenz, Korrekturen)
  • Bridge CC (Schnittstelle, Verschlagwortung, Sortierung)
  • Portrait Photo Pro (zur Anpassung normaler Bilder an die KI)

Stable Diffusion:

Das kostenlose Tool entwickelt sich rasant weiter. Hier können eigene 3D Modelle angelernt werden und diese dann auch mit 3D Software passgenau modelliert werden.

Aktuell verwenden wir nur Blockadelabs, da es 360° Bilder erzeugen kann, was in Midjourney aktuell nicht möglich ist.

 

Culling in Aftershoot und Capture One

Culling und Edit heißen die beiden Zauberwörter in der RAW Bearbeitung von Fotos. Hierzu sind in den letzten Monaten einige Produkte auf den Markt gekommen. Ich habe 3 Verschiedene getestet und bin am Ende, auch wegen des Preises bei Aftershoot gelandet. Aber auch Neurapix wäre interessant gewesen.

Aftershoot bietet zusätzlich Cullung an, was eine automatische Selektion ermöglicht. Dabei werden gleiche Fotos aussortiert, Lächeln, Augen und Schärfe kontrolliert und damit die nach Meinung der KI besten Fotos bewertet. Auch Capture One Pro hat eine solche Culling Funktion, jedoch ohne wirkliche KI Unerstützung.

Verlassen will ich mich aktuell noch nicht darauf, aber es ist sehr schön eine zweite Meinung zu haben. Bei Gruppenbildern liegt Aftershoot tendenziell richtig und das spart am Ende 20% Zeit in der Selektion.

Bei Interesse könnt ihr meinen Afilliate Link nutzen:
https://aftershoot.com/get-started/?referrer=NOCIBR66

KI RAW Edit in Aftershoot und Lightroom

Man kann Aftershoot die eigene Bearbeitung beibringen. Dieses ist vorest über ein Lightroom Kataloge möglich, aber seit Juli 2023 gibt es auch schon die ersten Beta Funktionen für Capture One Pro.

Los gehts mit 2500 antrainierten Bildern, besser sind aber 5000 und gut trainierte Presets haben auch mal 20000 antrainierte Bearbeitungsvarianten.

Die Ergebnisse sind bei selbst antrainierten Presets so gut, dass man nur noch wenige Anpassungen braucht. Einige Fotos sind so gut, dass man nichts mehr machen muss.

KI in der RAW Bearbeitung ist aus meiner Sicht das nächste große Ding, denn es ermöglicht Fotografen auch große Projekte sehr schnell zu bearbeiten. Ich liefere meine Bilder fast immer am gleichen oder nächsten Tag ab. Nur große Hochzeiten ab 2000 Fotos brauchen auch mal 2-3 Tage.

 

KI in der Webentwicklung

In vielen Programmen kommt KI mittlerweile ergänzend zum Einsatz. Die meisten Entwickler nutzen dafür Tools wie ChatGPT um CSS, HTML udn Co. zu erstellen.

Mittlerweile haben aber WordPress und Co. aufgeholt und auch Themes wie DIVI bieten mittlerweile die Möglichkeit Texte und Bilder schon im Editor zu erstellen.

Das ist besonders auch bei Schülern beliebt, da es eine sehr schnelle Erstellung von Präsentationen erlaubt.

 

Für was nutzen wir die KI in der Fotografie?

 

Völlig neue RAW Workflows mit besseren und schnelleren Ergebnissen.

Wie schon vorher kurz aufgeführt sind Culling und Edit dafür verantwortlich, Foto RAW Dateien schneller zu selektieren und zu bearbeiten. Das bringt aktuell einen ca. 20% schnelleren Workflow und somit auch einen Wettbewerbsvorteil gegenüber klassischen Fotografen. Die eingesparte Zeit geht aber bei mir in das verbesserte Editieren mit generativen Bildersetzungen in Photoshop Beta. So bekommt der Kunde für das gleiche Geld wesentlich besseres und konsistenteres Material.

Mit zunehmendem Training der KI Bearbeitung kann sich die Einsparung auch auf 50% erhöhen. Ich persönlich habe recht unterschiedliche Projekte, so dass für das Training auch wesentlich mehr Fotos mit einbezogen werden müssen. Aber auch jetzt schon kann ich sagen, dass der klassische Weg über Capture One, Lightroom und Bridge sich stark verändert hat und in diesem Jahr auch noch wird. Adobe ist mit der KI auf dem Vormarsch, das Entrauschen ist super und schlägt bei weissen Partikeln (durch aufhellen von dunklen Bereichen) aktuell sogar Topaz AI.

Auch aus lizenztechnischen Gründen setze ich aktuell auf die KI. Adobe CC bietet ein Gesamtpaket, das aktuell mehr und mehr Vorteile hervorbringt.

Wenn die 50% Bearbeitungserleichterung erreicht sind, dann wird kein Fotograf mehr ohne diese Möglichkeiten überlebensfähig sein. Zu groß sind die Vorteile derjenigen, die diese Zeit einsparen können. Auch die Kunden werden sich über schnellere Lieferungen freuen.

Für was nutzen wir Ki generierte Bilder aus Midjourney und Co.?

 

Mockups

Leermodelle werden in vielen Bereichen der gewerblichen Fotografie benötigt. Sie werden meist mit transparenten PNGs erstellt, die später einfach mit einer eigenen Ebene gefüllt werden können. So können Produkte besser und in ansprechender Atmosphäre präsentiert werden.

Wir haben dabei Chat GPT benutzt um Frontalansichten von nicht näher spezifizierten cleanen Räumen zu bekommen. So bekommt man viele unterschiedliche Vorschläge.

Webseiten Banner Hintergründe

Da wir auch Webseiten erstellen brauchen wir immer wieder mal besondere Motive. Neben unserem umfangreichen Portfolio echter Fotos, brauchen wir auch oft plakative Hintergrunde, die meist nur als Hintergrund fungieren. Bei der Erstellung folgt der Idee, die über Chat GPT erstellt wird, schnell eine breite Auswahl an Material. Die Serie Speed of Light ist ebenfalls aus der Idee eines Banners entstanden. Im Portfolio sortieren wir diese Bilder und falls erforderlich erstellen wir auch sehr schnell neues Material. 

Tiles – erstelle eigenes Geschenkpapier, 3D Oberflächen und Co.

Background Repeater waren zum Start des Internets weit verbreitet, aber auch in Geschenkpapier und vor allem zum virtuellen bekleben von 3D Objekten braucht man auch heute noch sich wiederholende Muster. Diese lassen sich im Handumdrehen mit beliebigen Ideen füllen und können in jedem Seitenverhältnis erstellt werden.

360° equiregtangulare Fantasiewelten erschaffen

Neben unserer umfangreichen eigenen Austauschhimmel Sammlung setzen wir auch auf künstlich generierte Himmel. Diese können von über 3000px an der langen Kante auf 12584px Kantenlänge skaliert werden, was selbst für große Drucke ausreicht. Möglich wird das durch den Einsatz von Stable Diffusion und einem Tool, das speziell für Landschaften geeignet ist. Durch das weglassen der Landschaften „in the middle of a flat ocean“, kann man komplette 360° Himmel bis zum Horizont erschaffen. Equiregtangulare Panoramen und virtuelle Touren erstellen wir natürlich auch auf klassischem Wege,  superschnell in HDR ohne Nadir oder Zenith Löcher – fertig für Ihre Webseite oder digitale Broschüre.

Hier seht Ihr ein Beispiel einer neuseeländischen Landschaft. Sehr schön sind alle Schönheiten Neuseelands auf einem Bild zusammengefaßt als 360° Bild. In der Galerie darunter habe ich 360° Himmel bis zum Horizont erstellt und im vierten Bild auch mit einem Foto kombiniert. Vorteil der Technik ist, dass vor Ort auch 12mm und ein normale Stativ ausreichen um ein vollständiges Panorama zu erstellen.

Natürlich darf es auch mal lustig sein

wie hier in einer Serie zu Selfies. Nichts ist unmöglich, die Idee zählt. Auffallen um jeden Preis, weg von der Langeweile, das kann auch das Ziel einer Kampagne sein.

Vielfalt auch bei problematischen Themen

Mal Ehrlich, was fällt Euch zum Thema Sicherheit ein? Was mit einer Anfrage zum Thema Datenschutz begann wurde schnell zu einem größeren Portfolio. Schön ist dabei, dass es neben fotorealistischen Content auf Illustrationen in den Promt schaffen. Dabei muss sich niemand einen Kopf über die Idee machen. Alle Motive sind frei von ChatGPT erfunden und als Promt generiert. So erweitert man seine eigenen Ideen um ein Vielfaches und schafft in einer Stunde je nach Thema zwischen 10 und 25 Bilder.

Allgemeine Themen auf neutralem Hintergrund

Beliebige Themen auf neutralem Hintergrund in unterschiedlichsten Ausführungen:

Bilder mit Platzhalter

Beliebige Themen mit Platz für Text:

Fotografie und KI ergänzen sich

was in der Fotografie mangels Motive oder aus rechtlichen Gründen nicht möglich ist, kann sehr wahrscheinlich über eine KI erstellt werden. Insbesondere Midjourney liefert fotorealistische Ergebnisse, die kaum von echten Bildern unterschieden werden können. Es wird nie ein Fotoshooting in der Firma oder auf einer Hochzeit ersetzen können, aber allgemeine Motive können sehr schnell umgesetzt werden. 

Wie auch in der Fotografie, so werden auch die KI Bilder bearbeitet. Der Aufwand ist in etwa der gleiche.

Gerne könnt Ihr eine kostenfreie Anfrage stellen und wir machen dann Vorschläge. Da wir unser Portfolio fortlaufen vergrößern und auch Stock Agenturen versorgen, kommt es nicht darauf an, ob die Bilder schlussendlich abgenommen werden. In den allermeisten Fällen wird das Ergebnis aber sehr gut sein.

Chat GPT

Was man in Midjourney sehr schön grafisch darstellen kann, das kommt in Chat eher langweilig daher. Die Ergebnisse sind aber beeindruckend. Ein einfaches Beispiel findet man gleich hier auf der Seite:

Vielleicht habt Ihr bemerkt dass die Bilder in der DIVI Gallerie größer werden, kein Overlay mehr haben und auch keine Beschreibungen. Sowas sucht man sich erst mal über Google und YouTube heraus, was auch geklappt hat. Ganz am Ende gab es aber Überlagerungen mit den anderen Bilder bei der Vergrößerung. Solche kleinen Probleme können einen Stunden kosten.

Mit ChatGPT kann man sich unterhalten und so das Problem lösen, die Antworten sind auch erklärt und das macht Chat im Vergleich zu Google und YouTube Tutorials zum klaren Gewinner.

Hier die Lösung meines Problems als 1:1 Kopie der ChatGPT Antwort:

Wenn das Bild nicht in einer Spalte innerhalb des DIVI-Grids enthalten ist, können Sie das Bild in einer „positionierten“ CSS-Box positionieren, um sicherzustellen, dass es innerhalb des umgebenden Elements bleibt und keine anderen Elemente überdeckt.

1. Fügen Sie dem umgebenden Element eine CSS-Klasse hinzu, z.B. „my-image-container“.

2. Fügen Sie den folgenden CSS-Code hinzu:

.my-image-container {
position: relative;
overflow: hidden
}

 .my-image-container img {
transition: all 0.3s ease-in-out;
}

.my-image-container:hover img {
transform: scale(1.2);
}

3. Passen Sie die Klasse und den Selector entsprechend Ihrem Markup an.

Der Code positioniert das Bild innerhalb der umgebenden Box und skaliert es beim Mouseover um 20%. Das „overflow: hidden;“ verhindert, dass das Bild über die Grenzen des umgebenden Elements hinausragt.

Dies sollte das Problem lösen und das Bild innerhalb des umgebenden Elements vergrößern, ohne andere Elemente zu überdecken.

Formeln verstehen

In ChatGPT kann man pro Thema einen eigenen Thread öffnen und innerhalb des Threads erinnert sich die KI an das was man ihr beigebracht hat. Möchte ich als die Midjourney Formel ausgefüllt zurückbekommen, so muss man diese erst beibringen. So wird das Tool immer mächtiger und kann z.B. deutsche Anfragen automatisch in englisch beantworten oder gesperrte Begriffe lernen, damit diese bei kritischen Themen umformuliert werden.

Texte aller Art

Wir nutzen ChatGPT, um Texte zu kürzen, zu übersetzen und in Prompts umzuwandeln. Ende Februar habe ich versucht, einen Tiroler Dialekt-Text mit Google Translate zu übersetzen. Das hat überhaupt nicht funktioniert. ChatGPT hatte bis auf ein Wort alles richtig übersetzt, was aber mit einem Hinweis angelernt werden konnte. Das Kürzen von Texten auf eine beliebige Anzahl von Zeichen funktioniert immer.

ChatGPT kann Songs, Drehbücher, Gedichte, Witze und sogar rechtliche Texte schreiben und erklären. Daher schreiben wir vieles nicht mehr selbst, da das Ergebnis und der Inhalt in der Regel zu 80-90% gut sind und dann von uns selbst überarbeitet werden kann.

Wir haben auch Märchen zu Fotos und Fotos zu Märchen erstellt. Das klappt nahezu immer und die Geschichten sind durchaus gut oder zumindest besser als das, was ich selbst hätte verfassen können.

Wir schreiben auch Keywords mehr für Stockfotos selbst. ChatGPT erstellt diese selbst und mischt sie durch oder fügt sogar auf Wunsch neue hinzu. Es lohnt sich also auf jeden Fall, Formeln und Texte zu verwenden.

Diesen Absatz habe ich von ChatGPT korrigieren lassen, auch das ist eine nützliche Funktion.

Ich dokumentiere fortlaufend meine Test und wer sich für meine Arbeit interessiert, der kann mir gerne auf Facebook folgen:

https://www.facebook.com/johann.dirschl 

Lerne die Möglichkeiten von KI selbst kennen und nutze die Vorteile

Gerne geben wir unsere Erfahrungen weiter und analysieren wo in Ihrem Unternehmen potentielle Vorteile bei der Verwendung liegen. Mittlerweile bieten wir zum gesamten Thema auch Firmenschulungen an. Ab Herbst 2023 wird es auch VHS Kurse für Midjourney und ChatGPT geben.

Abgeschlossene Projekte