
Künstliche Intelligenz bzw. Artifical Intelligence (KI, AI) für Unternehmen und Kreative
Seit November 2022 haben wir die KI durchgängig im Einsatz und sie bereitet jeden Tag mehr Freude.
Die Zukunft besteht in der KI Automatisierung, LLM APIs und dem Ende vieler Berufe wie wir sie kennen.
Aktuell sind die meisten KIs so ausgereift, dass sie 99% der Menschen weit überlegen sind. Sie sind Helfer, unsere Arbeit so schnell und effizient wie möglich zu gestalten. Tools wie n8n können unsere Aufgaben voll Automatisieren und die Nutzung von APIs geben Entwicklern die Möglichkeit komplexeste Lösungen wie Datenbankabfragen in ihren Programmen zu verwenden.
Gemini und ChatGPT kennt jeder, aber Grok, Sonnet und Co. sind ebenfalls unverzichtbar. Sie sind wie Menschen, die man alternativ befragen kann. Jeder mit eigenen Eigenschaften und unterschiedlichem Verhalten. Es ist zu beobachten, dass die ersten kostenfreien API Versionen und KI LLMs auf den Markt kommen, was Programmierer heute schon nutzen, wird der Standard für alle.
Viele Arbeitsplätze können zu 100% ersetzt werden. Als Nutzer von KI haben sie Vorteile, aber auch das verwenden von KI kann einfach automatisiert werden. Ich gehe davon aus, dass 95% alle Büroarbeiten in den kommenden Jahren durch KI ersetzt werden. Alles was sie können, kann eine KI besser und schneller.
Bill Gates hat vorausgesagt, dass nur Handwerker, Soziale Berufe und Bildung als Berufe überleben werden. Auch Programmierer sind keine Gewinner, so hat Meta 3500 Entwickler entlassen. Komponisten, Grafiker, Autoren… überflüssig. Dieses Rad dreht keiner von uns jemals wieder zurück.
Die Welt ordnet sich neu und daher muss die Zukunft schon jetzt erkannt werden! Noch braucht es dafür unglaubliche Rechenleistung, aber schon in einigen Jahren könnten zumindest einfachere LLMs auch lokal auf unseren Geräten laufen.
Stell dir vor, jeder kann alles! Dann wird klar, dass nur noch Leistung einen Gegenwert darstellen kann. Diese Denkweise ist mein Antrieb. Davon hängen alle meine Empfehlungen ab.
Erhalte einen kleinen Überblick über die von mir täglich verwendeten KI Tools. Diese umfassen im wesentlichen…
Programmierung, Information, Grafik, Musik, Web, Fotografie
Cursor AI
https://cursor.com/
Cursor ist die Programmierung von morgen schon heute. Schnell, Effizent und sprachübergreifend kann man mit verschiendensten KIs im Ask oder Agent Modus seine Ideen umsetzen und so selbst komplexeste Softwareideen umsetzen. Kleine Projekte können auch ohne Programmierkenntnisse umgesetzt werden. Große Projekte erfern noch eintiefgreifendes Verständnis dafür, wie Programme aufgebaut werden. Cursor erledit oft sehr komplexe Aufgaben in wenigen Minuten, wohin einfache Aufgaben oft auch Stunden erfordern. Dennoch erhöht es die Effizienz in der Programmierung und ein vielfaches:
- Entwicklung von machOS Anwendungen
- Entwicklung interaktiver Webinhalte
- Entwicklung mit Svelte, Supabase, Vercel
Google Gemimi
Durch die Arbeit mit Agents und APIs hat sich Google Gemini für mich zum perfekten AI LLM entwickeln. Es ist schnell, leistugnsstark für für Entwickler kostenfrei. So können eigene KI Tools einfach und kosteneffizien entwickelt werden. Für die meisten Anwendungen ist Gemini die beste Wahl und wietet mit Falsh 1.5 bis 2.5 ausgereifte Sprachmodelle. In Bezug auf Bildgenerierung liefert Gemini derzeit die höchsten Auflösungen mit wirklich sehr guten Ergennissen. Mit VEO3 hat google auch die beste Videogenerierung. Google ist also auf dem besten Weg.
- API: Google stellt Entwicklern ihre API kostenfrei zur Verfügung, somit ist es das TOP LLM für mich.
- Bildgenerierung: Google bietet derzeit KI Bilder mit der höchsten Auflösung
- Textgenerierung: Gedichte, Code, Drehbücher, Musikstücke, E-Mails, Briefe usw.
- Informationsbeschaffung: Sachthemen recherchieren und zusammenfassen.
- Fragenbeantwortung: Informative und umfassende Antworten auf einfache und komplexe Fragen.
- Übersetzung: Texte zwischen verschiedenen Sprachen übersetzen.
- Ideenfindung: Unterstützung bei Brainstorming, kreativen Lösungen und Gedanken ordnen.
ChatGPT
Das wohl bekannteste KI Tool ist die erste Anlaufstelle für Textgenerierung aller Art. Wir verwenden es unter anderem als:
- Ideenratgeber für Themen aller Art
- Generierung von Promts für Midjourney
- Generierung von Keywords und Texten
- Erstellung von rechtlichen Texten
- Entwicklung von HTML, CSS und Javascript
- Verfassen von Blogartikeln und kleinen Geschichten
- Zielführende kurze Erklärung von Software, Funktionen…
- Erstellung von Listen
- Schreiben von Songtexten
Suno für Audioinhalte
Es gibt einige KIs, die Musik erstellen können. Suno ist dabei eine der am weitesten entwickelten Audiogeneratoren. Es erstellt Musik in allen Sprachen und Genres. Die Bedienung ist sehr einfach und erlaubt eigene Lyrics. Es werden dabei immer 2 Versionen generiert, die erweitert und auch beliebig verändert werden können.
Neben Songs mit Lyrics lassen sich auch reine Instrumentalstücke erstellen. Ich erstellte früher auch eigene Musik und kann daher sagen, daß diese Art der Musikerstellung aus mehreren Gründen die Musikwelt verändern wird. Ideenfindung, Text und unterschliedliche Musikstil-Versionen, individuelle Musik für Filme ohne Rechteprobleme.
Bereits ein kleiner Account reicht aus, um damit unzählige eigene Musikstück zu entwickeln. Es ist einfach, für jeden, sehr gute Qualität, bietet Spurseparation (Stems), erlaubt nachträgliche Änderungen (Wörter, Texte, Genres…) u.v.m. Im Musikbereich lässt Suno keine Wünsche offen.
Midjouney
Wir nutzen Midjourney seit Version 3 und damit seit Anfang an, auch für gewerbliche Projekte und zur Generierung von Stock Content. Es wird mit jeder Version besser und erlaubt seit Version 6 auch Texte in Bildern. Seit Juni 2025 ist auch die Videogenerierung mit dabei, die Inhaltlich sehr gut ist. Die Auflösung ist noch limitiert, so dass für hochauflösende Videos zusätzliche Tools wie Topaz Video AI erforderlich sind. Hier ist Googles VEO3 noch weit überlegen.
Die Bildgenerierung ist sehr gut, aber die anderen LLMs wei Googles Gemini, Grok und Co. haben startk aufgeholt und bieten zum Teil höhere Auflösungen. Midjourney wird also nachlegen müssen, um auch in Zukunft mithalten zu können. Wichtigste ausstehende Punkte sind also hochauflösende, zumindest FullHD Videos, Sprache, Sprachsynchronisation, Bilder Tilt-, Pano-, Zoom Funktionen mit Auflösungserweiterung (ging schon mal in älteren Versionen), Vektorgenerierung (geht z.B. in Cursor) u.v.m.
- Schnelle Umsetzung von Ideen – Final als Vorlage
- Grundlage für weitere Composingarbeiten
- Logoentwürfe
- Illustrationen nach vorgegebenen Inhalten
- Mockup Vorlagen für transparente PNGs
- Schnelle Designgrundlagen / Vorentwurf oder Final
- Webseitenentwürfe
- Aussagekräftige Webseitenbilder unterschiedlichster Themen
- Stock Fotos für Adobe und eigene Projekte
Adobe Firefly:
Firefly ist die Antwort von Adobe zu Midjourney. Es hat sich in kurzer Zeit enorm weiterentwickelt und ist auch fester Bestandteil in Photoshop und Lightroom. Es wird also nicht nur zur Erstellung von Bildern verwendet, sondern kann auch in der Fotobearbeitung gute Dienste leisten. Da Adobe für das Training ausschließlich eigene Fotos oder Fotos aus Adobe Stock für das Training der KI verwendet hat, ist es rechtlich besser aufgestellt als andere generative KIs.
Da es nicht über Discord läuft, sind auch klick Funktionen möglich, was die Bedienung und Integration erleichtert. Ebenso habe ich schon in Videos gesehen, dass auch direkt in die 3D Bilder z.B. für eine eigene Positionierung eingegriffen werden kann.
Photoshop (Beta):
Als Nutzer der ersten Stunde kann ich sagen, dass man schon nach wenigen Stunden nur noch in der beta Version arbeiten wird. Sie hat eine Firefly Integration zum generativen Füllen von Inhalten z.B. für das interaktive Füllen und dem erweitern von Bildinhalten.
Die Qualität und Geschwindigkeit der KI Inhalte ist super und so nutze ich es um z.B. Gesichter, Himmel, weisse Blitzer etc… zu ersetzen. Als Webentwickler habe ich auch schon Fotos zu Bannern umgewandelt und würde ohne dieses Funktionen nicht mehr arbeiten wollen.
Auch die finale Version von Photoshop hat generatives Füllen längst integriert, will man aber gerade in der KI nichts verpassen, so lohnt sich die Arbeit in der Beta Version.
KI Software und Funktionen im Allgemeinen:
KI verwenden wir eigentlich schon immer, aber speziell für Midjourney und Co. ist eine Skalierung, Colorgrading und Konvertierung zu sRGB erforderlich. Daher nutzen wir auch:
- Topaz AI (Gigapixel, Photo, DeNoise, Sharpener)
- Capture One Pro (Farbkorrektur der Monitor RGB in sRGB)
- Photoshop (Objektaustausch, Transparenz, Korrekturen)
- Bridge CC (Schnittstelle, Verschlagwortung, Sortierung)
- Portrait Photo Pro (zur Anpassung normaler Bilder an die KI)
Stable Diffusion:
Das kostenlose Tool entwickelt sich rasant weiter. Hier können eigene 3D Modelle angelernt werden und diese dann auch mit 3D Software passgenau modelliert werden.
Aktuell verwenden wir nur Blockadelabs, da es 360° Bilder erzeugen kann, was in Midjourney aktuell nicht möglich ist.
Culling in Aftershoot und Capture One
Culling und Edit heißen die beiden Zauberwörter in der RAW Bearbeitung von Fotos. Hierzu sind in den letzten Monaten einige Produkte auf den Markt gekommen. Ich habe 3 Verschiedene getestet und bin am Ende, auch wegen des Preises bei Aftershoot gelandet. Aber auch Neurapix wäre interessant gewesen.
Aftershoot bietet zusätzlich Cullung an, was eine automatische Selektion ermöglicht. Dabei werden gleiche Fotos aussortiert, Lächeln, Augen und Schärfe kontrolliert und damit die nach Meinung der KI besten Fotos bewertet. Auch Capture One Pro hat eine solche Culling Funktion, jedoch ohne wirkliche KI Unerstützung.
Verlassen will ich mich aktuell noch nicht darauf, aber es ist sehr schön eine zweite Meinung zu haben. Bei Gruppenbildern liegt Aftershoot tendenziell richtig und das spart am Ende 20% Zeit in der Selektion.
Bei Interesse könnt ihr meinen Afilliate Link nutzen:
https://aftershoot.com/get-started/?referrer=NOCIBR66
KI RAW Edit in Aftershoot und Lightroom
Man kann Aftershoot die eigene Bearbeitung beibringen. Dieses ist vorest über ein Lightroom Kataloge möglich, aber seit Juli 2023 gibt es auch schon die ersten Beta Funktionen für Capture One Pro.
Los gehts mit 2500 antrainierten Bildern, besser sind aber 5000 und gut trainierte Presets haben auch mal 20000 antrainierte Bearbeitungsvarianten.
Die Ergebnisse sind bei selbst antrainierten Presets so gut, dass man nur noch wenige Anpassungen braucht. Einige Fotos sind so gut, dass man nichts mehr machen muss.
KI in der RAW Bearbeitung ist aus meiner Sicht das nächste große Ding, denn es ermöglicht Fotografen auch große Projekte sehr schnell zu bearbeiten. Ich liefere meine Bilder fast immer am gleichen oder nächsten Tag ab. Nur große Hochzeiten ab 2000 Fotos brauchen auch mal 2-3 Tage.
Für was nutzen wir die KI in der Fotografie?
Völlig neue RAW Workflows mit besseren und schnelleren Ergebnissen.
Wie schon vorher kurz aufgeführt sind Culling und Edit dafür verantwortlich, Foto RAW Dateien schneller zu selektieren und zu bearbeiten. Das bringt aktuell einen ca. 20% schnelleren Workflow und somit auch einen Wettbewerbsvorteil gegenüber klassischen Fotografen. Die eingesparte Zeit geht aber bei mir in das verbesserte Editieren mit generativen Bildersetzungen in Photoshop Beta. So bekommt der Kunde für das gleiche Geld wesentlich besseres und konsistenteres Material.
Mit zunehmendem Training der KI Bearbeitung kann sich die Einsparung auch auf 50% erhöhen. Ich persönlich habe recht unterschiedliche Projekte, so dass für das Training auch wesentlich mehr Fotos mit einbezogen werden müssen. Aber auch jetzt schon kann ich sagen, dass der klassische Weg über Capture One, Lightroom und Bridge sich stark verändert hat und in diesem Jahr auch noch wird. Adobe ist mit der KI auf dem Vormarsch, das Entrauschen ist super und schlägt bei weissen Partikeln (durch aufhellen von dunklen Bereichen) aktuell sogar Topaz AI.
Auch aus lizenztechnischen Gründen setze ich aktuell auf die KI. Adobe CC bietet ein Gesamtpaket, das aktuell mehr und mehr Vorteile hervorbringt.
Wenn die 50% Bearbeitungserleichterung erreicht sind, dann wird kein Fotograf mehr ohne diese Möglichkeiten überlebensfähig sein. Zu groß sind die Vorteile derjenigen, die diese Zeit einsparen können. Auch die Kunden werden sich über schnellere Lieferungen freuen.
Für was nutzen wir Ki generierte Bilder aus Midjourney und Co.?
Mockups
Leermodelle werden in vielen Bereichen der gewerblichen Fotografie benötigt. Sie werden meist mit transparenten PNGs erstellt, die später einfach mit einer eigenen Ebene gefüllt werden können. So können Produkte besser und in ansprechender Atmosphäre präsentiert werden.
Wir haben dabei Chat GPT benutzt um Frontalansichten von nicht näher spezifizierten cleanen Räumen zu bekommen. So bekommt man viele unterschiedliche Vorschläge.
Webseiten Banner Hintergründe
Da wir auch Webseiten erstellen brauchen wir immer wieder mal besondere Motive. Neben unserem umfangreichen Portfolio echter Fotos, brauchen wir auch oft plakative Hintergrunde, die meist nur als Hintergrund fungieren. Bei der Erstellung folgt der Idee, die über Chat GPT erstellt wird, schnell eine breite Auswahl an Material. Die Serie Speed of Light ist ebenfalls aus der Idee eines Banners entstanden. Im Portfolio sortieren wir diese Bilder und falls erforderlich erstellen wir auch sehr schnell neues Material.
Tiles – erstelle eigenes Geschenkpapier, 3D Oberflächen und Co.
Background Repeater waren zum Start des Internets weit verbreitet, aber auch in Geschenkpapier und vor allem zum virtuellen bekleben von 3D Objekten braucht man auch heute noch sich wiederholende Muster. Diese lassen sich im Handumdrehen mit beliebigen Ideen füllen und können in jedem Seitenverhältnis erstellt werden.
360° equiregtangulare Fantasiewelten erschaffen
Neben unserer umfangreichen eigenen Austauschhimmel Sammlung setzen wir auch auf künstlich generierte Himmel. Diese können von über 3000px an der langen Kante auf 12584px Kantenlänge skaliert werden, was selbst für große Drucke ausreicht. Möglich wird das durch den Einsatz von Stable Diffusion und einem Tool, das speziell für Landschaften geeignet ist. Durch das weglassen der Landschaften „in the middle of a flat ocean“, kann man komplette 360° Himmel bis zum Horizont erschaffen. Equiregtangulare Panoramen und virtuelle Touren erstellen wir natürlich auch auf klassischem Wege, superschnell in HDR ohne Nadir oder Zenith Löcher – fertig für Ihre Webseite oder digitale Broschüre.
Hier seht Ihr ein Beispiel einer neuseeländischen Landschaft. Sehr schön sind alle Schönheiten Neuseelands auf einem Bild zusammengefaßt als 360° Bild. In der Galerie darunter habe ich 360° Himmel bis zum Horizont erstellt und im vierten Bild auch mit einem Foto kombiniert. Vorteil der Technik ist, dass vor Ort auch 12mm und ein normale Stativ ausreichen um ein vollständiges Panorama zu erstellen.

Natürlich darf es auch mal lustig sein
wie hier in einer Serie zu Selfies. Nichts ist unmöglich, die Idee zählt. Auffallen um jeden Preis, weg von der Langeweile, das kann auch das Ziel einer Kampagne sein.
Vielfalt auch bei problematischen Themen
Mal Ehrlich, was fällt Euch zum Thema Sicherheit ein? Was mit einer Anfrage zum Thema Datenschutz begann wurde schnell zu einem größeren Portfolio. Schön ist dabei, dass es neben fotorealistischen Content auf Illustrationen in den Promt schaffen. Dabei muss sich niemand einen Kopf über die Idee machen. Alle Motive sind frei von ChatGPT erfunden und als Promt generiert. So erweitert man seine eigenen Ideen um ein Vielfaches und schafft in einer Stunde je nach Thema zwischen 10 und 25 Bilder.
Allgemeine Themen auf neutralem Hintergrund
Beliebige Themen auf neutralem Hintergrund in unterschiedlichsten Ausführungen:
Bilder mit Platzhalter
Beliebige Themen mit Platz für Text:
Fotografie und KI ergänzen sich
was in der Fotografie mangels Motive oder aus rechtlichen Gründen nicht möglich ist, kann sehr wahrscheinlich über eine KI erstellt werden. Insbesondere Midjourney liefert fotorealistische Ergebnisse, die kaum von echten Bildern unterschieden werden können. Es wird nie ein Fotoshooting in der Firma oder auf einer Hochzeit ersetzen können, aber allgemeine Motive können sehr schnell umgesetzt werden.
Wie auch in der Fotografie, so werden auch die KI Bilder bearbeitet. Der Aufwand ist in etwa der gleiche.
Gerne könnt Ihr eine kostenfreie Anfrage stellen und wir machen dann Vorschläge. Da wir unser Portfolio fortlaufen vergrößern und auch Stock Agenturen versorgen, kommt es nicht darauf an, ob die Bilder schlussendlich abgenommen werden. In den allermeisten Fällen wird das Ergebnis aber sehr gut sein.
Chat GPT
Was man in Midjourney sehr schön grafisch darstellen kann, das kommt in Chat eher langweilig daher. Die Ergebnisse sind aber beeindruckend. Ein einfaches Beispiel findet man gleich hier auf der Seite:
Vielleicht habt Ihr bemerkt dass die Bilder in der DIVI Gallerie größer werden, kein Overlay mehr haben und auch keine Beschreibungen. Sowas sucht man sich erst mal über Google und YouTube heraus, was auch geklappt hat. Ganz am Ende gab es aber Überlagerungen mit den anderen Bilder bei der Vergrößerung. Solche kleinen Probleme können einen Stunden kosten.
Mit ChatGPT kann man sich unterhalten und so das Problem lösen, die Antworten sind auch erklärt und das macht Chat im Vergleich zu Google und YouTube Tutorials zum klaren Gewinner.
Hier die Lösung meines Problems als 1:1 Kopie der ChatGPT Antwort:
Wenn das Bild nicht in einer Spalte innerhalb des DIVI-Grids enthalten ist, können Sie das Bild in einer „positionierten“ CSS-Box positionieren, um sicherzustellen, dass es innerhalb des umgebenden Elements bleibt und keine anderen Elemente überdeckt.
1. Fügen Sie dem umgebenden Element eine CSS-Klasse hinzu, z.B. „my-image-container“.
2. Fügen Sie den folgenden CSS-Code hinzu:
position: relative;.my-image-container {
overflow: hidden}
.my-image-container img {
transition: all 0.3s ease-in-out;
}
.my-image-container:hover img {
transform: scale(1.2);
}
3. Passen Sie die Klasse und den Selector entsprechend Ihrem Markup an.
Der Code positioniert das Bild innerhalb der umgebenden Box und skaliert es beim Mouseover um 20%. Das „overflow: hidden;“ verhindert, dass das Bild über die Grenzen des umgebenden Elements hinausragt.
Dies sollte das Problem lösen und das Bild innerhalb des umgebenden Elements vergrößern, ohne andere Elemente zu überdecken.
Formeln verstehen
In ChatGPT kann man pro Thema einen eigenen Thread öffnen und innerhalb des Threads erinnert sich die KI an das was man ihr beigebracht hat. Möchte ich als die Midjourney Formel ausgefüllt zurückbekommen, so muss man diese erst beibringen. So wird das Tool immer mächtiger und kann z.B. deutsche Anfragen automatisch in englisch beantworten oder gesperrte Begriffe lernen, damit diese bei kritischen Themen umformuliert werden.
Texte aller Art
Wir nutzen ChatGPT, um Texte zu kürzen, zu übersetzen und in Prompts umzuwandeln. Ende Februar habe ich versucht, einen Tiroler Dialekt-Text mit Google Translate zu übersetzen. Das hat überhaupt nicht funktioniert. ChatGPT hatte bis auf ein Wort alles richtig übersetzt, was aber mit einem Hinweis angelernt werden konnte. Das Kürzen von Texten auf eine beliebige Anzahl von Zeichen funktioniert immer.
ChatGPT kann Songs, Drehbücher, Gedichte, Witze und sogar rechtliche Texte schreiben und erklären. Daher schreiben wir vieles nicht mehr selbst, da das Ergebnis und der Inhalt in der Regel zu 80-90% gut sind und dann von uns selbst überarbeitet werden kann.
Wir haben auch Märchen zu Fotos und Fotos zu Märchen erstellt. Das klappt nahezu immer und die Geschichten sind durchaus gut oder zumindest besser als das, was ich selbst hätte verfassen können.
Wir schreiben auch Keywords mehr für Stockfotos selbst. ChatGPT erstellt diese selbst und mischt sie durch oder fügt sogar auf Wunsch neue hinzu. Es lohnt sich also auf jeden Fall, Formeln und Texte zu verwenden.
Diesen Absatz habe ich von ChatGPT korrigieren lassen, auch das ist eine nützliche Funktion.
Ich dokumentiere fortlaufend meine Test und wer sich für meine Arbeit interessiert, der kann mir gerne auf Facebook folgen:
Lerne die Möglichkeiten von KI selbst kennen und nutze die Vorteile
Gerne geben wir unsere Erfahrungen weiter und analysieren wo in Ihrem Unternehmen potentielle Vorteile bei der Verwendung liegen. Mittlerweile bieten wir zum gesamten Thema auch Firmenschulungen an. Ab Herbst 2023 wird es auch VHS Kurse für Midjourney und ChatGPT geben.
Abgeschlossene Projekte


