Höhere Auflösungen mit Pan und Tilt

Derzeit sind höhere Auflösungen hauptsächlich durch Upscaling möglich. Entweder mit den Methoden von Midjourney oder über Drittanbieter wie Topaz AI. Problem ist dabei, dass sich die native Auflösung des Originalbildes nicht erhöht. Es werden also Pixel dazugerechnet und über verschiedene Methoden nachgeschärft. Qualitativ lassen sich damit mit etwas kritischer Kontrolle die 4-fache Auflösung erreichen.

Besser wäre es jedoch, die Details schon im Ausgangsbild zu haben und dann nicht mehr oder nur 2-fach hochzuskalieren.
Genau das kann man mit Pan und Tilt erreichen und profitiert zusätzlich vom Vorteil, die Bildgestaltung besser kontrollieren zu können.

Die Erstellung dauert etwas länger, aber die Ergebnisse entschädigen.

Pan und Tilt in Midjourney

Mit der Version 5.2 sind nicht nur die Zoom Funktionen hinzugekommen, sondern ganz unscheinbar auch vier Pfeiltasten.

Ein klick auf einen dieser Pfeile erweitert das Bild in die angegebene Richtung. Wählt man also den Pfeil nach rechts, dann wird aus dem quadratischen Bild ein rechteckiges Bild mit mehr Inhalten in angegebener Richtung. Dabei erhält man mit jeder Erweiterung vier Auswahlmöglichkeiten und kann damit auch den weiteren Bildinhalt bestimmen.

Erweitert man nach rechts oder links so kann das dabei generierte neue Bild nur noch nach rechts oder links erweitert werden. Gleiches gilt analog für Erweiterungen nach oben und unten.

Interessant dabei ist, dass sich dabei auch die Auflösung erweitert. Es ist also technisch gesehen eine Panoramafunktion, die neue Inhalte erstellt und selbständig ein stitching (Panoramazusammensetzung) durchführt.

Dieser Schritt kann beliebig oft wiederholt werden, was das Panorama immer breiter bzw. höher werden lässt.

Ticks für höhere Auflösungen mit Pan und Tilt

Will man ein vertikales Format erstellen, so startet man mit einem möglichst breiten hochkant Panorama, z.B. mit einem Seitenverhältnis von 16:9 oder 25:10.

Jetzt kann man mehrmals hintereinander die Inhalte nach oben oder unten hinzufügen und so das größere Bild nach und nach aufbauen. Dabei hat man mit jeder Erweiterung auch die Möglichkeit unterschiedliche Inhalte anzufügen.

Gleiches gilt für Querpanoramen. Dort startet man analog im Hochformat.

Pan Funktion z.B. zur Erstellung hochwertiger Innenräume

Das folgende hochformatige Ausgangsbild wurde sieben mal nach rechts bzw. links verschoben. Dabei ist die native Auflösung ohne Upscaling ist damit auf 3712px x 1312px angewachsen.

Im letzten Bild wurde dann in Photoshop noch ein Bonsei auf dem Tisch ersetzt und das Kissen korrigiert.

Tilt Funktion z.b. zur Erstellung außergewöhnlicher Portraits

Das Bild „Golden Globe“ hatte ich ursprünglich als Web Banner geplant. durch die Erweiterung nach oben und unten ergibt sich ein außergewöhnliches Portrait. Lediglich die Finger passten nicht ganz. Diese wurden mit Photoshop Beta durch einen goldenen Globus ersetzt.

Mit jeder Erweiterung kamen neue Ideen. Barfuß, Schuhe, I-Phone, Globus… am Ende kommt immer ein sehr schönes Bild heraus, das eine bessere Idee und Umsetzung bietet als ein Einzelbild.

Bildinhalt und Bildaussage mit jeder Erweiterung anpassen

„White City“ zeigt, wie sich das Bild mit jeder Erweiterung verändern läßt. So lassen sich auch verschiedene Versionen eines Bildes erstellen.

Vom horizontalen Banner zum vertikalen Bild

Was Midjourney bei zuviel Pan und Tilt erstellt ist immer überraschend. Es scheint irgendwann eine neue Idee zu entwickeln und fügt unvorhersehbare Inhalte hinzu. Ich hatte schon Kopf über Kopf, Bild über Bild oder wie hier ein Kopf unter Wasser.

Tilt und Pan der bessere Zoom?

Ja, da Zoom Out leider die Auflösung nicht erhöht. Dafür erweitert Zoom das Bild in alle Richtungen. Ist also der Inhalt generell zu groß, so bietet sich eine Kombination aus Zoom Out und Tilt bzw. Pan an. Es bedarf einiger Tests und Erfahrungen um die richtigen Proportionen des Ausgangsbildes zu wählen.

Fast Hours erforderlich?

Ja, da die Erstellung in mehreren Schritten erfolgen muss ist eine lange Wartezeit störend. Nach einigen Monaten der Spielerei mit Midjourney hat man aber in der Regel immer Fast Hours zur Verfügung. Wenn ich also ein Banner erstellt habe und das Gefühl habe, dieses eignet sich für ein Panorama, dann gehts los.

Bessere Architektur-Details in Midjourney

Für die meisten Motive braucht es nicht zwingend Tilt oder Pan. Bei Architektur und Innenräumen bietet es aber große Vorteile. Hier noch ein klassisches Beispiel der Technik in typisch cleaner Architektur.

Fazit:

Tilt- und Pan in Midjourney sind sehr mächtige Tools, die sich nicht nur auf die Qualität, sondern auch auf die Idee und den Bildaufbau auswirken.

Die hier gezeigten Beispiele wurden nicht hochskaliert, sondern auf 1920px verkleinert. In den Bildern wurde soweit nichts angegeben auch nichts in Photoshop korrigiert.

Pan und Tilt sind viel mächtiger als angenommen

Nachdem ich hier vor allem die Funktion gezeigt habe, möchte ich hier noch weitere, bereits final bearbeitete Bilder zeigen. Es eignet sich praktisch für alle Stile. Ich möchte zuerst das Beispiel Welder Retro Casting zeigen, das im Stile des Brutalismus erstellt wurde. Ausgehend vom wartenden Schweißer in petrol-farbener Jacke sind mindestens 3 verschiedene finale Bilder entstanden. Mit jeder Erweiterung hat man die Wahl wie sich das Bild weiter entwickelt. Dabei können auch die Prompts verändert werden, damit keine weiteren Schweisser mehr generiert werden. Im Pferderennen ist das ebenso gemacht. der Prompt links und rechts enthält Rocks and Dust und damit findet das Bild einen Abschluss.

Bearbeitet werden die Bilder final aktuell in Capture One. Hier habe ich für Version 4 und 5 eigene Presets erstellt, die die Fotos im Farbton optimieren und auch in den mitten heller macht. Insgesamt ist Version 5 aber schon sehr gut und bedarf weniger Anpassungen als Version 4.