• Digitales Leben

Nano Banana Pro: Großes KI-Update

Endlich Texte in Bildern, 4K-Auflösung und echte Logik: Wir zeigen dir, was das neue "Nano Banana"-Modell kann und warum der Vorgänger jetzt alt aussieht.

Hast du dich schon mal gefragt, warum KI-Bilder bisher schon ziemlich gut aussehen, aber scheitern, sobald ein einfaches Straßenschild oder ein logischer Ablauf im Bild zu sehen sein soll? Damit ist jetzt Schluss. Google hat mit Nano Banana Pro (angetrieben von Gemini 3) ein Update ausgerollt, das nicht einfach nur "hübschere" Bilder macht, sondern versteht, was es zeichnet.
Warnzeichen

Titelbild mit KI erstellt

Das Titelbild wurde natürlich mit Nano Banana Pro erstellt. Der Prompt lautete folgendermaßen:
Du kennst sicher das bekannte Bild, das die Evolution des Menschen darstellt - vom Primaten bis zum Homo Sapiens. Erstelle eine solche Grafik in ähnlichem Stil: Anstatt dass ein Primat oder Mensch im Laufe der Evolution dargestellt wird, soll es sich aber um eine Banane handeln. Anfangs ist sie nicht sehr ansehnlich und stark verpixelt, im Verlauf wird sie aber immer schärfer und ansehnlicher. Es soll immer nur die Banane im Verlauf der Zeit dargestellt sein. Kein Text. Format: 16:9 

Was ist neu? - Die 4 wichtigsten Features

Das neue Modell ist kein kleines Update, sondern eher ein richtiger Generationensprung. Hier die wichtigsten Neuerungen auf einen Blick:
  1. Endlich lesbarer Text: Das wohl größte Manko von KI-Bildgeneratoren wurde behoben. Nano Banana Pro kann Texte (Logos, Schilder, Diagramme) fehlerfrei rendern. Du kannst ihm sagen: "Erstelle ein Neon-Schild mit der Aufschrift 'Open 24/7'" und es steht exakt so dort.
  2. Google Suche Integration (Real-World Knowledge): Das Modell ist nicht mehr in einer Blase gefangen. Es kann auf Echtzeit-Informationen zugreifen. Wenn du nach einer Infografik zu einem aktuellen Sportereignis oder einem Wetterphänomen fragst, nutzt es Faktenwissen aus der Google Suche, um das Bild inhaltlich korrekt aufzubauen.
  3. Konsistenz bei Charakteren: Du möchtest eine Geschichte erzählen? Nano Banana Pro kann das Aussehen einer Person über mehrere Bilder hinweg beibehalten. Dein Protagonist sieht in Bild 1 genauso aus wie in Bild 10.
  4. 4K-Auflösung & "Reasoning": Die Standard-Auflösung wurde massiv erhöht (bis zu 4K). Zudem besitzt das Modell eine Art "visuelles Verständnis" (Reasoning). Es weiß, dass ein Schatten bei Sonnenuntergang lang sein muss oder wie Objekte logisch im Raum zueinander stehen.

Im Vergleich: Nano Banana (alt) vs. Nano Banana Pro (neu)

Im direkten Vergleich wird deutlich, was genau im neuen Modell besser geworden ist.
Feature Nano Banana (Vorgänger) Nano Banana Pro (neu)
Auflösung meist 1.024 x 1.024 Üixel bis zu 4K
Text-Darstellung unleserlich oder Kauderwelsch lesbarer Text, unterschiedliche Schriften
Logik & Details Halluzinationen bei komplexen Händen/Objekten Höheres Verständnis für Physik & Anatomie
Datenbasis Statisches Trainingswissen Zugriff auf Google Search (Live-Daten)
Bearbeitung Globales Ändern des Stils Gezieltes "In-Painting" (z.B. nur die Krawatte ändern)

Nano Banana Pro in der Praxis

Dass das neue Modell schon ziemlich gut ist, kann jeder selbst testen: Einfach die Gemini App am Smartphone öffnen oder im Browser auf gemini.google.com wechseln. Im Promptfeld unter "Tools" wählst du dann Bilder erstellen aus (Bananensymbol). Neugierig? - Hier ein paar Beispiele, die sehr eindrücklich das hohe Potential von Nano Banana verdeutlichen.
-|-
Infografik I

Der Prompt zu dieser Vektorgrafik lautete:
Erstelle eine Infografik über Weihnachtsbäume. Nutze flaches Vektor-Design. In der Grafik sollen die wichtigsten Fakten rund um Weihnachtsbäume in Österreich angeführt werden: Wie viele jedes Jahr gekauft werden, wie lange sie im Durchschnitt in den Haushalten aufgestellt bleiben, wie viele jedes Jahr Ursache für Brände sind, womit sie im Durchschnitt geschmückt werden.

Infografik II

Der Promot lautete so: Erstelle eine Infografik über die österreichische Herren Fußball Nationalmannschaft: Nutze ebenso flaches Vektro-Design. In der Grafik enthalten sein sollen: Eine Statistik zu den letzten 20 Spielen (Siege, Unentschieden, Niederlagen). Außerdem folgende Statistiken:

1. der Spieler mit den meisten Einsatzminuten dieser letzten 20 Spiele

2. der Spieler mit den meisten Scorerpunkten der letzten 20 Spiele

3. der Spieler mit den meisten Toren der letzten 20 Spiele

4. der Spieler mit den meisten Fouls der letzten 20 Spiele

Du kannst gerne noch weitere interessante Fakten über das österreichische ÖFB Team in die Infografik mit aufnehmen. Das Format der Grafik soll 16:9 sein.

Infografik III

Prompt: Erstelle mir eine neue Vektorgrafik, diesmal über Gemini 3. Es soll visualisieren, woher die KI ihre Daten bezieht, wie Inhalte erstellt werden und worauf Benutzer besonders achten sollen. Außerdem sollen generell Daten über die KI Nutzung aufgeführt werden: Wie viele KI-Aufrufe (über alle Plattformen) gibt es täglich, was sind die häufigsten Use Cases, etc.

Zeitreise

Für diese Grafik habe ich zuvor ein Selfie von mir hochgeladen und dann folgenden Prompt verfasst: Erstelle ein 4x4 Raster, das diese Person im Stil jedes Jahrhunderts im Zeitraum 16. - 19. Jahrhunderts zeigt. Die Grafik soll im Format 16:9 angefertigt werden. Schreibe bei jedem Raster dazu, um welches Jahrhundert es sich handelt.

Interessanterweise werde ich mit jedem Jahrhundert dicker :).

Der Fantasie sind kaum Grenzen gesetzt...

der Prompt für dieses Bild (ich habe zuvor ein Selfie von mir hochgeladen) lautete:
Erstelle eine Grafik im 16:9 Format. Die Person im Bild soll als Klemmbaustein Figur dargestellt werden, daneben weitere Klemmbausteinfiguren. Sie schweben in der Kommandokapsel eines Space Shuttles, das ebenso aus Klemmbausteinen gebaut ist. Alle Figuren im Bild trinken gerade entspannt Kaffee.
 

Pixel Art Stil

Auch hier habe ich wieder mein Selfie als Ausgangsmaterial genommen. Der Prompt:
Die Person soll als Dschinn dargestellt werden. Er macht einen entspannten und gelassenen Eindruck. Im Bild außerdem ein paar Menschen, die den Dschinn bestaunen bzw. von dessen Erscheinen verblüfft wirken. Im Hintergrund ist eine endlose Sandwüste mit Dünen zu sehen. Stil: Pixel Art. Format: 16:9. Töne: Warme, einladende Farbtöne.

Aus der Luft gegriffen

Für dieses Bild habe ich Fotos von mir und einem meiner Kollegen hochgeladen und Gemini folgenden Promt mitgegeben:
Zeige beide Personen entspannt an der Bar eines italienischen Kaffees. Sie trinken Espresso. Die Einrichtung ist typisch italienisch. Beide Personen tragen teure, modische italienische Anzüge. Außer den beiden Personen ist niemand zu sehen. Format: 16:9

Schon verblüffend, oder? - Allerdings ist nicht alles Gold, was glänzt: Auch Gemini 3 bzw. Nano Banana Pro machen Fehler. Darauf sollte man vor allem bei Infografiken achten. Es lohnt sich immer, die Quellen zu prüfen (Gemini listet alle Quellen auf) - also sozusagen Check, Recheck, Doublecheck. Sehr interessant ist übrigens auch, dass man sich den "Gedankengang" von Gemini beim Erstellen von Bilder ansehen kann. Hier kann man sich schön ein Bild davon machen, wie eine KI bei der Recherche vorgeht.
Grundsätzlich gilt: Je genauer man das gewünschte Bild beschreibt, desto besser wird das Ergebnis.

Fazit: Bildbearbeitung mit KI wird immer besser

Mich hat das neue Gemini Nano Pro richtig verblüfft. Während der Vorgänger eher wie ein Spielzeug für kreative Experimente wirkte, ist Nano Banana Pro nun ein echtes Werkzeug. Die Fähigkeit, Text korrekt darzustellen und Faktenwissen visuell umzusetzen, macht es für enorm viele Anwendungsfälle extrem praktisch.
Gleichzeitig empfinde ich es als leicht beängstigend, wie rasant die Entwicklung voran geht. Das Nano Banana Modell ist erst seit ein paar Monaten auf dem Markt und hat in unglaublich kurzer Zeit wahnsinnige Entwicklungssprünge gemacht. Dasselbe gilt für Gemini mit Version 3. Wir alle befinden uns gerade in einem gewaltigen Umbruch, dessen Dimensionen vermutlich vielen noch nicht ganz klar sind. Meine Empfehlung: Damit auseinandersetzen und lernen, wie KI funktioniert. Lieber nicht den Anschluss verlieren, sondern mit Neugier und Wissen aktiv darauf zugehen! 
  • Digitales Leben

Schlauer statt schneller: Gemini 3 ist da

  • Digitales Leben

Die größten KI-Gefahren: 5 Tipps für den sicheren Umgang

  • Smartphones

Nano Banana: Next Level Bildbearbeitung

Formular

Öffentliche Seitenkommentare und Antworten

Seitenkommentare