Gemini 3.1: Schärfer Denken - A1 Blog
Die Konkurrenz in der Chatbot-Welt ist groß. Kein Wunder also, dass Google 3 Monate nach erscheinen von Gemini 3.0 nun mit Gemini 3.1 den nächsten Versionssprung vorlegt. Die offensichtlichste Neuerung ist die Integration von Lyria 3 - also der Möglichkeit, via Prompts nun auch Musik zu machen. Das meiste andere passiert unter der Haube, sorgt aber für insgesamt bessere Ergebnisse. Im Überblick das wichtigste zum aktuellen Update.
Das Reasoning Update - mehr Logik, weniger Raten
Der markanteste Unterschied zum Vorgänger 3.0 liegt in der sogenannten Reasoning-Leistung. In internen Benchmarks wie dem ARC-AGI-2 (einem Test für völlig neue logische Muster) hat 3.1 Pro seine Punktzahl auf beeindruckende 77,1 % mehr als verdoppelt. Das bedeutet: Wo Version 3.0 manchmal noch in generischen Antworten verharrte, kann 3.1 komplexe Probleme Schritt für Schritt zerlegen.
Die beeindruckenden Fortschritte zeigen sich in dieser von Google veröffentlichten Tabelle: Hier sieht man, dass Gemini 3.1 in fast allen Benchmarks der Konkurrenz teilweise stark voraus ist. Frage sich nur für wie lange: Es ist wohl nur eine Frage der Zeit, bis die Entwickler der anderen Modelle diesen Rückstand wieder aufgeholt haben werden.
Entwickler und Power-User profitieren zudem von den neuen Thinking Levels. Man kann der KI nun explizit vorgeben, wie viel Rechenzeit sie in eine Antwort investieren soll (Low, Medium, High). Wer eine schnelle Zusammenfassung braucht, wählt Low; wer eine komplexe Software-Architektur plant, schaltet auf High und lässt die KI tief in die Logik-Strukturen abtauchen.
Gemini 3.1 lässt Bilder zu Musik werden
Die augenscheinlichste Neuerung in Gemini 3.1 ist die Integration von Lyria 3: In Gemini kann man nun also ein Foto oder ein Video hochladen und die KI auffordern, passende Musik dazu zu komponieren. Alternativ sagt man ihr via Textprompt, was man haben möchte.Dabei muss der User nicht mal eigene Songtexte schreiben - Lyria generiert sie basierend auf den Prompt selbst. Länger als 30 Sekunden sind die Kreationen nicht. Und Google betont, mit musikalischen Inhalten "verantwortungsvoll" umzugehen: Einerseits gibt es Filter, die die Ausgaben auf bestehende (geschützte) Inhalte prüfen. Andererseits sagt Google, dass Lyria 3 nicht auf das Nachahmen bestehender Künstler ausgelegt wäre. Lyria 3 soll das vielmehr - sobald ein bestimmter Künstler genannt wird - als Basis für eine breite Inspiration nehmen.
Über Geschmack lässt sich streiten - Musik mit Gemini
In mir schlummert wahrlich kein großer Komponist. Zu 100 Prozent bin ich aber vor allem Musik-Konsument. Ich habe mir zum Test von Lyria 3 zwei "Meisterwerke" komponieren lassen. Vorweg: Ohne groß zu überlegen, mit wenig ausgefeilten Prompts. Ich wollte 2 Musikstücke rund um Star Trek erstellen lassen. Dazu habe ich ein Bild der Enterprise aus dieser Quelle hochgeladen und folgende Prompts erstellt:1. Eine futuristische Melodie, während dieses Raumschiff an einem Planeten vorbeifliegt.
2. Beim zweiten Prompt war ich etwas genauer: Das Raumschiff fliegt durch die Galaxis und erforscht unentdeckte Welten. Stil: Space Adventure. Stimmung: heroisch und monumental. Instrumentierung: Klassisches Orchester mit Fokus auf Blechblasinstrumente und Pauken.
2. Beim zweiten Prompt war ich etwas genauer: Das Raumschiff fliegt durch die Galaxis und erforscht unentdeckte Welten. Stil: Space Adventure. Stimmung: heroisch und monumental. Instrumentierung: Klassisches Orchester mit Fokus auf Blechblasinstrumente und Pauken.
Ein kritischer Punkt wird definitiv erfüllt: Das klingt alles wenig nach Star Trek, insofern dürften Googles selbst auferlegte Beschränkungen der Wahrheit entsprechen. Bleibt die Frage, ob die erstellten Inhalten gut sind. Hier entscheidet wohl der persönliche Geschmack. Das Ergebnis an sich hängt - wie bei allen Anfragen an LLMs - in erster Linie vom Prompt ab: Je genauer der Auftrag beschrieben wird, desto besser ist in der Regel auch das Ergebnis.
Seitenkommentare