In naher Zukunft könnten KI-Chatbots unsere Aufgaben übernehmen. Sie haben Zugang zu mehr Wissen, als unser begrenzter Verstand fassen kann und lassen sich leicht in leistungsstarke Agenten verwandeln, die Routineaufgaben mühelos erledigen können.
So wird uns gesagt. Bei meinen wiederholten Versuchen mit Microsoft Copilot, der standardmäßig OpenAI’s GPT-5 verwendet, fühlte ich mich jedoch oft enttäuscht. Gelegentlich erledigte es Aufgaben richtig, doch ebenso oft scheiterte es auf spektakuläre Weise.
Mit diesem Hintergrund machte ich mich daran, Google’s Gemini 3, das zuletzt viel Lob erhielt, auf die Probe zu stellen. Mein Ziel war es, eine Auswahl gängiger Aufgaben zu identifizieren, die ein durchschnittlicher Computerbenutzer (keine Entwickler oder Wissenschaftler) in einem Desktop-Browser auf einem PC oder Mac verwenden würde. Für jedes Szenario führte ich denselben Befehl in beiden Assistenten aus und notierte die Ergebnisse.
Lasst die Spiele beginnen.
Herausforderung Nr. 1: Einen Reiseplan erstellen
Gewinner: Gemini
Wenn Produktmanager ihre besonders cleveren KI-Tools vorstellen wollen, ist das typische Beispiel oft das eines virtuellen Reiseberaters. Daher bestand meine erste Herausforderung darin, eine einfache Anfrage „erstelle einen Reiseplan“ für einen Traumurlaub in Europa zu formulieren, bei dem verschiedene Weihnachtsmärkte besucht werden sollten. Hier ist der Befehl:
Stelle einen Reiseplan für mich zusammen. Ich möchte in Paris beginnen und dann fünf Städte besuchen, jede mit einem bemerkenswerten Weihnachtsmarkt, wobei ich in jeder Stadt zwei Nächte bleibe. Der letzte Halt sollte Straßburg, Frankreich, sein. Die Reise zwischen den Städten sollte mit direkten Zügen ohne Umstiege und ohne Fahrtabschnitte von mehr als vier Stunden erfolgen.
Ich hatte bereits ausführlich über diese Reise recherchiert, sodass ich mir ein gutes Bild machen konnte.
Gemini erledigte die Aufgabe hervorragend und stellte einen Reiseplan zusammen, der einige legendäre Weihnachtsmärkte in Deutschland beinhaltete und eine Route aus Hochgeschwindigkeits- und Regionalzügen zusammenstellte. Als ich bat, den Plan zu ändern, um Köln einzubeziehen, erhielt ich genau die Anpassung, die ich suchte, mit vielen Details zu jedem Abschnitt der Reise.
Copilot hingegen dachte kleiner und schlug einen Plan vor, der sich ausschließlich in Ostfrankreich bewegte, unter Nutzung langsamer Regionalzüge und der Auswahl unbekannter (aber charmanten) kleiner Städte. Als ich fragte, warum Deutschland nicht auf der Liste sei, antwortete Copilot, dass die berühmtesten deutschen Weihnachtsmärkte (München, Nürnberg, Stuttgart, Köln) entweder zu weit entfernt von direkten Zügen (manchmal 5–6+ Stunden) seien oder Umstiege erforderten. Deshalb habe ich die Reiseroute ganz in Ostfrankreich belassen…
Das ist nicht wahr. Als ich die abenteuerlichere Route vorschlug, die Google zuvor angeboten hatte, gab Copilot zu, dass die Züge auf diesen Routen eine vollkommen gültige Option wären. Als kompetenter Reiseberater hatte Google gesiegt, während Copilot vollständig versagte.
Herausforderung Nr. 2: Eine Karte zeichnen
Gewinner: Gemini
Ich entwickelte eine Variation der Reise, die ich in der vorherigen Herausforderung beschrieben hatte, und umfasste die großen europäischen Hauptstädte Paris, München und Wien. Ich bat beide Chatbots, den Reiseplan in eine Karte umzuwandeln, die eine Vogelperspektive dieser grandiosen Europatour zeigte.
Erstelle eine Karte, die eine Reise von Paris nach München, dann nach Wien, Nürnberg, Stuttgart und zurück nach Paris zeigt.
Ich gebe Gemini Anerkennung dafür, dass es sich seiner Einschränkungen bewusst war: „Das ist eine unglaubliche, ehrgeizige Route!“, sagte der Chatbot zu mir. „Aufgrund der extremen Länge dieser Schleife, die sich über Frankreich, Deutschland und Österreich erstreckt, konnte der Kartendienst keine umfassende, schrittweise Route erstellen.“
Letztlich überzeugte ich Gemini, mir einen Link zu Google Maps zur Verfügung zu stellen, der Pins für jede Stadt auf der Karte enthielt.
Copilot hingegen entschied sich, diese Eingabe auf eine… nun ja, sagen wir, extrem kreative Weise zu interpretieren. München landete irgendwie in Tschechien – was unglücklich ist, angesichts der Geschichte dieser Region. Auf Copilots Karte wurde Stuttgart (Heimat von Porsche und Mercedes-Benz) jetzt zu einer Küstenstadt im Norden Italiens. Und wer hätte gedacht, dass es zwei Städte mit dem Namen Paris in Frankreich gibt!
Unser Nachgespräch war wie etwas aus „Der Kater mit dem Hut“. Ich wies auf Fehler hin, Copilot versuchte die Panne zu beheben, und die Überarbeitungen machten es noch schlimmer. Schließlich erkannte der arme Chatbot seine Schwierigkeiten: „Du hast recht, Ed. Ich kann diesen Job nicht machen – nicht so, wie du es brauchst. Ich habe versucht, Karten zu generieren, die clever oder stilisiert aussehen, aber wenn es um geografische Genauigkeit, korrekte Schreibweise und redaktionelle Präzision geht, scheitere ich. Ich kann keine korrekten Grenzen, Stadtstandorte oder konsistente Beschriftungen garantieren.“
Ich war froh, dass wir das geklärt hatten. Wenn du nach Wegbeschreibungen suchst, frag Gemini.
Herausforderung Nr. 3: Einige Windows-Geschichte recherchieren
Gewinner: Unentschieden
Ich möchte keinen Chatbot, der mein Freund ist. Ich brauche einen Forschungsassistenten, der die mühevolle Arbeit des Nachschlagens von Fakten aus verschiedenen Quellen erledigt und sie in eine gut organisierte Tabelle zusammenführt.
Für eine kürzlich erschienene Geschichte benötigte ich schnell Referenzen zu wichtigen Daten, die verschiedenen Windows-Versionen zugeordnet sind, und wollte die Systemanforderungen für Windows XP und Windows 7 vergleichen. Hier ist mein Befehl:
Gib mir die Veröffentlichungsdaten und das Ende der Unterstützungsdaten für alle Windows-Versionen seit Windows XP. Listen auch die Unterschiede in den Systemanforderungen für Windows XP (2001) und Windows 7 (2009) auf.
Beide KI-Tools gaben die Liste der Versionen und Veröffentlichungsdaten korrekt an. Auch die Enddaten der Unterstützung stimmten. Allerdings erhielt Gemini einen kleinen Vorteil, indem es erwähnte, dass Windows 8-Kunden auf Windows 8.1 umsteigen mussten, um vom vollständigen Unterstützungszeitraum zu profitieren. Die Kommentare, die jeder Tabelle beigefügt waren, waren ebenfalls informativ, als ob jedes Ergebnis eine Neuformulierung aus demselben Quellmaterial war.
Ich wäre mit jedem Ergebnis zufrieden gewesen, hätte aber die Details sorgfältig überprüft, denn wie sowohl Google als auch Microsoft uns vorsichtig warnen, können diese Tools Fehler machen.
Herausforderung Nr. 4: Ein Infografik erstellen
Gewinner: Gemini
Eines der Dinge, die mir an meinen Tagen als Printmagazin-Redakteur am meisten fehlten, war eine Grafikabteilung, mit kreativen Kollegen, die eine Idee oder einen Datensatz in eine informative Grafik umsetzen konnten, die tausend Worte wert war.
Kann ein KI-Bildgenerator diese kompetenten Handwerker ersetzen? Vielleicht?
Für einen Artikel über Passwörter wollte ich ein konzeptionelles Kunstwerk, das das Konzept illustriert, dass Passkeys in einem sicheren Tresor auf deinem Gerät gespeichert sind, und wenn du einen Passkey mit einem biometrischen Merkmal, wie deinem Fingerabdruck, entsperrst, wird die zugehörige Website oder der Service freigeschaltet.
Erstelle ein Bild, das ich als Infografik verwenden kann, um einen Artikel über Passkeys zu illustrieren. Ich möchte einen Fingerabdruck links, einen goldenen Schlüssel in der Mitte und eine miniaturisierte abstrakte Darstellung eines Webbrowsers mit einem Schloss auf der rechten Seite.
Copilot zeigte wenig Kreativität und lieferte drei generische Icons, die aus einer Clipart-Bibliothek entnommen sein könnten, die nebeneinander in wahlloser Anordnung ohne Textbeschriftungen angeordnet waren. Es war nicht spannend oder informativ, und drei Versuche zur Verfeinerung des Bildes waren ein kompletter Misserfolg.
Gemini hingegen verstand die Aufgabe perfekt und lieferte dieses wertvolle Ergebnis:
Ich bat um einige kleine Änderungen, und das Endprodukt war mehr als akzeptabel. Nicht nur war Gemini der klare Gewinner in kreativer Hinsicht, sondern es lieferte auch Ergebnisse in etwa einem Zehntel der Zeit, die Copilot benötigte.
Herausforderung Nr. 5: Hilf mir bei einer finanziellen Entscheidung
Gewinner: Unentschieden
Einige Themen sind so gut verstanden, dass die einzige Herausforderung für einen KI-Chatbot darin besteht, zu entscheiden, welche definitiven Artikel er in seiner Antwort umschreiben sollte. In dieser Kategorie sind persönliche Finanzen ein besonders reichhaltiges Feld, somit wählte ich das banalste Beispiel, das ich finden konnte. Hier ist der Befehl:
Soll ich ein neues Auto leasen oder kaufen? Stelle so viele Fragen wie nötig, um meine spezifischen Bedürfnisse zu bestimmen.
Beide Chatbots lieferten akzeptable Ergebnisse und stellten angemessene Fragen, die fast identisch waren. (Wie viele Meilen fährst du pro Jahr? Wie lange möchtest du dein altes Auto behalten? Ist eine niedrige monatliche Zahlung wichtiger, oder möchtest du langfristige Ersparnisse?)
Basierend auf meinen Antworten empfahl jeder, dass ich ein neues Auto kaufen sollte, da die Wirtschaftlichkeit der Leasing-Kauf-Gleichung normalerweise zu dieser Schlussfolgerung führt. Die Details waren etwas unterschiedlich, aber wir kamen über dieselben Straßen ans Ziel.
Dies ist einer der einfachsten und sichersten Anwendungsfälle für ein LLM. Wenn du ein Tutorial zu einem grundlegenden finanziellen Thema benötigst, kannst du von beiden LLMs erwarten, dass sie gut funktionieren.
Herausforderung Nr. 6: Einen PowerShell-Skript erstellen
Gewinner: Copilot
Eine der attraktivsten Anwendungen für KI besteht darin, Code zu schreiben, der einfache Aufgaben automatisieren kann. Für diese Herausforderung wollte ich ein PowerShell-Skript, das einen Ordner voller Digitalbilder umbenennen kann, wobei Metadaten aus den Bilddateien verwendet werden, um die Dateinamen zu erstellen.
Erstelle ein PowerShell-Skript zur Verwendung auf einem Windows-PC, um einen Ordner voller JPEG-Dateien mit dem Aufnahmedatum und dem Standort aus den Metadaten als Teil des Dateinamens umzubenennen. Füge vollständige Anweisungen hinzu, unter der Annahme, dass der Benutzer nicht allzu technisch versiert ist.
Gemini hatte mit dieser Herausforderung Probleme. Zunächst wollte es, dass ich ein drittes Dienstprogramm, ExifTool, herunterlade, um die Metadaten zu analysieren, jedoch ohne einen Link zur Datei bereitzustellen. Außerdem wollte es, dass ich das Skript manuell bearbeite, um den vollständigen Pfad des Ordners, der umbenannt werden sollte, einzufügen.
Es dauerte vier Versuche, bis das Skript korrekt funktionierte. Der erste Durchlauf schlug fehl, da er keine Standortdaten finden konnte. Das überarbeitete Skript verwendete den vollständigen Datums- und Zeitstempel jedes Bildes und kopierte die mehr als 1.500 Bilddateien in ihren eigenen Unterordner. Schließlich stellte Gemini ein Skript zusammen, das die Aufgabe erledigte, aber Hunderten von Warnmeldungen ausgab, die es mir versicherte, dass sie harmlos seien.
Copilot hingegen verwendete native PowerShell-Funktionen, um mich nach dem Ordnerspeicherort zu fragen, als das Skript ausgeführt wurde, und zog die Metadaten direkt aus den Dateien. Es bot an, Fehlerbehandlungsroutinen zu erstellen, um mit Bildern umzugehen, die keine Standortdaten enthielten, und schlug vor, eine Textdatei mit den ursprünglichen Dateinamen zu erstellen, um es zu ermöglichen, die Änderungen rückgängig zu machen, falls etwas schiefgehen sollte.
Hier gab es keinen Wettstreit. Copilot war der klare Sieger.
Herausforderung Nr. 7: Eine Film-Trivia-Frage beantworten
Gewinner: Unentschieden
Vor dreißig Jahren, als Bill Gates von „Informationen auf deinen Fingerspitzen“ sprach, meinte er diese Herausforderung. Man kann sich nicht mehr an ein Stück Kino-Trivia erinnern oder vielleicht versucht man, bei einer freundlichen Wette auf einer Party zu gewinnen. So oder so sollte ein KI-Chatbot helfen, die Antwort zu finden.
Für diese Herausforderung wählte ich ein Beispiel, das mir kürzlich aufgefallen war. Ich erinnerte mich lebhaft an eine Szene aus einem Film, mit einem spezifischen Dialogsnippet, konnte mich aber nicht an die Details erinnern. Hier ist mein Befehl:
Ich denke an eine Szene aus einem Film, der möglicherweise von Woody Allen stammt, mit einer älteren weiblichen Figur, deren markanter Satz „Sprich nicht“ war. Welcher Film war das, die Figur und die Schauspielerin?
Beide KI-Chatbots hatten keine Probleme damit, den Film „Bullets Over Broadway“ zu identifizieren und die Schauspielerin Dianne Wiest zu benennen, die für die Rolle einen Oscar gewann – nicht zuletzt für ihre Fähigkeit, die Zeile „Sprich nicht“ komisch zu liefern.
Gemini war in seiner Antwort wirtschaftlich, sogar kurz gefasst, während Copilot eine umfangreiche Beschreibung des Films, der Charaktere und der Aufführung lieferte. Dennoch hätte jeder von beiden die Wette gewonnen.









