OPENAI · AGENT MODE

Beschreib's. ChatGPT klickt's. Für dich.

Agent Mode öffnet Websites, klickt Buttons, füllt Formulare — du gibst eine Aufgabe, der Agent liefert die Bestätigung.

Plus · Pro · Team · Business · Enterprise — auch in DE/EU

Was Agent Mode besonders macht.

Vier Features, die den Unterschied ausmachen zwischen einem AI-Chat und einem echten Browser-Agenten, der für dich klickt.

01 · BROWSER-STEUERUNG

Klickt, scrollt, tippt.

Agent Mode kontrolliert einen echten Browser — Clicks, Form-Inputs, Multi-Tab-Navigation. Keine API, keine Plug-ins, keine Sonderwege. Was du als Mensch klicken könntest, klickt der Agent auch.

02 · MULTI-STEP-WORKFLOWS

Lange Wege ohne dich.

Vom Login bis zur Bestellung — der Agent macht alle Schritte hintereinander, du wartest nur auf die Bestätigung. Vier, fünf oder zehn Klicks: aus deiner Sicht ist es eine Anweisung.

03 · LIVE-BESTÄTIGUNG

Du siehst, was passiert ist.

Jeder Schritt landet als Bestätigung im Chat — mit Buchungsnummer, Screenshot oder Link. Du musst nicht raten, ob er fertig ist.

04 · SICHERER SANDBOX-BROWSER

Eigener Browser, getrennte Daten.

Agent Mode läuft in einem isolierten Browser auf OpenAI-Servern — deine Logins bleiben in deiner Session, deine Daten kreuzen sich nicht. Risiko bleibt minimal.

Wie der Agent wirklich tickt.

01 · Aufgabe

Was bekommt der Agent?

Einen Satz in natürlicher Sprache. Kein Code, kein Flow-Diagramm — nur: Ziel, Datum, Budget. Der Agent plant den Rest.

02 · Browser-Tools

Wie navigiert er?

Click, Type, Read, Navigate — echte Browser-Aktionen in einer sandbox-isolierten Umgebung. Keine API, keine Sonderwege.

03 · Guardrails

Was darf er nicht?

Passwörter lesen, CAPTCHAs lösen, irreversible Aktionen ohne Bestätigung ausführen. Login-Felder werden nicht gespeichert.

04 · Bestätigungs-Trigger

Wann fragt er nach?

Bei Zahlung, persönlichen Daten und irreversiblen Aktionen — der Agent pausiert und zeigt dir den 'Take over browser'-Button.

Vier Aufgaben, die Agent Mode sofort übernimmt.

01 · Restaurant

Tischreservierung

"Buch mir Samstag 20 Uhr einen Tisch für 4." Agent öffnet drei Restaurants, prüft Verfügbarkeit, reserviert beim ersten Treffer — Bestätigung per E-Mail.

02 · Recherche

Side-by-Side-Vergleich

3 Hotels checken, Preise + Reviews auslesen, Tabelle zurückliefern. Statt 45 Minuten Eigenrecherche: eine Anweisung, eine fertige Tabelle.

03 · Einkauf

Lieferdienste-Order

Wocheneinkauf auf dem Lieferdienst: Liste übergeben, Agent wählt Produkte, legt in den Cart — du bestätigst nur die Zahlung.

04 · Formular

Wettkampf-Anmeldung

Formular-Workflows mit mehreren Feldern, Kategorie-Auswahl und Upload: Agent füllt aus, du prüfst einmal — dann Submit.

Dein Agent-Mode-Prompt zum Kopieren.

Dieser Wettbewerber-Snapshot-Prompt ist direkt für Agent Mode gebaut. 15–25 Minuten, fertige Markdown-Tabelle mit Positionierungs-Fazit. Eckige Klammern auf dein Angebot anpassen.

agent-mode.txt
Du bist mein Recherche-Assistent. Erstelle einen vollständigen Wettbewerber-Snapshot für mein Angebot.

## Mein Angebot
[Kurzbeschreibung deines Produkts/Services, z.B. "Social-Media-Management für Coaches, Fokus Instagram + LinkedIn, ab 500 EUR/Monat"]

## Aufgabe
1. Suche die Top 5 direkten Wettbewerber in Deutschland/DACH mit ähnlichem Service.
2. Besuche für jeden die Website und ermittle:
   - Preise (oder Preisspanne / Einstiegspaket)
   - Die 3 kommunizierten USPs
   - Zielgruppe
   - Schwache Stellen (was fehlt, was klingt generisch?)
3. Erstelle eine Tabelle mit allen 5 Anbietern und den obigen Kriterien.
4. Fasse in 3–5 Sätzen zusammen: Wo ist die deutlichste Marktlücke?

## Ausgabe-Format
- Tabelle als Markdown (ich konvertiere danach in XLSX)
- Darunter: Freitext-Zusammenfassung "Meine Positionierungslücke"
- Maximal 12 Websites besuchen — bleib fokussiert

## Einschränkungen
- Ignoriere Anbieter außerhalb DACH
- Wenn keine Preise sichtbar: notiere "Preis auf Anfrage"
- Stoppe nach 30 Minuten und liefere Zwischenergebnis
- Cookie-Banner akzeptieren, Newsletter-Popups schließen

In 3 Schritten loslegen.

01

Aufgabe beschreiben

Schreib in einem Satz, was du erreichen willst — inklusive konkreter Werte (Datum, Anzahl, Budget) und Stop-Bedingungen. Je präziser, desto weniger Rückfragen.

02

Agent zeigt Plan

Agent Mode legt die geplanten Schritte offen. Bei sensiblen Aktionen — Login, Zahlung, persönliche Daten — pausiert er und wartet auf deine Bestätigung.

03

Du genehmigst — fertig

Du klickst „Bestätigen" oder übernimmst den Browser kurz für die Passwort-Eingabe. Der Agent macht den Rest und liefert Buchungsnummer plus Status.

Heute aktivieren, heute delegieren.

Du brauchst keinen Tech-Stack — nur einen ChatGPT-Plus-Account, eine konkrete Aufgabe und 5 Minuten. Der Prompt oben ist ein guter Start, aber die einfachste Aufgabe ist die beste Erste: „Buch mir einen Tisch."

Mehr Tipps auf @till.schae

Häufige Fragen.

Ist ChatGPT Agent Mode in Deutschland und der EU verfügbar?
Ja. Agent Mode ist für alle Plus-, Pro-, Team-, Business- und Enterprise-Accounts in DE/EU freigeschaltet. Du findest ihn über das '+'-Menü im Eingabefeld oder per /agent. Free-Accounts haben keinen Zugriff.
Welchen Plan brauche ich für Agent Mode?
ChatGPT Plus (ca. 20 USD/Monat) reicht für 40 Agent-Tasks/Monat — sinnvoll für gelegentliche Buchungen und Recherchen. Pro (ca. 200 USD/Monat) gibt dir 400 Tasks und ist die richtige Wahl für täglichen Einsatz.
Kann der Agent meine Passwörter sehen?
Nein. Bei Login-Seiten pausiert der Agent und zeigt dir den 'Take over browser'-Button. Du gibst deine Daten selbst ein — der Agent sieht nur, dass du eingeloggt bist. Screenshots von Login-Feldern werden nicht gespeichert.
Ist Agent Mode dasselbe wie Operator?
Operator war der frühere Research-Preview-Name für OpenAIs Browser-Agenten (seit Januar 2025). Am 17. Juli 2025 wurde Operator als 'Agent Mode' direkt in ChatGPT integriert — gleiche Technologie, kein separater Login mehr über operator.chatgpt.com.