KI-Agenten in der Schleife: Wie sich Claude Code und Codex selbst Aufgaben geben

Loops statt Tippen: So lässt du deine KI-Agenten eigenständig arbeiten
Abstract
- #Claude Code
- #Codex
- #Loops
- #KI-Agenten
- #Automatisierung
- #Goal-Loop
- #Heartbeat
- #Cron
- #Hook
Vom Prompt zur Schleife: KI-Automatisierung einfach erklärt
Stell dir vor, du müsstest deinen Wecker stellen, frühmorgens aufstehen, dich an den Rechner setzen und deinem KI-Agenten von Hand eintippen: "Schau bitte nach, ob neue Aufgaben hereingekommen sind." Genau das tun viele von uns jeden Tag. Doch es geht auch anders.
Statt selbst die Finger zu bemühen, kann ein Agent sich diese Anweisung selbst geben, immer wieder, ganz von allein. Diese Idee steckt hinter dem Begriff "Loop", über den im KI-Umfeld gerade so viel gesprochen wird. In diesem Artikel räume ich mit dem Geheimnis auf und zeige dir Schritt für Schritt, was eine solche Schleife ist und wie du sie in Claude Code und Codex selbst baust.
Was ist ein Loop überhaupt?
Lass uns ganz vorne anfangen, denn der Begriff klingt komplizierter, als er ist. Ein Loop ist im Kern nichts anderes als ein automatisiertes Prompten, also eine Anweisung an die KI, die nicht du, sondern das System selbst auslöst. Mehr steckt erst einmal nicht dahinter. Wer Angst vor einem neuen, geheimnisvollen Paradigma hat, darf aufatmen: Wir reden hier über Automatisierung, wie sie Computer schon lange beherrschen, nur dass am Ende eben eine KI das Steuer übernimmt.
Die Nachricht, so prompten wir bisher
Die meisten von uns kennen nur eine einzige Art, mit einem Agenten zu sprechen: die Nachricht. Du öffnest ein Chatfenster, tippst deine Frage ein, wartest auf die Antwort und schreibst die nächste. Das ist ein von Menschen ausgelöstes, abwechselndes Gespräch, Frage, Antwort, Frage, Antwort. Diese Form hat durchaus ihre Berechtigung, und ich nutze sie selbst täglich. Aber sie ist eben nicht das, was wir meinen, wenn wir von Loops sprechen.
Heartbeat, Cron und Hook, Automatisierung von gestern
Bei einem Loop tritt an die Stelle deiner tippenden Hand ein Auslöser. Davon gibt es mehrere Sorten, und drei davon sind so alt wie die Computertechnik selbst. Da wäre zunächst der Herzschlag, auf Englisch "Heartbeat". Wie ein Puls schlägt er in regelmäßigen Abständen, alle fünf Minuten, jede Stunde. Bei jedem Schlag stößt er eine Aufgabe an, etwa: "Prüfe alle fünf Minuten, ob ein neues Ticket vorliegt."
Der zweite Auslöser heißt Cron. Er ähnelt dem Herzschlag, ist aber genauer terminiert: nicht einfach "regelmäßig", sondern "jeden Sonntagabend" oder "täglich um zehn Uhr". Denk an einen festen Kalendereintrag statt an einen gleichmäßigen Puls.
Der dritte ist der Hook, ein Haken, der einklinkt, sobald etwas Bestimmtes passiert. Das kann ein internes Ereignis sein, etwa der Start einer neuen Sitzung, oder ein externes, etwa eine eingehende E-Mail, die per Webhook eine Aktion auslöst. All diese Mechanismen gab es lange vor der KI. Neu ist nur, dass sie nicht mehr ein starres Programm starten, sondern einen intelligenten Agenten.
Der Goal-Loop, der Neuling unter den Schleifen
Seit Kurzem gesellt sich ein vierter Typ dazu, der in Claude Code und Codex fest eingebaut ist: das Ziel, der "Goal-Loop". Hier geht es nicht um eine Uhrzeit, sondern um ein Ergebnis. Du gibst dem Agenten einen messbaren Zielzustand vor, und er arbeitet so lange daran, bis dieser erreicht und überprüfbar erfüllt ist, oder bis er nicht mehr weiterkommt. Ein Beispiel: "Überarbeite diesen Code so lange, bis alle Prüfungen grün sind und er bereit zum Ausliefern ist." Der Agent verlässt die Schleife erst, wenn das Ziel steht.
Das "Mitarbeiter-einarbeiten"-Modell
Wofür sollte man so eine Schleife nun überhaupt einsetzen? An dieser Stelle hilft ein einfaches Bild, das die ganze Sache greifbar macht: Beim Entwerfen eines Loops bist du der Vorgesetzte, der eine neue Stelle besetzt. Stell dir vor, du arbeitest eine neue Mitarbeiterin ein.
Zu deiner persönlichen Assistentin könntest du sagen: "Schau jeden Freitag meinen Kalender durch, prüfe, wer Termine abgesagt hat, und schick mir eine kurze Zusammenfassung." Schon hast du einen Loop entworfen, einen wiederkehrenden Auftrag mit fester Aufgabe.
Zu deinem Softwareentwickler sagst du vielleicht: "Prüfe jede Stunde, ob ein offenes Problem ansteht, und kümmere dich darum." Auch das ist ein Loop. Und wenn du anordnest: "Arbeite jede neue Änderung so lange durch, bis sie unsere Qualitätsstandards erfüllt", dann hast du genau jenen Goal-Loop beschrieben, der erst beim erreichten Ziel endet.
Der Trick ist also denkbar einfach: Überall dort, wo sich täglich oder stündlich eine klar umrissene Aufgabe erledigen lässt, lohnt sich eine Schleife. Du musst sie nur einmal einrichten und dann nie wieder selbst auslösen.
Fünf Dinge, die jede gute Schleife braucht
Damit eine solche Automatisierung sauber läuft und sich Agenten nicht gegenseitig ins Gehege kommen, braucht es ein paar Grundlagen. Fünf Bausteine haben sich als unverzichtbar erwiesen.
Work Trees, der eigene Schreibtisch
Der erste Baustein sind sogenannte Work Trees. Man kann sie sich wie einen abgetrennten Schreibtisch vorstellen, an dem ein Agent ungestört arbeitet, ohne den Kollegen die Unterlagen durcheinanderzubringen. Die Arbeit eines jeden Agenten bleibt so sauber in ihrem eigenen Bereich isoliert.
Skills, Plugins und Connectoren
Der zweite Baustein sind Skills, erprobte Handgriffe für wiederkehrende Aufgaben, die der Agent immer auf dieselbe verlässliche Weise ausführt. Hinzu kommen Plugins und Connectoren: Das sind schlicht die Werkzeuge, auf die der Agent zugreifen darf, etwa eine Verbindung zu deinem Code-Verwaltungssystem, zum Kalender oder zu deinem Nachrichtendienst.
Subagenten und Statusverfolgung
Der vierte Baustein sind Subagenten. Damit kann der Hauptagent Teilaufgaben an kleine Helfer auslagern, besonders das Überprüfen von Ergebnissen. Du darfst dir das wie eine Führungskraft mit eigenem Team vorstellen, dessen Mitglieder wiederum eigene Teams führen. Der fünfte und letzte Baustein ist eine Form der Statusverfolgung, eine Art To-do-Liste, in der festgehalten wird, was schon erledigt ist und was noch aussteht. Zusammen ergeben diese fünf Dinge ein System, das einen Auftrag selbstständig anstößt, am Laufen hält und sauber zu Ende bringt.
Praxisbeispiel 1: Der tägliche PR-Wächter als Routine in Claude Code
Genug Theorie, schauen wir uns an, wie das in der Praxis aussieht. In Claude Code heißen diese fest eingerichteten Schleifen offiziell "Routinen" (englisch: Routines). Und hier lohnt sich ein Blick auf einen entscheidenden Unterschied, den die Dokumentation klar macht: Eine Routine ist eine Automatisierung, die du genau einmal einrichtest, mit einem Prompt, einem oder mehreren Repositorys und deinen Connectoren und die anschließend von ganz allein läuft. Das Besondere daran: Sie läuft nicht auf deinem Rechner, sondern auf der Cloud-Infrastruktur von Anthropic. Du darfst deinen Laptop also getrost zuklappen, in den Flieger steigen oder schlafen gehen, die Routine arbeitet trotzdem weiter.
Drei Auslöser für eine Routine
Bevor wir bauen, ist es hilfreich zu wissen, dass eine Routine auf dreierlei Weise anspringen kann. Erstens auf einen Zeitplan hin: stündlich, nächtlich oder wöchentlich, ganz so, wie du es festlegst. Zweitens über einen API-Aufruf: Jede Routine bekommt ihren eigenen Endpunkt samt Zugangstoken, sodass du sie aus deinen eigenen Werkzeugen heraus anstoßen kannst. Und drittens als Reaktion auf ein Ereignis, bislang vor allem auf Ereignisse aus deinem Code-Verwaltungssystem, etwa eine neu geöffnete Änderung. Diese drei Auslöser lassen sich sogar frei miteinander kombinieren. Für unser Beispiel genügt der einfachste und anschaulichste Fall: der feste Zeitplan.
Das Problem: Änderungen, die still vor sich hin altern
Mein erstes Beispiel ist bewusst überschaubar gehalten, denn es eignet sich perfekt zum Einstieg. Das Problem kennt jedes Team, das viel ausliefert: Es sammeln sich offene Code-Änderungen an, die niemand mehr beachtet, und sie altern unbemerkt vor sich hin. Statt nun jeden Morgen selbst eine Sitzung zu öffnen und nachzusehen, lassen wir das eine Routine übernehmen.
Die Routine einrichten
Anlegen lässt sich eine solche Routine entweder bequem im Browser unter der Code-Oberfläche oder direkt im Terminal mit dem Befehl /schedule. Wichtig ist dabei vor allem eines, und die Dokumentation betont es ausdrücklich: Eine Routine läuft völlig eigenständig, ohne dass jemand zwischendurch Nachfragen bestätigt. Deshalb muss der Prompt in sich geschlossen sein und unmissverständlich beschreiben, woran erfolgreiche Arbeit zu erkennen ist. Hier zahlt sich also genau das aus, was wir weiter oben über sorgfältige Formulierungen gelernt haben.
Die Anweisung selbst könnte etwa lauten: Sieh täglich nach, ob Code-Änderungen seit mehr als zwölf Stunden offen sind. Prüfe ihre Reife zum Zusammenführen. Wo etwas zu betreuen ist, bleibe dran, bis alle Prüfungen grün leuchten. Andernfalls schicke eine Zusammenfassung in den passenden Team-Kanal. Als Takt wähle ich den nächtlichen oder täglichen Rhythmus, hinterlege das gewünschte Repository und stelle sicher, dass die nötigen Connectoren, etwa zum Code-Verwaltungssystem und zum Nachrichtendienst, verbunden sind.
Was die Routine danach für mich tut
Ist das eingerichtet, muss ich morgens nicht mehr fragen, was zu tun ist. Zur festgelegten Zeit startet Anthropics Cloud eine frische Sitzung, klont das Repository und arbeitet meinen Prompt selbstständig ab. Am Ende erhalte ich einen aufgeräumten Stapel ausgereifter Änderungen, samt deutlicher Erinnerung an alles, was wir haben liegen lassen. Ein netter Nebeneffekt: Weil Routinen offiziell unterstützt werden, kann ich sie im Browser jederzeit pausieren, bearbeiten oder löschen, und jeder einzelne Lauf bleibt als eigene Sitzung nachvollziehbar.
Ein Wort zu den Grenzen
Damit dir später keine Überraschung blüht, gehört eine Zahl hierher: Routinen zehren genauso an deinem Nutzungskontingent wie gewöhnliche Sitzungen, und obendrein gilt ein tägliches Limit. Im Pro-Tarif sind es bis zu fünf Routinen pro Tag, im Max-Tarif bis zu fünfzehn, im Team- und Enterprise-Tarif bis zu fünfundzwanzig. Wer mehr braucht, kann über zusätzliche Nutzung darüber hinausgehen. Für unseren bescheidenen PR-Wächter, der nur einmal täglich anläuft, ist das jedoch reichlich Spielraum.
Praxisbeispiel 2: Die wöchentliche Skill-Suche als Automatisierung in Codex
Mein zweites Beispiel ist deutlich raffinierter und stammt aus Codex. Dort heißen die fest eingerichteten Schleifen nicht "Routinen", sondern "Automatisierungen" (englisch: Automations). Die Idee dahinter beschreibt die Dokumentation hübsch anschaulich: Eine Automatisierung macht Codex proaktiv. Statt zu warten, bis du wiederkommst und nach dem Stand fragst, kehrt Codex zur festgelegten Zeit von selbst zurück, erledigt die Arbeit und legt dir das Ergebnis zur Durchsicht hin, ideal für alles, was sich regelmäßig wiederholt, etwa einen wöchentlichen Bericht.
Zwei Sorten von Automatisierungen
Bevor wir bauen, lohnt sich ein Blick auf eine Unterscheidung, die in der Dokumentation klar getroffen wird. Es gibt zum einen Thread-Automatisierungen: Sie sind an ein bestehendes Gespräch geknüpft und wecken Codex auf wie ein Herzschlag, damit es immer wieder zur selben Unterhaltung zurückkehrt. Zum anderen gibt es eigenständige Automatisierungen, bei denen jeder Durchlauf für sich steht. Letztere wählt man, wenn die Läufe voneinander unabhängig sein sollen oder die Ergebnisse getrennt als eigene Einträge erscheinen sollen. Für unsere wöchentliche Skill-Suche ist genau das die richtige Wahl.
Erst im Gespräch üben, dann automatisieren
Hier gibt die Dokumentation einen Rat, den ich für Einsteiger für den wichtigsten überhaupt halte: Probiere den Prompt zunächst von Hand in einem ganz normalen Gespräch aus, bevor du ihn zur Automatisierung erhebst. Taste dich also im Dialog mit Codex an die gewünschte Arbeitsweise und das gewünschte Ergebnis heran. Erst wenn beides sitzt, machst du aus der erprobten Aufgabe eine Automatisierung. So vermeidest du, dass eine schlecht formulierte Schleife später unbeaufsichtigt ins Leere läuft.
Die Automatisierung einrichten
Erstellen lässt sich eine Automatisierung bequem aus einem laufenden Gespräch heraus: Du beschreibst die Aufgabe, den Takt und ob sie am bestehenden Thread hängen oder eigene Durchläufe starten soll. Codex kann den Prompt sogar selbst entwerfen und die passende Art auswählen. Wichtig ist dabei, den Prompt dauerhaft zu formulieren, er muss bei jedem Aufwachen klar beschreiben, was zu tun ist, woran sich erkennen lässt, ob es etwas Berichtenswertes gibt, und wann Codex aufhören oder bei dir nachfragen soll.
Praktischerweise zeigt die Dokumentation für genau diese Art von Aufgabe ein passendes Muster. Sinngemäß lautet es: Durchsuche die Sitzungen des vergangenen Tages, und wenn es beim Einsatz bestimmter Fertigkeiten Probleme gab, verbessere diese. Falls wir etwas häufig tun und uns dabei schwertun, lege dafür eine neue Fertigkeit an, aber nur, wenn es einen guten Grund gibt, und sag mir Bescheid, falls du etwas änderst. Für unser Beispiel verfeinere ich diese Vorlage und gebe als Takt den wöchentlichen Rhythmus vor, denn so sammelt sich genug Material für eine sinnvolle Auswertung.
Wenn Codex seine eigenen Fertigkeiten überprüft
Hier wird es richtig spannend, denn nun greifen zwei Bausteine ineinander, die wir weiter oben kennengelernt haben. Fertigkeiten (Skills) können laut Dokumentation selbst wieder Automatisierungen anlegen oder verändern, etwa eine Fertigkeit, die eine Code-Änderung betreut, indem sie über das passende Plugin den Status prüft und auf neue Anmerkungen reagiert. Genau diese Verschachtelung nutze ich aus: Sobald die wöchentliche Automatisierung eine neue, lohnende Fertigkeit erkennt, soll sie diese gleich gegen den Hauptstand des Projekts erproben und mir nur das melden, was sich als brauchbar erwiesen hat. So entsteht aus einer einzigen Schleife ein kleines, sich selbst überprüfendes Geflecht.
Was du dabei im Blick behalten solltest
Damit dir keine bösen Überraschungen blühen, gehören zwei Hinweise aus der Dokumentation hierher. Erstens laufen Automatisierungen unbeaufsichtigt und mit deinen Standard-Einstellungen für die Sandbox, jenen Schutzraum, in dem Codex arbeiten darf. Steht dieser Schutzraum auf "nur lesen", scheitern alle Schritte, die Dateien verändern oder ins Netz greifen wollen. Wer also möchte, dass die Automatisierung tatsächlich etwas anlegt, muss ihr vorher den nötigen Schreibspielraum einräumen. Zweitens können häufige Zeitpläne in Verbindung mit isolierten Arbeitsbereichen mit der Zeit viele solcher Bereiche anhäufen; es lohnt sich also, nicht mehr benötigte Durchläufe regelmäßig zu archivieren. Alle Ergebnisse landen übrigens gesammelt in einem eigenen Eingangsbereich, der "Triage" genannten Übersicht, sodass du sie in Ruhe nacheinander durchsehen kannst.
Wenn Agenten ihre eigenen Agenten erschaffen
Hier wird es richtig spannend. Ich habe der Schleife aufgetragen: Sobald sie eine neue Fertigkeit erkennt, soll sie einen eigenen Thread starten und diese Fertigkeit gegen den Hauptstand des Projekts überprüfen und zwar mit einem klar formulierten Ziel. Damit habe ich eine Schleife gebaut, die selbst wieder Schleifen erzeugt. Tatsächlich sah ich live, wie der Hauptagent einen vielversprechenden Kandidaten fand, einen Subagenten mit eigenem Namen ins Leben rief und ihm ein präzises Validierungsziel mitgab. Dieser kleine Helfer arbeitete in einer eigenen Schleife, bis die Prüfung abgeschlossen war. Nach und nach sprangen weitere Subagenten an, jeder mit seiner eigenen Aufgabe. Eine wöchentliche Routine, die selbstständig ein ganzes Team bildet und es so lange werkeln lässt, bis die Arbeit getan ist.
Wann Loops teuer werden, zwei Warnsignale
So verlockend das alles klingt, es gibt zwei Stolpersteine, auf die ich dich ausdrücklich hinweisen möchte. Der erste: Loops können ins Geld gehen. Eine Schleife, die selbstständig Subagenten startet und in einer Validierungsschleife so lange weiterarbeitet, bis sie eine Schwelle erreicht hat, verbraucht stetig Rechenkapazität und damit Geld. Ist die Schleife schlecht geschrieben oder das Erfolgskriterium zu schwammig, brennt der Agent fleißig Ressourcen, ohne nennenswerten Ertrag zu liefern. Behalte Kosten und Effizienz daher immer im Blick.
Das zweite Warnsignal hängt eng damit zusammen: Gerade bei zielbasierten Schleifen kommt es auf eine messerscharfe Formulierung an. Wenn du nicht genau festlegst, wie Erfolg gemessen wird, wirst du enttäuscht und zahlst obendrein viel für wenig Ergebnis. Mein Rat: Lass den Agenten ruhig seine eigenen Ziele formulieren, denn die zielgenaue Sprache ist eine Kunst für sich. Behandle Loop-Prompts mit deutlich mehr Sorgfalt als ein lockeres Gespräch, bei dem du jederzeit eingreifen kannst.
Fazit
Ein Loop ist am Ende keine Zauberei, sondern nur eine elegante Abkürzung: Statt selbst zu tippen, lässt du deinen Agenten sich selbst prompten, auf einen festen Takt, zu einer bestimmten Zeit, auf ein Ereignis hin oder bis ein klares Ziel erreicht ist. Wer in diese Welt eintauchen möchte, beginnt am besten mit einer harmlosen geplanten Routine wie einer morgendlichen Zusammenfassung und tastet sich von dort aus weiter vor.
Mit den fünf Bausteinen und dem Bild vom einzuarbeitenden Mitarbeiter im Hinterkopf wird aus dem geheimnisvollen Schlagwort schnell ein praktisches Werkzeug. Wenn du dabei Kosten und Zielformulierung im Auge behältst, hast du bald einen ganzen Stab fleißiger Helfer, der für dich arbeitet, während du dich um die wirklich wichtigen Dinge kümmerst.
Häufig gestellte Fragen (FAQ)
Brauche ich Programmierkenntnisse, um meinen ersten Loop einzurichten?
Nein, für den Einstieg nicht. Geplante Routinen wie eine tägliche Zusammenfassung lassen sich auch in den einfacheren Oberflächen einrichten, ohne dass du eine Zeile Code schreibst. Du beschreibst dem Agenten lediglich in normaler Sprache, was er wann tun soll. Erst die komplexeren, zielbasierten Schleifen mit eigenen Subagenten profitieren von etwas technischem Hintergrundwissen.
Worin liegt der Unterschied zwischen einem zeitgesteuerten Loop und einem Goal-Loop?
Ein zeitgesteuerter Loop endet, wenn die Zeit gekommen ist, etwa nach Abschluss seines täglichen Durchlaufs. Ein Goal-Loop hingegen endet erst, wenn ein bestimmtes Ergebnis nachweislich erreicht ist, etwa wenn alle Qualitätsprüfungen bestanden sind. Der erste arbeitet nach dem Kalender, der zweite nach dem Resultat. Genau deshalb sind Goal-Loops auch die anspruchsvolleren von beiden.
Wie verhindere ich, dass ein Loop unnötig viele Ressourcen verbraucht?
Der wichtigste Hebel ist eine präzise Zielformulierung. Lege klar und messbar fest, woran der Agent erkennt, dass er fertig ist, je schärfer das Kriterium, desto weniger läuft er ins Leere. Beginne außerdem mit eng umrissenen, überschaubaren Aufgaben und beobachte die ersten Durchläufe aufmerksam, bevor du der Schleife mehr Freiraum gibst.
- Technologien
- Programmiersprachen
- Tools