Vier Dateien, die einen Custom-GPT zehnfach besser machen · die Werkstatt-Bauanleitung

Die meisten Custom-GPTs im Mittelstand laufen unter ihrem Potenzial, weil sie als ein einziges Konfigurations-Blob gebaut sind statt als geordneter Stapel. Vier Dateien, jede mit eigener Aufgabe, machen den Unterschied zwischen einer Spielerei und einem zuverlässigen Mitarbeiter im Arbeitsalltag. Wir zeigen die Bauanleitung, ohne Tool-Lob und ohne Geheimnis.

Die Frage, die im AIM-Lehrgang regelmäßig fällt

Im AIM-Lehrgang baut jede Teilnehmerin und jeder Teilnehmer einen eigenen Custom-GPT. Früher oder später kommt die Frage: warum liefert mein GPT manchmal genau das, was ich brauche, und manchmal etwas, das nicht in meinen Arbeitsalltag passt. Die Erklärung steckt selten im Modell. Sie steckt in der Struktur der Konfiguration.

Die meisten Custom-GPTs werden gebaut wie ein einziger langer Brief an einen Praktikanten am ersten Tag. Alles in ein Feld, alles auf einmal. Das Ergebnis ist Output-Variabilität ohne erkennbare Ursache. Wer einen Custom-GPT als Vier-Schichten-Stapel baut, bekommt zuverlässigen Output. Und genau das ist der Bauplan, den wir hier sortieren.

Die kurze Antwort

Ein produktiver Custom-GPT braucht vier Schichten: einen Onboarding-Brief, eine Wissens-Tiefe, einen Präferenz-Speicher und konservierte Workflows. Jede Schicht hat eine eigene Aufgabe, einen eigenen Lebenszyklus und eine eigene Pflege-Disziplin. Wer alle vier baut, holt deutlich mehr aus einer Lizenz, die in vielen Häusern ohnehin schon bezahlt wird.

Schicht 1 · der Onboarding-Brief

Die erste Datei beantwortet drei Fragen, die jede neue Kollegin am ersten Tag hat. Wer ist das Unternehmen, in welchem Ton wird kommuniziert, wie wird hier gearbeitet. Der Onboarding-Brief ist eine einzige Markdown-Datei, im Arbeitsalltag etwa 1.000 bis 3.000 Wörter, nicht größer. Bei Custom-GPTs landet dieser Inhalt im Instructions-Feld, bei Claude-Projekten in den Projekt-Anweisungen, bei eigenen Anwendungen in der Datei agents.md.

Diese Schicht wird vor jeder Aktion gelesen. Sie hat die höchste Pflege-Priorität. Wer hier präzise schreibt, prägt jeden Output. Wer hier Phrasen wie „sei hilfreich und professionell" stehen lässt, akzeptiert Beliebigkeit.

Drei Inhalte sind im Mittelstand verbindlich. Erstens der Geschäfts-Hintergrund: was macht das Unternehmen, für wen, mit welchem Anspruch. Zweitens die Stimme: welche Formulierungen werden gewählt, welche vermieden, welche Anreden gelten intern und extern. Drittens die Arbeitsweise: in welcher Reihenfolge wird gearbeitet, welche Werkzeuge sind erlaubt, welche Qualitäts-Standards gelten vor der Abgabe.

Schicht 2 · die Wissens-Tiefe

Die zweite Schicht ist ein Ordner, kein einzelnes Dokument. Inhalt: alles, was nicht in den Onboarding-Brief passt, aber bei bestimmten Aufgaben gebraucht wird. Kundenhistorien, Vertragsmuster, Wettbewerbs-Analysen, Branchen-Glossare, früheres Projekt-Material. Bei Custom-GPTs sind das die Knowledge-Files, bei Claude-Projekten die Projekt-Dateien, bei eigenen Anwendungen ein context-Verzeichnis.

Wichtige Eigenschaft: diese Schicht wird selektiv geladen. Nicht alles auf einmal, sondern bei Bedarf. Damit bleibt die Token-Last je Konversation beherrschbar. Eine gut gepflegte Wissens-Tiefe im Mittelstand hat zwischen 20 und 200 Dateien, sauber benannt, sauber versioniert, regelmäßig durchforstet.

Die häufigste Fehlkonfiguration in dieser Schicht: alles reinwerfen, was greifbar ist. Das verwässert die Auswahl und macht die Antworten unscharf. Ein bewusst kuratierter Knowledge-Stand mit dreißig präzisen Dokumenten schlägt einen wildgewachsenen Ordner mit dreihundert Dateien im Arbeitsalltag jeden Tag.

Schicht 3 · der Präferenz-Speicher mit Update-Loop

Die dritte Schicht ist klein und wirkt im Alltag spürbar, wenn sie funktioniert. Sie speichert die laufenden Korrekturen aus der Zusammenarbeit. „Wir unterschreiben nicht mit beste Grüße." „Bei Angeboten immer eine offene Frage am Ende." „Niemals den Begriff Lösung in Kundentexten." Diese Korrekturen entstehen im Gespräch, nicht in der Konfiguration.

Bei Claude-Projekten landet das in einer Datei memory.md, die der Agent selbst pflegt. Bei ChatGPT übernimmt die eingebaute Memory-Funktion einen Teil dieser Aufgabe, allerdings ohne Datei-Zugriff für die Teilnehmerin. Bei eigenen Custom-GPTs wird der Update-Loop durch eine explizite Anweisung im Instructions-Feld aktiviert: „Wenn ich dich korrigiere, schreibe die Präferenz in den entsprechenden Abschnitt."

Im DACH-Mittelstand ist diese Schicht datenschutzrechtlich anspruchsvoll. Präferenzen sind personenbezogene Daten, sobald sie einer Person zuzuordnen sind. Das gehört in jede Builder-Praxis und ist im Bauplan ein eigenes Thema, nicht eine Fußnote.

Die DSGVO-Schicht ist Pflicht, nicht Zubehör

Wer einen Präferenz-Speicher im Mittelstand betreibt, braucht eine Lösch-Politik, eine Auftragsverarbeitungs-Logik und eine klare Trennung zwischen Mitarbeitenden-Präferenzen und Geschäfts-Standards. Im AIM-Lehrgang ist das ein eigener Block, nicht ein Hinweis am Rand.

Schicht 4 · konservierte Workflows

Die vierte Schicht ist der eigentliche Hebel. Sie konserviert Vorgänge, die einmal zusammen mit dem Modell durchlaufen wurden. Beispiel aus dem Mittelstand: eine Angebots-Erstellung, die vom Briefing bis zum versendbaren PDF heute vier Stunden kostet, wird einmal Schritt für Schritt mit dem Modell durchgegangen. Die erfolgreichen Schritte werden als Skill konserviert. Beim nächsten Mal genügt eine einzige Anweisung, und der ganze Vorgang läuft ab.

Bei Custom-GPTs ist diese Schicht nur eingeschränkt verfügbar, bei Claude-Projekten und eigenen Anwendungen als skills-Ordner. Die Erfahrung aus realen Bauten: eine Mittelstands-Funktion kommt mit fünf bis fünfzehn Skills weit, jede Skill 200 bis 800 Wörter. Mehr ist selten besser, weil die Skill-Wahl bei wachsender Bibliothek selbst zur Disziplin wird.

Konservierte Workflows sind nicht hypothetisch. Sie entstehen aus echtem Vollzug. Damit sind sie von Anfang an realitätsverankert und schlagen jede ausgedachte Beispiel-Sammlung.

Was die vier Schichten zusammen ausmachen

Die Vier-Schichten-Architektur ist kein Sammelsurium von Dateien. Sie ist ein Persistenz-Stapel mit klarer Hierarchie. Jede Schicht hat einen anderen Lebenszyklus. Der Onboarding-Brief ist statisch und ändert sich selten. Die Wissens-Tiefe wächst kuratiert. Der Präferenz-Speicher wächst durch Praxis. Die Workflows wachsen, wenn neue Vorgänge konserviert werden.

Diese Trennung erleichtert die Pflege. Ein neuer Mitarbeiter, eine neue Produktlinie, eine neue Sprachregelung greift in genau eine Schicht ein, nicht in das gesamte Konstrukt. Damit wird der Custom-GPT skalierungsfähig. Eine Solo-Builderin beginnt mit Schicht 1 und einer ersten Skill. Ein Team erweitert um Wissens-Tiefe und Präferenz-Speicher. Eine Abteilung baut systematische Skill-Bibliotheken. Der Bauplan trägt von einer Person bis fünfzig Personen, ohne dass er sich grundlegend ändert.

Das ist KI-Infrastruktur, im Haus gebaut. Nicht eine zugekaufte Demo, nicht eine eingeschaltete Funktion, sondern ein bewusst geschichteter Stapel, der nach sechs Wochen ohne uns weiterläuft. Genau das ist Output statt Output-Theater.

Wir hatten anderthalb Jahre einen Custom-GPT laufen, der mal ging und mal nicht. Nach dem Umbau auf vier Schichten war derselbe GPT in drei Wochen ein echter Mitarbeiter.
IT-Leitung, Logistikdienstleister, 180 Mitarbeitende

Wann der Vier-Schichten-Bauplan nicht passt

So klar der Bauplan im Builder-Alltag ist, so wenig passt er in jeder Situation. Drei Konstellationen sprechen dagegen.

Wenn die Aufgabe einmalig ist

Wer einen GPT für eine einzelne Auswertung braucht, die danach nie wieder vorkommt, baut keinen Vier-Schichten-Stapel. Eine gute Prompt-Datei und ein paar Beispiele genügen. Die Pflege-Disziplin der vier Schichten zahlt sich erst ab wiederkehrender Nutzung aus.

Wenn keine eigene Builder-Rolle existiert

Wenn niemand im Haus die Datei-Disziplin tragen will oder kann, kippt der Stapel innerhalb von zwei Monaten in einen ungepflegten Zustand. Dann ist die ehrlichere Wahl: ein einfacher Custom-GPT mit gutem Onboarding-Brief, ohne Skills, ohne Präferenz-Speicher, ohne falsche Erwartung.

Wenn die Datenklassen extrem sensibel sind

Präferenz-Speicher und Wissens-Tiefe enthalten oft personenbezogene oder geschäftskritische Daten. Wenn die Datenschutz-Folgenabschätzung für den eingesetzten Anbieter nicht trägt, beginnt der Pfad nicht bei der Bauanleitung, sondern beim Anbieter-Pfad. Diese Entscheidung trifft die Datenschutzbeauftragte mit der Geschäftsführung, nicht die Builder-Rolle allein.

Entscheidungsbaum vor dem nächsten Custom-GPT

Drei Fragen, die im AIM-Lehrgang jede Teilnehmerin vor dem ersten Bau beantwortet.

Werden Sie diesen GPT in den nächsten zwölf Monaten mindestens wöchentlich verwenden, oder ist er eine einmalige Hilfe?
Wer im Haus pflegt die vier Schichten weiter, wenn der Lehrgang vorbei ist und der erste Eifer abebbt?
Welche der vier Schichten enthält personenbezogene oder geschäftskritische Daten, und ist die Datenschutz-Folgenabschätzung dafür fertig?

Wenn die zweite Frage keine klare Antwort hat, ist die nächste Investition keine GPT-Konfiguration, sondern persönliche KI-Kompetenz im Arbeitsalltag der Schlüsselrolle, die den Stapel tragen soll.

Fazit · der Stapel macht den Unterschied

Ein Custom-GPT als Vier-Schichten-Stapel ist kein Geheimwissen und keine Magie. Es ist Disziplin. Jede der vier Dateien löst ein Problem, das im Konfigurations-Blob unsichtbar bleibt: die Tonalität bleibt instabil, die Wissensbasis überlädt sich, die Korrekturen gehen verloren, die Vorgänge werden bei jeder Wiederholung neu erfunden.

Wer den Stapel einmal richtig baut, baut nicht nur einen besseren GPT, sondern lernt eine Architektur, die für jeden weiteren Custom-GPT, jedes Claude-Projekt und jede eigene Anwendung trägt. Das ist die Werkstatt, nicht der Hörsaal.

Im AIM-Lehrgang bauen die Teilnehmenden diesen Stapel über sechs Wochen an einem eigenen Anwendungsfall durch, von Schicht 1 bis zu den konservierten Workflows. Was online geht, geht online. Was Präsenz braucht, machen wir in Hamburg, Frankfurt und Köln, weil die Werkstatt-Arbeit am eigenen Stapel im Webinar nicht stattfindet.