No-Code-Builder für KI-Agenten versprechen Geschwindigkeit — und für viele Teams halten sie dieses Versprechen. Ein funktionsfähiger Agent an einem Nachmittag. Ein Sales-Qualifizierungs-Flow noch vor Ende der Woche im Produktivbetrieb. Das fühlt sich nach Fortschritt an — und oft ist es das auch wirklich.
Das Problem zeigt sich sechs Monate später: Der Flow ist auf 40+ Nodes angewachsen, und niemand im Team traut sich, ihn anzufassen. Der Compliance-Verantwortliche fragt, welche Version des Agenten letzen Dienstag eine bestimmte Kundeninteraktion abgewickelt hat. Oder die Frage eines Interessenten liegt 10 % ausserhalb der Trainingsbeispiele, und der gesamte Flow bricht zusammen.
Die Decke ist kein Zeichen mangelnden Ehrgeizes. Diese Plattformen sind solide gebaut. Aber sie wurden für eine bestimmte Klasse von Problemen konzipiert. Wenn Ihre tatsächlichen Anforderungen von dieser Klasse abweichen, kündigen sich die Grenzen von KI-Agenten-Buildern nicht laut an — sie akkumulieren sich still, bis Sie eines Tages im Produktivbetrieb Feuer löschen müssen.
Hier sind die sieben konkreten Wände, gegen die Teams stossen, und die Symptome, die ihnen vorausgehen.
1. Das Flow-Diagramm, das sich selbst auffrisst
Jeder No-Code-Builder ist um eine visuelle Canvas herum aufgebaut. Das ist der Verkaufsargument. Aber bedingte Logik ist der Feind visueller Übersichtlichkeit.
Wenn ein Agent 4–5 unterschiedliche Szenarien sauber handhaben muss — mit Fallbacks, Retry-Logik und Edge-Case-Behandlung — expandiert der visuelle Graph schneller, als irgendjemand erwartet hätte. Teams, die mit einem sauberen 12-Node-Flow gestartet sind, verwalten oft etwas, das wie der Liniennetzplan einer Stadt aussieht, in der niemand wohnt.
Die praktische Konsequenz: Nur die Person, die es gebaut hat, versteht es. Wenn diese Person das Unternehmen verlässt oder in den Urlaub fährt, wird der Agent unantastbar. Bugfixes werden verschoben. Verbesserungen hören auf.
Symptom, auf das Sie achten sollten: Ihr Team bezeichnet Abschnitte des Flows nach Farbe, nicht nach Funktion. Niemand kann vollständig erklären, was passiert, wenn ein Schritt fehlschlägt.
2. Mehrstufiges Reasoning bricht an der Grenze
No-Code-Plattformen glänzen bei deterministischen Sequenzen: wenn dies, dann das. Sie sind deutlich schwächer, wenn es darum geht, Agenten zu unterstützen, die über mehrere Schritte hinweg denken müssen — Kontext aufrechterhalten, Zwischenergebnisse abwägen oder die Strategie mitten in der Ausführung anpassen.
Der architektonische Grund ist einfach: Die meisten Builder verbinden diskrete Nodes mit linearen Übergaben. Es gibt keinen nativen Mechanismus, mit dem ein Agent bei der Auswertung von Schritt sieben auf Schritt drei “zurückblicken” kann, oder um nuancierte Absichten durch eine Kette von Tool-Aufrufen zu transportieren. Man kann das mit grossen Prompt-Injektionen oder intermediären Datenspeichern umgehen, aber jeder Workaround erhöht die Komplexität und senkt die Zuverlässigkeit.
Mehrstufiges Reasoning ist genau das, was KI-Agenten in realen Geschäftsprozessen wertvoll macht. Ein Kundensupport-Agent, der drei vorangegangene Interaktionen nicht zu einer kohärenten Lösung synthetisieren kann, ist kaum besser als ein Entscheidungsbaum.
Symptom, auf das Sie achten sollten: Sie fügen in Prompt-Nodes immer mehr Kontext hinzu, um den Zustand zu kompensieren, den die Plattform nicht nativ halten kann.
3. Ihre internen Daten sind erstklassige Bürger — bis sie es nicht mehr sind
Die meisten No-Code-Builder für KI-Agenten haben eingebaute Konnektoren für gängige SaaS-Tools: Salesforce, HubSpot, Google Workspace, Slack. Diese funktionieren gut. Das Problem beginnt, wenn Ihre wichtigsten Daten woanders liegen.
Ein proprietäres ERP. Eine Legacy-Datenbank, die der Rest des Stacks per SQL abfragt. Ein reguliertes Data Warehouse, das nicht über eine Drittanbieter-Cloud geroutet werden darf. Eine interne API, die nicht in der Konnektor-Bibliothek der Plattform vorhanden ist.
An diesem Punkt stehen Sie vor einer Wahl: einen benutzerdefinierten Konnektor innerhalb der Plattform bauen und warten (was sich oft anfühlt wie echte Entwicklungsarbeit in einer Umgebung, die dafür nicht ausgelegt ist), oder akzeptieren, dass Ihr Agent ohne Zugang zu den relevantesten Daten arbeiten wird.
Das ist eine spezifische, unterschätzte Einschränkung für mittelständische Unternehmen. Die Plattformen setzen voraus, dass Sie auf Standardtools laufen. Viele Schweizer KMU und Fertigungsbetriebe tun das nicht.
Symptom, auf das Sie achten sollten: Sie unterhalten einen separaten Datensynchronisationsprozess, um Ihre echten Daten in ein von der Plattform lesbares Format zu bringen. Dass diese Synchronisation lautlos scheitern kann, ist zu einem Geschäftsrisiko geworden.
4. Testing ist ein Nachgedanke (und das werden Sie bereuen)
Professionelle Softwareentwicklung behandelt Testing als erstklassige Anforderung: Unit-Tests, Integrationstests, Regressions-Suites, Staging-Umgebungen. Die besten No-Code-Builder für KI-Agenten bieten eine Art “Test-Modus” — Sie können einen Flow von Anfang bis Ende ausführen und die Ausgabe beobachten.
Was sie selten bieten: wiederholbares, automatisiertes Regressionstesting. Die Möglichkeit, 200 repräsentative Inputs durchzuspielen und zu bestätigen, dass sich der Agent bei allen korrekt verhält. Einen klaren Prozess zum isolierten Testen einer Änderung an Node 7, ohne den gesamten 40-Node-Flow ausführen zu müssen.
Wenn ein Agent echte Kundeninteraktionen verarbeitet — oder schlimmer noch, finanzielle oder compliance-relevante Aktionen auslöst — ist das entscheidend. Eine Änderung an einem Prompt-Node kann das Verhalten zwei Nodes weiter unten still und leise verschlechtern. Ohne systematisches Testing erfahren Sie das erst, wenn ein Kunde sich beschwert. Das Thema sorgfältige Evaluierung wird ausführlich behandelt in KI-Agenten testen: Wie Evals die Automatisierung zuverlässig halten.
Symptom, auf das Sie achten sollten: Sie sind zögerlich, irgendeinen Teil des Agenten zu aktualisieren, weil es keinen sicheren Weg gibt zu überprüfen, dass die Änderung nichts anderes gebrochen hat.
5. Versionskontrolle lebt in einem Changelog, den niemand liest
Verwandt mit Testing, aber eigenständig: Bei den meisten No-Code-Plattformen bedeutet “Versionskontrolle” eine zeitgestempelte Liste von Speicherständen. Zapier und Make fallen in diese Kategorie: Man kann einen Rollback durchführen, aber keinen Diff. Man kann nicht nachverfolgen, welche Version des Agenten einen bestimmten Lauf vor drei Wochen abgewickelt hat. Man kann keine zwei Versionen parallel ausführen, um ihre Ausgaben auf denselben Input zu vergleichen.
Für Systeme, die unter die Hochrisiko-Kategorien von Anhang III des EU AI Acts fallen — Kreditscoring, klinische Entscheidungsunterstützung, Personalauswahl und ähnliche Anwendungsfälle — ist das mehr als ein Ärgernis. (Die meisten Kundendienst-Agenten fallen unter die Kategorie mit begrenztem Risiko nach Artikel 50, die nur Transparenzpflichten unterliegen, nicht dem vollständigen Hochrisiko-Apparat.) Wenn Sie nachweisen müssen, dass Ihr Agent während eines bestimmten Zeitraums innerhalb definierter Parameter operiert hat, ist ein Changelog kein Audit-Trail. Die Governance-Implikationen werden untersucht in KI-Agenten-Governance: Ein praktisches Playbook für KMU.
Die Business- und Enterprise-Tiers von n8n bieten echte Git-basierte Quellcodeverwaltung mit visuellen Diffs — ein bedeutender Schritt vor den meisten No-Code-Plattformen. Der n8n-Vergleichsartikel geht auf die Details ein. Die verbleibende Lücke ist die Ausführungs-Traceability: n8n zeichnet nativ nicht auf, welcher Workflow-Versions-Hash für einen bestimmten vergangenen Lauf aktiv war — genau das, was ein Compliance-Audit typischerweise verlangt.
Symptom, auf das Sie achten sollten: Ein Compliance-Verantwortlicher hat Sie gefragt “Welche Version des Agenten hat diese Interaktion abgewickelt?” — und Sie konnten keine sichere Antwort geben.
6. Latenz, die Sie weder diagnostizieren noch optimieren können
No-Code-Builder für KI-Agenten abstrahieren die Infrastruktur. Das ist überwiegend ein Vorteil — Sie verwalten keine Server. Der Preis ist Intransparenz.
Wenn Ihr Agent langsam wird — und das passiert, insbesondere wenn die Flow-Komplexität wächst, LLM-Aufrufe sich häufen und Datenabruf-Schritte sich stapeln — haben Sie begrenzte Werkzeuge zur Diagnose. Die Ausführungsprotokolle der Plattform zeigen Ihnen, was passiert ist; selten helfen sie Ihnen zu verstehen, was Sie dagegen tun sollten.
Für kundenseitige Agenten, die Interaktionen in Echtzeit verarbeiten, ist Latenz kein nachrangiges Anliegen. Übermässige Antwortzeiten verschlechtern die Nutzererfahrung konsequent — ein Problem, das sehr schwer zu diagnostizieren oder zu beheben ist, wenn die Plattform die Infrastruktur abstrahiert. Und weil No-Code-Builder zwischen Ihnen und dieser Infrastruktur sitzen, sind die Optimierungsmöglichkeiten begrenzt: Sie können Schritte entfernen oder für einen höheren Tier zahlen.
Symptom, auf das Sie achten sollten: Sie entfernen Funktionen aus Ihrem Agenten — Dinge, die die Qualität genuinvverbessern würden — weil deren Hinzufügen ihn für eine akzeptable UX zu langsam macht.
7. Compliance-Anforderungen, für die die Plattform nicht ausgelegt wurde
Datenresidenz. DSGVO-Verarbeitungsverzeichnisse. nDSG-Anforderungen für die Datenbearbeitung in der Schweiz. Rollenbasierter Zugriff, der Ihre tatsächliche Organisationsstruktur widerspiegelt.
Die meisten No-Code-Plattformen für KI-Agenten richten sich an einen globalen Markt mit einer vernünftigen Compliance-Basispostur. Sie sind nicht für die spezifischen Anforderungen eines regulierten europäischen Unternehmens konzipiert. Kundendaten werden über Infrastruktur geleitet, die Sie nicht vollständig kontrollieren. Sie können nicht immer angeben, welche Cloud-Region sensible Interaktionen verarbeitet. Audit-Logs sind das, was die Plattform generiert — nicht unbedingt das, was Ihr Compliance-Framework verlangt. DSGVO-Löschanfragen können den Agentenspeicher auf Weisen betreffen, die die Dokumentation der Plattform nicht adressiert.
Das ist eine der am meisten unterschätzten Einschränkungen im Schweizer und EU-Markt. Die Annahmen, die in US-amerikanische Plattformen eingebaut sind, über das, was “konform” bedeutet, lassen sich nicht immer übertragen.
Symptom, auf das Sie achten sollten: Sie schliessen sensible Daten aus Ihrem Agenten aus, weil Sie nicht sicher sind, was die Plattform damit macht — was den Agenten weniger nützlich macht, als er sein sollte.
Wie Sie erkennen, ob Sie wirklich an der Decke angelangt sind (und nicht nur eine schlechte Woche haben)
Ein schwieriger Flow bedeutet nicht, dass Sie Custom-Entwicklung brauchen. Jede Plattform hat ihre rauen Kanten. Das Signal, auf das es sich lohnt zu reagieren, ist ein Muster über mehrere der obigen Punkte hinweg:
- Zwei oder mehr dieser Symptome treten gleichzeitig auf
- Sie bauen kompensierende Workarounds, die selbst Wartung erfordern
- Der Agent ist strategisch wichtig genug, dass seine Einschränkungen nun einen Geschäftsprozess limitieren, nicht nur einen internen Workflow
- Die Compliance-Exposition ist real und dokumentiert, nicht theoretisch
Wenn Sie an diesem Punkt angelangt sind, ist das ehrliche Gespräch nicht “auf welche No-Code-Plattform sollten wir wechseln”. Es ist die Build-vs-Buy-Frage — ob der strategische Wert des Anwendungsfalls Custom-Entwicklung rechtfertigt, und was das realistisch kostet.
Was Custom-Entwicklung löst (und was nicht)
Custom-Entwicklung löst die oben beschriebenen strukturellen Probleme. Ihr Agent lebt in Ihrer Infrastruktur. Versionskontrolle ist Git. Testing ist eine Test-Suite, die Ihnen gehört. Latenz kann profiliert und optimiert werden. Daten verlassen nie Ihren Perimeter, es sei denn, Sie routen sie explizit hinaus.
Was es nicht löst: Geschwindigkeit bis zum ersten Prototyp. Ein No-Code-Flow kann als Proof-of-Concept dienen, der Anforderungen klärt, bevor ein Custom Build in Auftrag gegeben wird. Wir haben Kunden erlebt, die einen Zapier-basierten Agenten drei Monate lang im Produktivbetrieb geführt haben, gezielt um herauszufinden, was sie wirklich brauchen — und dann die echte Version in Auftrag gegeben haben. Das ist eine legitime Strategie.
Die sieben Einschränkungen oben sind keine Argumente dafür, Plattformen pauschal aufzugeben. Sie sind ein Diagnosewerkzeug. Wenn Sie No-Code als dauerhafte Lösung für etwas Mission-kritisches einsetzen, ist das der Punkt, an dem die Decken echtes Geld kosten. Wenn Sie es nutzen, um ein Konzept zu de-risken, bevor Sie in die Custom KI-Agenten-Entwicklung investieren, ist das ein vernünftiger Ansatz. Die Antwort wird meist offensichtlich, sobald Sie zählen, wie viele der sieben auf Sie zutreffen.
Wenn zwei oder mehr dieser Decken bekannt klingen, lohnt sich ein fokussiertes Gespräch. Orange ITS bietet einen 30-minütigen Scoping-Call an, um zu beurteilen, wo Ihre aktuelle Agentenarchitektur eingeschränkt ist und was eine Migration — oder ein Custom Build von Grund auf — realistischerweise bedeuten würde. Kein Pitch, nur eine ehrliche Einschätzung Ihrer Situation.