Forward Deployed Engineer
Dein KI-Engineer in deiner Codebase — auf Zeit.
Forward Deployed Engineering ist das, was OpenAI, Anthropic und Palantir mit ihren wichtigsten Kunden machen: ein Senior-Engineer wird Teil eures Teams, baut konkrete Features bis Production und verschwindet, sobald ihr eigenständig weitermacht.
ab 200 €/h netto
Forward Deployed Engineer — was bedeutet das eigentlich?
Ein Forward Deployed Engineer (FDE) ist ein erfahrener Software-Engineer, der nicht aus der Ferne berät, sondern direkt in eurer Codebase, eurem Team und eurem Kontext arbeitet. Der Begriff stammt aus dem US-Markt — Palantir hat ihn geprägt, OpenAI, Anthropic, Scale AI und Lovable haben ihn übernommen.
In den USA ist das Modell bei jedem KI-First-Unternehmen Standard. In DACH ist es noch jung — und genau deswegen für euch eine Chance.
vs. klassischer Berater
- schreibt Code, nicht Folien
- sitzt im selben Chat (z. B. Teams) wie das Team
- kennt Codebase, Backlog, Stakeholder
- liefert Features, nicht Empfehlungen
vs. Body-Leasing-Freelancer
- übernimmt Architektur-Verantwortung
- Senior-Expertise statt nur Hände
- dokumentiert und schult
- Ansprechpartner für Strategie
Was ich als FDE konkret tue
LLM-Integration
OpenAI, Anthropic, Azure OpenAI, AWS Bedrock, lokale LLMs. Prompt Engineering, Token-Optimierung, Streaming.
RAG-Systeme
Vector-Stores (pgvector, Pinecone, ChromaDB), Embedding-Strategien, Hybrid-Search, Re-Ranking, Eval-Pipelines.
Agentic Workflows
LangGraph, MCP-Server, Tool-Calling, Multi-Agent-Architekturen, Human-in-the-Loop.
AI-native Features
Chatbots, Co-Piloten, Klassifikatoren, Generatoren — eingebettet in eure bestehende Web-App.
DevOps für KI
Deployment auf Azure / AWS, Observability, Logging für LLMs, Cost-Tracking, Latenz-Optimierung.
Refactoring & Modernisierung
Legacy-Codebase, Migration auf moderne Stacks, AI-assisted Refactoring mit Cursor, Claude Code, Copilot.
Jederzeit kündbar, ohne Vorlauf — ab einem Mindestumfang, damit das Modell für beide Seiten Sinn ergibt.
Ein klares Modell
Stundensatz
- 200 €/h netto — ab einem Mindestumfang von rund 20 Stunden pro Monat
- Brauchst du nur ein paar Stunden für eine Einschätzung? Dann ist das KI-Sparring (ab 300 €/h) der richtige Weg
- Jederzeit kündbar, ohne Vorlauf
- Ideal für: konkrete Features, Architektur, laufende KI-Entwicklung in eurer Codebase
Als Retainer
- Festes monatliches Stundenkontingent für planbare Kapazität
- Mengenrabatt auf den Stundensatz, je nach Umfang
- Planbar, monatlich abgerechnet
- Ideal für: dauerhafte Codebase-Begleitung über mehrere Monate
Wann FDE Sinn ergibt — und wann nicht
Ihr habt ein KI-Feature, das in 4–12 Wochen live muss.
Euer Team kann es nicht alleine in der Zeit — ich werde Teil des Teams, baue es mit, ziehe mich raus, sobald es läuft.
Ihr habt einen funktionierenden Prototypen, aber keinen Weg in Production.
Vom Streamlit-Demo zum skalierbaren System ist ein anderer Berg. Ich kenne diesen Berg — mehrfach erklommen mit imagetocaption.ai und Kundenprojekten.
Ihr wollt KI-Expertise aufbauen, ohne 6 Monate zu rekrutieren.
Statt einen Senior AI Engineer zu hiren (12+ Monate Time-to-Productivity), nehmt ihr mich für 3–6 Monate und schult euer Team parallel.
Wann nicht:
- Ihr braucht primär Strategie, kein Code → Fractional CAIO ist passender
- Ihr habt eine Idee, aber noch keine Klarheit → KI-Workshop ist der erste Schritt
- Ihr braucht reine Body-Leasing-Hände ohne strategischen Anteil → da bin ich schlicht zu teuer; ich vermittle gerne
So starten wir
Erstgespräch
Wir prüfen, ob das FDE-Modell zu eurer Situation passt.
⏱ 30 Min
Discovery
Code-Walkthrough, Stakeholder-Calls, erste Empfehlungen.
⏱ 1–2 Wochen
Angebot & Vertrag
Stundenkontingent, Scope, Start-Termin.
⏱ wenige Tage
Laufendes Engagement
Eure Tools, wöchentliche Calls, Code in eurem Repo.
⏱ je nach Bedarf
„Ein FDE ist nicht der externe Berater, der von draußen reinguckt. Er ist der Senior-Engineer, den du gerade nicht in deinem Team hast — auf Zeit."
— Joshua Heller
Häufige Fragen
Was unterscheidet einen FDE von einem normalen Freelancer?
Ein FDE übernimmt Verantwortung — für Architektur, Code-Qualität, Entscheidungen. Ein klassischer Freelancer arbeitet Tickets ab. Ich tue beides, je nach Kontext, aber der Default ist: ich denke mit, nicht nur runter.
Wie viele Stunden pro Woche bist du da?
Standard sind 10–20 Stunden, das funktioniert für die meisten Setups. Bei intensiven Phasen auch 30–40. Ich gehe nie Vollzeit auf ein einzelnes Engagement — sonst verliert ihr den FDE-Vorteil.
Wo und womit arbeitest du?
Primär remote aus Karlsruhe/Pforzheim, regelmäßig vor Ort im DACH-Raum. Ich arbeite mit den Tools, die ihr habt — Microsoft Teams, GitHub, Cursor, Claude Code, Notion — und bin offen für eure Cloud (Azure, AWS, Supabase, Google Cloud). Alles digital, alles dokumentiert.
Bist du allein, oder bringst du ein Team mit?
In FDE-Engagements bin ich selbst die Person. Bei größeren Engagements ziehe ich nach Absprache TAISC-Engineers hinzu. Aber niemals ohne dich zu fragen.
Was, wenn das Engagement nach 4 Wochen nicht passt?
Du kannst jederzeit aufhören, ohne Vorlauf — abgerechnet werden nur geleistete Stunden. Es gibt nur einen sinnvollen Mindestumfang, damit das Modell funktioniert. Mein Geschäftsmodell baut auf Empfehlungen — ein unzufriedener Kunde ist für mich teurer als ein gekündigter Vertrag.
Hast du Referenzen?
Ja, gerne auf Anfrage und nach Vertraulichkeitsabsprache. Bisherige FDE-artige Engagements: BCT Technology (Logify), i40 (SkillDuck), Bitwerft, Onventis.
Klingt nach dem, was du brauchst?
Lass uns 30 Minuten reden. Wenn FDE nicht passt, sage ich das auch.
Lieber erstmal schreiben? joshuaheller@theaisoftwarecompany.com