Forward Deployed Engineer

Dein KI-Engineer in deiner Codebase — auf Zeit.

Forward Deployed Engineering ist das, was OpenAI, Anthropic und Palantir mit ihren wichtigsten Kunden machen: ein Senior-Engineer wird Teil eures Teams, baut konkrete Features bis Production und verschwindet, sobald ihr eigenständig weitermacht.

ab 200 €/h netto

Erstgespräch vereinbaren → So funktioniert's

Dein KI-Engineer in deiner Codebase — auf Zeit.

Forward Deployed Engineer — was bedeutet das eigentlich?

Ein Forward Deployed Engineer (FDE) ist ein erfahrener Software-Engineer, der nicht aus der Ferne berät, sondern direkt in eurer Codebase, eurem Team und eurem Kontext arbeitet. Der Begriff stammt aus dem US-Markt — Palantir hat ihn geprägt, OpenAI, Anthropic, Scale AI und Lovable haben ihn übernommen.

In den USA ist das Modell bei jedem KI-First-Unternehmen Standard. In DACH ist es noch jung — und genau deswegen für euch eine Chance.

vs. klassischer Berater

schreibt Code, nicht Folien
sitzt im selben Chat (z. B. Teams) wie das Team
kennt Codebase, Backlog, Stakeholder
liefert Features, nicht Empfehlungen

vs. Body-Leasing-Freelancer

übernimmt Architektur-Verantwortung
Senior-Expertise statt nur Hände
dokumentiert und schult
Ansprechpartner für Strategie

Was ich als FDE konkret tue

LLM-Integration

OpenAI, Anthropic, Azure OpenAI, AWS Bedrock, lokale LLMs. Prompt Engineering, Token-Optimierung, Streaming.

RAG-Systeme

Vector-Stores (pgvector, Pinecone, ChromaDB), Embedding-Strategien, Hybrid-Search, Re-Ranking, Eval-Pipelines.

Agentic Workflows

LangGraph, MCP-Server, Tool-Calling, Multi-Agent-Architekturen, Human-in-the-Loop.

AI-native Features

Chatbots, Co-Piloten, Klassifikatoren, Generatoren — eingebettet in eure bestehende Web-App.

DevOps für KI

Deployment auf Azure / AWS, Observability, Logging für LLMs, Cost-Tracking, Latenz-Optimierung.

Refactoring & Modernisierung

Legacy-Codebase, Migration auf moderne Stacks, AI-assisted Refactoring mit Cursor, Claude Code, Copilot.

ab 200 €/h

Stundensatz netto

ab 20 h

Mindestumfang pro Monat

Retainer

planbar, mit Mengenrabatt

Senior

5+ Jahre Software, 3 Jahre KI exklusiv

Jederzeit kündbar, ohne Vorlauf — ab einem Mindestumfang, damit das Modell für beide Seiten Sinn ergibt.

Ein klares Modell

Stundensatz

200 €/h netto — ab einem Mindestumfang von rund 20 Stunden pro Monat
Brauchst du nur ein paar Stunden für eine Einschätzung? Dann ist das KI-Sparring (ab 300 €/h) der richtige Weg
Jederzeit kündbar, ohne Vorlauf
Ideal für: konkrete Features, Architektur, laufende KI-Entwicklung in eurer Codebase

Als Retainer

Festes monatliches Stundenkontingent für planbare Kapazität
Mengenrabatt auf den Stundensatz, je nach Umfang
Planbar, monatlich abgerechnet
Ideal für: dauerhafte Codebase-Begleitung über mehrere Monate

Wann FDE Sinn ergibt — und wann nicht

Ihr habt ein KI-Feature, das in 4–12 Wochen live muss.

Euer Team kann es nicht alleine in der Zeit — ich werde Teil des Teams, baue es mit, ziehe mich raus, sobald es läuft.

Ihr habt einen funktionierenden Prototypen, aber keinen Weg in Production.

Vom Streamlit-Demo zum skalierbaren System ist ein anderer Berg. Ich kenne diesen Berg — mehrfach erklommen mit imagetocaption.ai und Kundenprojekten.

Ihr wollt KI-Expertise aufbauen, ohne 6 Monate zu rekrutieren.

Statt einen Senior AI Engineer zu hiren (12+ Monate Time-to-Productivity), nehmt ihr mich für 3–6 Monate und schult euer Team parallel.

Wann nicht:

Ihr braucht primär Strategie, kein Code → Fractional CAIO ist passender
Ihr habt eine Idee, aber noch keine Klarheit → KI-Workshop ist der erste Schritt
Ihr braucht reine Body-Leasing-Hände ohne strategischen Anteil → da bin ich schlicht zu teuer; ich vermittle gerne

So starten wir

Erstgespräch

Wir prüfen, ob das FDE-Modell zu eurer Situation passt.

⏱ 30 Min

Discovery

Code-Walkthrough, Stakeholder-Calls, erste Empfehlungen.

⏱ 1–2 Wochen

Angebot & Vertrag

Stundenkontingent, Scope, Start-Termin.

⏱ wenige Tage

Laufendes Engagement

Eure Tools, wöchentliche Calls, Code in eurem Repo.

⏱ je nach Bedarf

„Ein FDE ist nicht der externe Berater, der von draußen reinguckt. Er ist der Senior-Engineer, den du gerade nicht in deinem Team hast — auf Zeit."

— Joshua Heller

Häufige Fragen

Was unterscheidet einen FDE von einem normalen Freelancer?

Ein FDE übernimmt Verantwortung — für Architektur, Code-Qualität, Entscheidungen. Ein klassischer Freelancer arbeitet Tickets ab. Ich tue beides, je nach Kontext, aber der Default ist: ich denke mit, nicht nur runter.

Wie viele Stunden pro Woche bist du da?

Standard sind 10–20 Stunden, das funktioniert für die meisten Setups. Bei intensiven Phasen auch 30–40. Ich gehe nie Vollzeit auf ein einzelnes Engagement — sonst verliert ihr den FDE-Vorteil.

Wo und womit arbeitest du?

Primär remote aus Karlsruhe/Pforzheim, regelmäßig vor Ort im DACH-Raum. Ich arbeite mit den Tools, die ihr habt — Microsoft Teams, GitHub, Cursor, Claude Code, Notion — und bin offen für eure Cloud (Azure, AWS, Supabase, Google Cloud). Alles digital, alles dokumentiert.

Bist du allein, oder bringst du ein Team mit?

In FDE-Engagements bin ich selbst die Person. Bei größeren Engagements ziehe ich nach Absprache TAISC-Engineers hinzu. Aber niemals ohne dich zu fragen.

Was, wenn das Engagement nach 4 Wochen nicht passt?

Du kannst jederzeit aufhören, ohne Vorlauf — abgerechnet werden nur geleistete Stunden. Es gibt nur einen sinnvollen Mindestumfang, damit das Modell funktioniert. Mein Geschäftsmodell baut auf Empfehlungen — ein unzufriedener Kunde ist für mich teurer als ein gekündigter Vertrag.

Hast du Referenzen?

Ja, gerne auf Anfrage und nach Vertraulichkeitsabsprache. Bisherige FDE-artige Engagements: BCT Technology (Logify), i40 (SkillDuck), Bitwerft, Onventis.

Klingt nach dem, was du brauchst?

Lass uns 30 Minuten reden. Wenn FDE nicht passt, sage ich das auch.

Erstgespräch vereinbaren →

Lieber erstmal schreiben? joshuaheller@theaisoftwarecompany.com