/services · 03 / 10

AI che serve produzione, non slide.

Architetture LLM-native, RAG su misura, copiloti su dominio specifico, agenti che fanno il lavoro vero — pensati per PMI e scale-up senza un team ML interno. Trattiamo gli LLM come ogni altro componente di sistema: misurabili, riproducibili, osservabili.

Engagement8 — 20 settimane
Team1 — 2 senior + AI specialist
OutputSistema AI in produzione
DisciplinaXP + Extreme Contracts + Evals
01 · La premessa

Se un agente in produzione non si può debuggare come un microservizio, non è in produzione. È una demo che vive su un server.

L'AI generativa è diventata una primitiva di sistema. Non è più una sezione separata dell'architettura — è una libreria che gestisci come gestisci Postgres: con monitoring, con SLO, con rollback, con governance.

Il nostro approccio applica XP al dominio AI: piccoli rilasci di prompt, eval suite come test, refactor continuo del catalogo di prompt, integrazione continua delle valutazioni in CI.

E applichiamo Extreme Contracts: ogni capability AI ha precondizioni dichiarate (input shape, sicurezza dei dati), postcondizioni verificabili (eval gates, latency budget, accuracy floor) e fallback espliciti per il caso in cui il modello fallisca.

02 · Cosa consegniamo

Cosa consegniamo.

/01

Architettura LLM-native

Provider strategy, routing, caching, rate limiting, observability, cost monitoring. Niente lock-in al vendor di turno.

/02

Eval suite versionata

Test eseguibili in CI per ogni prompt critico. Accuracy, latency, cost, safety — quattro assi, soglie firmate dal cliente.

/03

RAG con citazioni

Retrieval + generazione + citazione delle fonti. Niente risposte non tracciabili. Niente hallucination senza alert.

/04

Agent runtime

Loop di tool-use osservabile, con tracing, sandbox di esecuzione, fallback rules. Un agent senza guardrails è un incidente.

/05

Governance e sicurezza dei dati

PII handling, prompt injection defenses, data retention policy. GDPR-by-design, non bolt-on.

03 · XP in azione

Come operiamo.

XP / Eval-Driven Dev
Le eval sono i nostri test.

Per ogni prompt critico, una eval set. Per ogni modifica, una run. Per ogni regressione, un alert.

XP / Pair Prompting
I prompt si scrivono in coppia.

Un prompt non revisionato è codice non revisionato. Vale per chi lo scrive con noi.

Contracts / Fallback
Per ogni capability AI, un fallback.

Modello giù? Rate limit? Risposta low-confidence? Ogni caso ha una strategia esplicita. Non lasciamo l'utente in mezzo al mare.

Contracts / Data Sovereignty
I dati del cliente restano del cliente.

Niente fine-tuning silenzioso. Niente data leak verso provider non autorizzati. Permessi documentati, audit possibile.

04 · Il contratto

Precondizioni, postcondizioni, invarianti.

Ogni engagement ha precondizioni esplicite, postcondizioni misurabili e invarianti che non violiamo. Sai cosa serve all'inizio, cosa esce alla fine, e cosa non negoziamo nel mezzo.

Precondizioni / cosa serve da te
  • Use case validato: un utente finale reale che userà il sistema, non un esperimento da CMO.
  • Accesso ai dati di dominio (con clearance privacy/legal) o ad un dataset rappresentativo.
  • Budget di inference dichiarato: serve per dimensionare l'architettura.
  • Tolleranza all'errore concordata: cosa succede quando il modello sbaglia? Quanto sbagliare è accettabile?
Postcondizioni / cosa garantiamo
  • Sistema AI in produzione con eval gate in CI: nessun deploy senza eval pass.
  • Dashboard live di accuracy, latency, cost, safety.
  • Runbook operativo: come si gestisce un drift di performance, un'escalation di costi, un incidente di safety.
  • Stack di prompt + eval + tooling versionato e nel repository del cliente.
05 · Quando funziona

Buon fit, cattivo fit.

YESBuon fit se…
  • Hai un problema reale dove l'AI è la soluzione più semplice, non quella più cool.
  • Hai pazienza per la disciplina delle eval — l'AI senza eval è teatro.
  • Sei disposto a misurare costi di inference e a dire di no a feature che non ripagano.
  • Vuoi un sistema che il tuo team possa estendere, non una black-box di un fornitore.
NOCattivo fit se…
  • Vuoi "aggiungere AI" senza un use case specifico, perché il CDA lo ha chiesto.
  • Cerchi qualcuno che firmi un agente autonomo che esegue azioni critiche, senza supervisione umana, dal giorno uno.
  • Non vuoi mettere PII e dati sensibili sotto governance — l'AI seria parte dalla data discipline.
/start

Vuoi parlarne nel concreto?

Prenota una discovery call