/services · 03 / 10

AI che serve produzione, non slide.

Architetture LLM-native, RAG su misura, copiloti su dominio specifico, agenti che fanno il lavoro vero — pensati per PMI e scale-up senza un team ML interno. Trattiamo gli LLM come ogni altro componente di sistema: misurabili, riproducibili, osservabili.

Engagement8 — 20 settimane

Team1 — 2 senior + AI specialist

OutputSistema AI in produzione

DisciplinaXP + Extreme Contracts + Evals

01 · La premessa

Se un agente in produzione non si può debuggare come un microservizio, non è in produzione. È una demo che vive su un server.

L'AI generativa è diventata una primitiva di sistema. Non è più una sezione separata dell'architettura — è una libreria che gestisci come gestisci Postgres: con monitoring, con SLO, con rollback, con governance.

Il nostro approccio applica XP al dominio AI: piccoli rilasci di prompt, eval suite come test, refactor continuo del catalogo di prompt, integrazione continua delle valutazioni in CI.

E applichiamo Extreme Contracts: ogni capability AI ha precondizioni dichiarate (input shape, sicurezza dei dati), postcondizioni verificabili (eval gates, latency budget, accuracy floor) e fallback espliciti per il caso in cui il modello fallisca.

02 · Cosa consegniamo

Cosa consegniamo.

/01

Architettura LLM-native

Provider strategy, routing, caching, rate limiting, observability, cost monitoring. Niente lock-in al vendor di turno.

/02

Eval suite versionata

Test eseguibili in CI per ogni prompt critico. Accuracy, latency, cost, safety — quattro assi, soglie firmate dal cliente.

/03

RAG con citazioni

Retrieval + generazione + citazione delle fonti. Niente risposte non tracciabili. Niente hallucination senza alert.

/04

Agent runtime

Loop di tool-use osservabile, con tracing, sandbox di esecuzione, fallback rules. Un agent senza guardrails è un incidente.

/05

Governance e sicurezza dei dati

PII handling, prompt injection defenses, data retention policy. GDPR-by-design, non bolt-on.

03 · XP in azione

Come operiamo.

XP / Eval-Driven Dev

Le eval sono i nostri test.

Per ogni prompt critico, una eval set. Per ogni modifica, una run. Per ogni regressione, un alert.

XP / Pair Prompting

I prompt si scrivono in coppia.

Un prompt non revisionato è codice non revisionato. Vale per chi lo scrive con noi.

Contracts / Fallback

Per ogni capability AI, un fallback.

Modello giù? Rate limit? Risposta low-confidence? Ogni caso ha una strategia esplicita. Non lasciamo l'utente in mezzo al mare.

Contracts / Data Sovereignty

I dati del cliente restano del cliente.

Niente fine-tuning silenzioso. Niente data leak verso provider non autorizzati. Permessi documentati, audit possibile.

04 · Il contratto

Precondizioni, postcondizioni, invarianti.

Ogni engagement ha precondizioni esplicite, postcondizioni misurabili e invarianti che non violiamo. Sai cosa serve all'inizio, cosa esce alla fine, e cosa non negoziamo nel mezzo.

Precondizioni / cosa serve da te

Use case validato: un utente finale reale che userà il sistema, non un esperimento da CMO.
Accesso ai dati di dominio (con clearance privacy/legal) o ad un dataset rappresentativo.
Budget di inference dichiarato: serve per dimensionare l'architettura.
Tolleranza all'errore concordata: cosa succede quando il modello sbaglia? Quanto sbagliare è accettabile?

Postcondizioni / cosa garantiamo

Sistema AI in produzione con eval gate in CI: nessun deploy senza eval pass.
Dashboard live di accuracy, latency, cost, safety.
Runbook operativo: come si gestisce un drift di performance, un'escalation di costi, un incidente di safety.
Stack di prompt + eval + tooling versionato e nel repository del cliente.

05 · Quando funziona

Buon fit, cattivo fit.

YESBuon fit se…

Hai un problema reale dove l'AI è la soluzione più semplice, non quella più cool.
Hai pazienza per la disciplina delle eval — l'AI senza eval è teatro.
Sei disposto a misurare costi di inference e a dire di no a feature che non ripagano.
Vuoi un sistema che il tuo team possa estendere, non una black-box di un fornitore.

NOCattivo fit se…

Vuoi "aggiungere AI" senza un use case specifico, perché il CDA lo ha chiesto.
Cerchi qualcuno che firmi un agente autonomo che esegue azioni critiche, senza supervisione umana, dal giorno uno.
Non vuoi mettere PII e dati sensibili sotto governance — l'AI seria parte dalla data discipline.

/start

Vuoi parlarne nel concreto?

Prenota una discovery call