Question 1

Cos'è Ollama RAG?

Accepted Answer

Ollama RAG è una soluzione che combina Ollama (il software per eseguire modelli LLM in locale) con la tecnica RAG (Retrieval-Augmented Generation). In pratica: i tuoi documenti aziendali vengono indicizzati in un database vettoriale locale, e quando fai una domanda in italiano il sistema recupera i passaggi rilevanti e li usa come contesto per il modello LLM. Il risultato è una risposta precisa, citante le fonti, senza inviare nulla a servizi cloud.

Question 2

Che formati di documenti supporta l'Ollama RAG di Gaulin?

Accepted Answer

La soluzione Gaulin supporta PDF (anche scansionati, con OCR), documenti Word (.docx), fogli Excel (.xlsx), presentazioni PowerPoint, file di testo, email esportate (.eml, .msg), pagine web e database relazionali. Il sistema indicizza automaticamente i nuovi documenti aggiunti alle cartelle configurate.

Question 3

Quale database vettoriale usa Gaulin per il RAG on-premise?

Accepted Answer

Dipende dall'infrastruttura e dal volume documentale. Per la maggior parte delle PMI utilizziamo ChromaDB o Qdrant, entrambi eseguibili on-premise. Per grandi volumi di documenti o requisiti di alta disponibilità valutiamo Weaviate o pgvector (estensione PostgreSQL). Tutto on-premise, nessun servizio cloud.

Question 4

Ollama RAG funziona bene in italiano?

Accepted Answer

Sì. I modelli Llama 3 e Mistral hanno buona comprensione dell'italiano. Gaulin ottimizza specificamente il sistema per documenti in italiano: chunking semantico adatto alla struttura dei testi italiani, embedding multilingue (es. intfloat/multilingual-e5), e fine-tuning del prompt per risposte in lingua italiana. I risultati su documenti tecnici, legali e commerciali in italiano sono molto soddisfacenti.

Question 5

Quanti documenti può gestire un sistema Ollama RAG on-premise?

Accepted Answer

Con hardware adeguato (server con GPU), un'istanza Ollama RAG può gestire da decine a centinaia di migliaia di documenti. Gaulin dimensiona il sistema in base al volume documentale attuale e alla crescita prevista. La risposta tipica per query su grandi archivi è sotto i 3 secondi.

Question 6

Come si integra Ollama RAG con i sistemi esistenti?

Accepted Answer

Gaulin espone il sistema RAG tramite API REST che i tuoi applicativi esistenti possono interrogare. È integrabile con portali web, applicazioni Laravel o Angular, Teams/Slack via bot, e sistemi documentali come SharePoint, Confluence o cartelle di rete. Vedi anche la pagina dedicata all'integrazione Laravel AI.

Ollama RAG:
i tuoi documenti
parlano italiano

Come funziona Ollama RAG on-premise

Ingestione

Chunking

Embedding

Vector DB

Query + LLM

Chunking semantico avanzato

Embedding multilingue

Citazione delle fonti

Aggiornamento automatico

API REST pronte

Controllo accessi

Chi usa Ollama RAG on-premise

Ricerca giurisprudenza e contratti

Knowledge base tecnica

Assistente policy interne

Verifica conformità normativa

Ricerca offerte e listini

Documentazione tecnica interna

Domande frequenti su Ollama RAG

I tuoi documenti aziendali,
interrogabili in italiano

Ollama RAG:i tuoi documentiparlano italiano