From 1ad9ec82f2c62afaeaa6c4c215b7be416b153eab Mon Sep 17 00:00:00 2001
From: Alexander Svan <alex@central.nu>
Date: Tue, 8 Apr 2025 14:42:03 +0200
Subject: [PATCH] init

---
 .devcontainer/devcontainer.json  | 14 ++++++
 .devcontainer/docker-compose.yml |  7 +++
 .gitignore                       |  3 ++
 README.md                        | 50 +++++++++++++++++++
 docker-compose.nvidia.yml        | 42 ++++++++++++++++
 docker-compose.yml               | 37 ++++++++++++++
 requirements.txt                 |  2 +
 script.py                        | 85 ++++++++++++++++++++++++++++++++
 8 files changed, 240 insertions(+)
 create mode 100644 .devcontainer/devcontainer.json
 create mode 100644 .devcontainer/docker-compose.yml
 create mode 100644 .gitignore
 create mode 100644 README.md
 create mode 100644 docker-compose.nvidia.yml
 create mode 100644 docker-compose.yml
 create mode 100644 requirements.txt
 create mode 100644 script.py

diff --git a/.devcontainer/devcontainer.json b/.devcontainer/devcontainer.json
new file mode 100644
index 0000000..4824c96
--- /dev/null
+++ b/.devcontainer/devcontainer.json
@@ -0,0 +1,14 @@
+{
+	"name": "Existing Docker Compose (Extend)",
+
+	"dockerComposeFile": [
+		"../docker-compose.yml",
+		"docker-compose.yml"
+	],
+	"service": "python-loader",
+	"workspaceFolder": "/workspaces/${localWorkspaceFolderBasename}",
+	"features": {
+		"ghcr.io/devcontainers/features/python:1": {}
+	},
+	"remoteUser": "root"
+}
diff --git a/.devcontainer/docker-compose.yml b/.devcontainer/docker-compose.yml
new file mode 100644
index 0000000..39b2ef3
--- /dev/null
+++ b/.devcontainer/docker-compose.yml
@@ -0,0 +1,7 @@
+version: '3.8'
+services:
+  python-loader:
+    volumes:
+      - ..:/workspaces:cached
+    command: sleep infinity
+ 
diff --git a/.gitignore b/.gitignore
new file mode 100644
index 0000000..edb9577
--- /dev/null
+++ b/.gitignore
@@ -0,0 +1,3 @@
+ollama_models
+postgres_db
+chroma_db
\ No newline at end of file
diff --git a/README.md b/README.md
new file mode 100644
index 0000000..cfe42e1
--- /dev/null
+++ b/README.md
@@ -0,0 +1,50 @@
+
+# Vector Database POC
+
+## What it is
+
+- Development environment using Devcontainers
+
+- Stores document embeddings in ChromaDB
+
+- Retrieves relevant documents for a given query
+
+- Generates answers using Ollama
+
+## Getting started
+
+Download some models
+
+```bash
+ollama pull mxbai-embed-large # Used for embeddings
+
+ollama pull gemma3 # Used as LLM
+```
+
+Download python depedencies
+
+```bash
+pip install -r requirements.txt
+```
+
+## Run
+
+First you need to seed the database with a few documents
+
+```bash
+python script.py seed
+```
+
+And then you can do your search
+
+```bash
+python script.py search --query "What is NAF and how can it help?"
+```
+
+## Roadmap
+
+- Streaming responses (for real-time chat)
+
+- Metadata filtering (e.g., retrieving only recent docs)
+
+- Improved ranking (reranking results for better accuracy)
diff --git a/docker-compose.nvidia.yml b/docker-compose.nvidia.yml
new file mode 100644
index 0000000..438c614
--- /dev/null
+++ b/docker-compose.nvidia.yml
@@ -0,0 +1,42 @@
+services:
+  chroma:
+    image: chromadb/chroma:latest
+    ports:
+      - "8000:8000"
+    volumes:
+      - ./chroma_db_data:/db
+    environment:
+      - POSTGRES_HOST=chroma-db
+      - POSTGRES_PORT=5432
+      - POSTGRES_USER=chroma
+      - POSTGRES_PASSWORD=chroma
+      - POSTGRES_DB=chroma
+    depends_on:
+      - chroma-db
+
+  chroma-db:
+    image: postgres:15-alpine
+    environment:
+      POSTGRES_USER: chroma
+      POSTGRES_PASSWORD: chroma
+      POSTGRES_DB: chroma
+    volumes:
+      - ./chroma_db_data:/var/lib/postgresql/data
+
+  ollama:
+    image: ollama/ollama:latest
+    ports:
+      - "11434:11434"
+    volumes:
+      - ./ollama_models:/root/.ollama
+    devices:
+      - /dev/nvidia0:/dev/nvidia0
+    environment:
+      - OLLAMA_HOST=0.0.0.0
+    deploy:
+      resources:
+        reservations:
+          devices:
+            - driver: nvidia
+              count: all
+              capabilities: [gpu]
\ No newline at end of file
diff --git a/docker-compose.yml b/docker-compose.yml
new file mode 100644
index 0000000..4996816
--- /dev/null
+++ b/docker-compose.yml
@@ -0,0 +1,37 @@
+services:
+  chroma:
+    image: chromadb/chroma:latest
+    environment:
+      - POSTGRES_HOST=chroma-db
+      - POSTGRES_PORT=5432
+      - POSTGRES_USER=chroma
+      - POSTGRES_PASSWORD=chroma
+      - POSTGRES_DB=chroma
+      - CHROMA_SERVER_HOST=0.0.0.0
+      - CHROMA_SERVER_HTTP_PORT=8000
+    volumes:
+      - ./chroma_db:/data
+    depends_on:
+      - chroma-db
+
+  chroma-db:
+    image: postgres:15-alpine
+    environment:
+      POSTGRES_USER: chroma
+      POSTGRES_PASSWORD: chroma
+      POSTGRES_DB: chroma
+      PGDATA: /var/lib/postgresql/data/pgdata
+    volumes:
+      - ./postgres_db:/var/lib/postgresql/data
+
+  ollama:
+    image: ollama/ollama:latest
+    ports:
+      - "11434:11434"
+    volumes:
+      - ./ollama_models:/root/.ollama
+    environment:
+      - OLLAMA_HOST=0.0.0.0
+
+  python-loader:
+    image: mcr.microsoft.com/devcontainers/base:jammy
\ No newline at end of file
diff --git a/requirements.txt b/requirements.txt
new file mode 100644
index 0000000..53cd720
--- /dev/null
+++ b/requirements.txt
@@ -0,0 +1,2 @@
+chromadb
+requests
\ No newline at end of file
diff --git a/script.py b/script.py
new file mode 100644
index 0000000..b4528e1
--- /dev/null
+++ b/script.py
@@ -0,0 +1,85 @@
+import chromadb
+import requests
+import argparse
+
+OLLAMA_URL = "http://ollama:11434/api"
+CHROMA_COLLECTION_NAME = "rag_documents"
+
+# Connect to ChromaDB client
+client = chromadb.HttpClient(host="chroma", port=8000)
+collection = client.get_or_create_collection(name=CHROMA_COLLECTION_NAME)
+
+
+def get_embedding(text, embedding_model):
+    """Generate an embedding using Ollama."""
+    response = requests.post(f"{OLLAMA_URL}/embeddings", json={"model": embedding_model, "prompt": text})
+    if response.status_code == 200:
+        return response.json().get("embedding")
+    else:
+        raise Exception(f"Failed to get embedding: {response.text}")
+
+def seed_database(embedding_model):
+    """Seed the ChromaDB with example documents."""
+    documents = [
+        "NAF is a architectural framework.",
+        "C3 Taxonomi helps define capabilties.",
+        "Architectural framework help organizations define architecture in standardized way with diffrent view points.",
+    ]
+
+    for i, doc in enumerate(documents):
+        embedding = get_embedding(doc, embedding_model)
+        collection.add(ids=[str(i)], embeddings=[embedding], metadatas=[{"text": doc}])
+        print(f"Added document {i}: {doc}")
+
+    print("Database seeding complete.")
+
+def search(query, embedding_model, llm_model, top_k=2):
+    """Retrieve similar documents and generate an answer using an LLM."""
+    query_embedding = get_embedding(query, embedding_model)
+    results = collection.query(query_embeddings=[query_embedding], n_results=top_k)
+
+    retrieved_docs = [doc["text"] for doc_list in results["metadatas"] for doc in doc_list]
+    
+    if not retrieved_docs:
+        print("No relevant documents found.")
+        return
+
+    # Construct the LLM prompt
+    prompt = f"Use the following documents to answer the question:\n\n"
+    for doc in retrieved_docs:
+        prompt += f"- {doc}\n"
+    prompt += f"\nQuestion: {query}\nAnswer:"
+
+    response = requests.post(f"{OLLAMA_URL}/generate", json={"model": llm_model, "prompt": prompt, "stream": False})
+
+    print("RAW RESPONSE:", response.text)
+
+    if response.status_code == 200:
+        try:
+            data = response.json()
+            answer = data.get("response", "No response field found.")
+        except requests.exceptions.JSONDecodeError:
+            answer = response.text  # Fallback to raw text
+        print("\nSearch Results:\n")
+        for doc in retrieved_docs:
+            print(f"Retrieved: {doc}")
+        print("\nGenerated Answer:\n", answer)
+    else:
+        print(f"Failed to generate response: {response.status_code} - {response.text}")
+
+if __name__ == "__main__":
+    parser = argparse.ArgumentParser()
+    parser.add_argument("command", choices=["seed", "search"], help="Command to run")
+    parser.add_argument("--query", type=str, help="Query text for searching")
+    parser.add_argument("--embedding_model", type=str, default="mxbai-embed-large", help="Embedding model")
+    parser.add_argument("--llm_model", type=str, default="gemma3", help="LLM model for generating responses")
+
+    args = parser.parse_args()
+
+    if args.command == "seed":
+        seed_database(args.embedding_model)
+    elif args.command == "search":
+        if not args.query:
+            print("Please provide a query with --query")
+        else:
+            search(args.query, args.embedding_model, args.llm_model)
\ No newline at end of file