Sinerva AI Solutions

Drei-Zonen-Architektur

Physisch getrennte Zonen für maximale Sicherheit

Trusted Customer Network

Edge

Arbeitsplätze, Telefonie-Infrastruktur, Sinerva Gateway. Einziger Punkt mit Internet-Kontakt.

Secure Transport Layer

Tunnel

Verschlüsselter WireGuard-VPN. Outbound-only, keine offenen Ports zum Internet.

Sinerva Intelligence Cluster

Core

Private Server-Umgebung (ISO-zertifiziertes RZ). STT, LLM-Inference, RAG.

Datenfluss-Analyse

Vom Mikrofon bis zur Antwort in <1.5 Sekunden

Audio Capture

AudioWorklet API

Browser greift Mikrofon-Stream ab, komprimiert in Opus-Pakete

Ingestion

WebSocket + WireGuard

Stream via WebSocket an Gateway, Session-ID, durch VPN-Tunnel

VAD

Silero VAD

Voice Activity Detection prüft auf Sprachanteile, Stille wird verworfen

STT

Faster-Whisper (CTranslate2)

Sprache wird in Text umgewandelt (RTF < 0.5)

Anonymisierung

Pre-Processing

Regex-Layer ersetzt sensible Muster durch Platzhalter

RAG

Qdrant + Embeddings

Vektorsuche im Knowledge Pack nach relevantem Kontext

Inference

Llama-3-70B (vLLM)

LLM generiert Antwort basierend auf Prompt + Kontext

Response

WebSocket

JSON-Objekt wird an Frontend zurückgesendet

Sicherheitskonzept

Zero Trust & strikte Isolation

🔐

Zero Trust Architecture

Keine impliziten Vertrauensbeziehungen. Jede Anfrage wird authentifiziert und autorisiert.

🚫

Keine Inbound-Ports

Das Gateway öffnet keine Ports nach außen. Angriffe über das Sinerva-Gerät sind von außen faktisch ausgeschlossen.

💨

Ephemeral Memory

Audiodaten werden ausschließlich im RAM verarbeitet. Nach Transkription sofort überschrieben. Keine Speicherung auf Festplatte.

🏢

Mandantentrennung

Separate Collections in Qdrant, isolierte LoRA-Adapter. Kein firmenübergreifendes Retrieval möglich.

Hardware-Spezifikationen

Bewusster Verzicht auf Hyperscaler für Kostenkontrolle und Datenschutz

🧠

Inference Node V1

The Core

GPU

2x NVIDIA RTX 3090/4090 (48 GB VRAM)

Llama-3-70B in 4-bit Quantisierung

CPU

AMD Ryzen 9 7950X

High Single-Core Performance

RAM

128 GB DDR5

Cache für Vektordatenbank

Storage

2 TB NVMe SSD

PCIe 4.0/5.0

Kapazität

30-50 gleichzeitige Sessions, ~100-150 Named Users

~9.500 EUR (Abschreibung 36 Monate)

🔐

Sinerva Gateway

The Edge

Plattform

Raspberry Pi 5 (8 GB)

Industrial Grade

Kühlung

Aktiver Kühler

Pflicht für Dauerbetrieb

Storage

Industrial MicroSD (SLC/pSLC)

Optional: M.2 NVMe

Gehäuse

Aluminium mit Manipulationsschutz

Passive Wärmeableitung

~220 EUR (refinanziert durch Setup-Fee)

Software-Stack

Microservices-Pattern für unabhängige Skalierung

Audio-Streaming & VAD

"The Ear"

Python 3.11+, FastAPI

WebSocket Endpoint
Jitter Buffer (50-200ms)
Silero VAD
Faster-Whisper

Inference Engine & RAG

"The Brain"

Python, Docker, vLLM

PagedAttention
Llama-3-70B (AWQ 4-bit)
Qdrant Vektordatenbank
Hybride Suche

Orchestrator & Backend

"The Bridge"

Node.js, Express, MongoDB

Session Management
State Management
Routing
Logging

Frontend & UX

"The Face"

React, Tailwind CSS

AudioWorklet
Live-Transcript
Dynamic Cards
Slot-Filling

Gateway OS

Fleet Management

DietPi, Ansible/Balena

Read-Only Root FS
Auto-Connect VPN
Remote Updates
A/B Partitioning

Private Edge,
Central Intelligence

Drei-Zonen-Architektur

Trusted Customer Network

Secure Transport Layer

Sinerva Intelligence Cluster

Datenfluss-Analyse

Audio Capture

Ingestion

VAD

STT

Anonymisierung

RAG

Inference

Response

Sicherheitskonzept

Zero Trust Architecture

Keine Inbound-Ports

Ephemeral Memory

Mandantentrennung

Hardware-Spezifikationen

Inference Node V1

Sinerva Gateway

Software-Stack

Audio-Streaming & VAD

Inference Engine & RAG

Orchestrator & Backend

Frontend & UX

Gateway OS

Technische Fragen?

Private Edge,Central Intelligence

Drei-Zonen-Architektur

Trusted Customer Network

Secure Transport Layer

Sinerva Intelligence Cluster

Datenfluss-Analyse

Audio Capture

Ingestion

VAD

STT

Anonymisierung

RAG

Inference

Response

Sicherheitskonzept

Zero Trust Architecture

Keine Inbound-Ports

Ephemeral Memory

Mandantentrennung

Hardware-Spezifikationen

Inference Node V1

Sinerva Gateway

Software-Stack

Audio-Streaming & VAD

Inference Engine & RAG

Orchestrator & Backend

Frontend & UX

Gateway OS

Technische Fragen?

Private Edge,
Central Intelligence