TECHNOLOGIE
Eine Architektur, die Latenzanforderungen von Echtzeit-Sprache mit strengen Datensicherheitsanforderungen vereint.
Physisch getrennte Zonen für maximale Sicherheit
Edge
Arbeitsplätze, Telefonie-Infrastruktur, Sinerva Gateway. Einziger Punkt mit Internet-Kontakt.
Tunnel
Verschlüsselter WireGuard-VPN. Outbound-only, keine offenen Ports zum Internet.
Core
Private Server-Umgebung (ISO-zertifiziertes RZ). STT, LLM-Inference, RAG.
Vom Mikrofon bis zur Antwort in <1.5 Sekunden
Browser greift Mikrofon-Stream ab, komprimiert in Opus-Pakete
Stream via WebSocket an Gateway, Session-ID, durch VPN-Tunnel
Voice Activity Detection prüft auf Sprachanteile, Stille wird verworfen
Sprache wird in Text umgewandelt (RTF < 0.5)
Regex-Layer ersetzt sensible Muster durch Platzhalter
Vektorsuche im Knowledge Pack nach relevantem Kontext
LLM generiert Antwort basierend auf Prompt + Kontext
JSON-Objekt wird an Frontend zurückgesendet
Zero Trust & strikte Isolation
Keine impliziten Vertrauensbeziehungen. Jede Anfrage wird authentifiziert und autorisiert.
Das Gateway öffnet keine Ports nach außen. Angriffe über das Sinerva-Gerät sind von außen faktisch ausgeschlossen.
Audiodaten werden ausschließlich im RAM verarbeitet. Nach Transkription sofort überschrieben. Keine Speicherung auf Festplatte.
Separate Collections in Qdrant, isolierte LoRA-Adapter. Kein firmenübergreifendes Retrieval möglich.
Bewusster Verzicht auf Hyperscaler für Kostenkontrolle und Datenschutz
The Core
Llama-3-70B in 4-bit Quantisierung
High Single-Core Performance
Cache für Vektordatenbank
PCIe 4.0/5.0
Kapazität
30-50 gleichzeitige Sessions, ~100-150 Named Users
~9.500 EUR (Abschreibung 36 Monate)
The Edge
Industrial Grade
Pflicht für Dauerbetrieb
Optional: M.2 NVMe
Passive Wärmeableitung
~220 EUR (refinanziert durch Setup-Fee)
Microservices-Pattern für unabhängige Skalierung
"The Ear"
Python 3.11+, FastAPI
"The Brain"
Python, Docker, vLLM
"The Bridge"
Node.js, Express, MongoDB
"The Face"
React, Tailwind CSS
Fleet Management
DietPi, Ansible/Balena
Unser Engineering-Team zeigt Ihnen gerne die Architektur im Detail.
Technisches Gespräch anfragen