homelab-brain/homelab-ai-bot/STATE.md
Cursor 36d708bee1 refactor(llm): Local-First Routing mit Sonar-Websuche
- Basis: 981118f9 (lokales Qwen3 30B) wiederhergestellt
- Drei Pfade: lokal (qwen3:30b-a3b), Vision (qwen3-vl:32b), Sonar (perplexity/sonar)
- _route_model() fuer sauberes Routing (Web-Keywords -> Sonar, Rest -> lokal)
- /no_think fuer Ollama, Timeout-Fallback auf qwen2.5:14b
- Passthrough-Tools fuer Grafana-Daten
- deep_research TOOLS wieder aktiviert
- Preis-Spaghetti-Logik entfernt
2026-03-21 12:06:00 +01:00

34 lines
1.3 KiB
Markdown

# Hausmeister Bot - STATE
**Stand:** 21.03.2026
**Status:** Saubere Local-First Architektur mit Sonar-Websuche
## Architektur (3 Pfade)
| Pfad | Modell | Endpoint | Zweck |
|------|--------|----------|-------|
| Text + Tools | qwen3:30b-a3b | Ollama lokal (RTX 3090) | Alle Homelab-Tools |
| Vision | qwen3-vl:32b | Ollama lokal (RTX 3090) | Bilderkennung, OCR |
| Websuche | perplexity/sonar | OpenRouter | Preise, News, Recherche |
| Deep Research | CT 121 LangGraph | Direkt-API | Tiefenrecherche (explizit) |
| Fallback | qwen2.5:14b | Ollama lokal | Bei Timeout |
## Routing (_route_model)
- Web-Keywords (preis, recherche, news, etc.) -> Sonar via OpenRouter
- Deep Research / Tiefenrecherche -> CT 121 direkt
- Alles andere -> qwen3:30b-a3b lokal
## Features
- /no_think fuer Ollama-Modelle (schnellere Antworten)
- Timeout-Fallback auf qwen2.5:14b
- Passthrough-Tools (Grafana-Daten direkt durchreichen)
- Memory-System + Session-History
- 19 Tool-Module (auto-discovery via tool_loader)
## Was funktioniert
- Lokale KI steuert alle Homelab-Dienste (RSS, Proxmox, Loki, etc.)
- Websuche laeuft ueber Perplexity Sonar (kein Tool-Calling, ein API-Call)
- Vision lokal via qwen3-vl:32b
- Deep Research via CT 121
## Git-Stand
Committed und nach Forgejo gepusht. Auto-Sync laeuft.