homelab-brain/homelab-ai-bot/STATE.md
Cursor 36d708bee1 refactor(llm): Local-First Routing mit Sonar-Websuche
- Basis: 981118f9 (lokales Qwen3 30B) wiederhergestellt
- Drei Pfade: lokal (qwen3:30b-a3b), Vision (qwen3-vl:32b), Sonar (perplexity/sonar)
- _route_model() fuer sauberes Routing (Web-Keywords -> Sonar, Rest -> lokal)
- /no_think fuer Ollama, Timeout-Fallback auf qwen2.5:14b
- Passthrough-Tools fuer Grafana-Daten
- deep_research TOOLS wieder aktiviert
- Preis-Spaghetti-Logik entfernt
2026-03-21 12:06:00 +01:00

1.3 KiB

Hausmeister Bot - STATE

Stand: 21.03.2026 Status: Saubere Local-First Architektur mit Sonar-Websuche

Architektur (3 Pfade)

Pfad Modell Endpoint Zweck
Text + Tools qwen3:30b-a3b Ollama lokal (RTX 3090) Alle Homelab-Tools
Vision qwen3-vl:32b Ollama lokal (RTX 3090) Bilderkennung, OCR
Websuche perplexity/sonar OpenRouter Preise, News, Recherche
Deep Research CT 121 LangGraph Direkt-API Tiefenrecherche (explizit)
Fallback qwen2.5:14b Ollama lokal Bei Timeout

Routing (_route_model)

  • Web-Keywords (preis, recherche, news, etc.) -> Sonar via OpenRouter
  • Deep Research / Tiefenrecherche -> CT 121 direkt
  • Alles andere -> qwen3:30b-a3b lokal

Features

  • /no_think fuer Ollama-Modelle (schnellere Antworten)
  • Timeout-Fallback auf qwen2.5:14b
  • Passthrough-Tools (Grafana-Daten direkt durchreichen)
  • Memory-System + Session-History
  • 19 Tool-Module (auto-discovery via tool_loader)

Was funktioniert

  • Lokale KI steuert alle Homelab-Dienste (RSS, Proxmox, Loki, etc.)
  • Websuche laeuft ueber Perplexity Sonar (kein Tool-Calling, ein API-Call)
  • Vision lokal via qwen3-vl:32b
  • Deep Research via CT 121

Git-Stand

Committed und nach Forgejo gepusht. Auto-Sync laeuft.