- Basis: 981118f9 (lokales Qwen3 30B) wiederhergestellt
- Drei Pfade: lokal (qwen3:30b-a3b), Vision (qwen3-vl:32b), Sonar (perplexity/sonar)
- _route_model() fuer sauberes Routing (Web-Keywords -> Sonar, Rest -> lokal)
- /no_think fuer Ollama, Timeout-Fallback auf qwen2.5:14b
- Passthrough-Tools fuer Grafana-Daten
- deep_research TOOLS wieder aktiviert
- Preis-Spaghetti-Logik entfernt
34 lines
1.3 KiB
Markdown
34 lines
1.3 KiB
Markdown
# Hausmeister Bot - STATE
|
|
**Stand:** 21.03.2026
|
|
**Status:** Saubere Local-First Architektur mit Sonar-Websuche
|
|
|
|
## Architektur (3 Pfade)
|
|
|
|
| Pfad | Modell | Endpoint | Zweck |
|
|
|------|--------|----------|-------|
|
|
| Text + Tools | qwen3:30b-a3b | Ollama lokal (RTX 3090) | Alle Homelab-Tools |
|
|
| Vision | qwen3-vl:32b | Ollama lokal (RTX 3090) | Bilderkennung, OCR |
|
|
| Websuche | perplexity/sonar | OpenRouter | Preise, News, Recherche |
|
|
| Deep Research | CT 121 LangGraph | Direkt-API | Tiefenrecherche (explizit) |
|
|
| Fallback | qwen2.5:14b | Ollama lokal | Bei Timeout |
|
|
|
|
## Routing (_route_model)
|
|
- Web-Keywords (preis, recherche, news, etc.) -> Sonar via OpenRouter
|
|
- Deep Research / Tiefenrecherche -> CT 121 direkt
|
|
- Alles andere -> qwen3:30b-a3b lokal
|
|
|
|
## Features
|
|
- /no_think fuer Ollama-Modelle (schnellere Antworten)
|
|
- Timeout-Fallback auf qwen2.5:14b
|
|
- Passthrough-Tools (Grafana-Daten direkt durchreichen)
|
|
- Memory-System + Session-History
|
|
- 19 Tool-Module (auto-discovery via tool_loader)
|
|
|
|
## Was funktioniert
|
|
- Lokale KI steuert alle Homelab-Dienste (RSS, Proxmox, Loki, etc.)
|
|
- Websuche laeuft ueber Perplexity Sonar (kein Tool-Calling, ein API-Call)
|
|
- Vision lokal via qwen3-vl:32b
|
|
- Deep Research via CT 121
|
|
|
|
## Git-Stand
|
|
Committed und nach Forgejo gepusht. Auto-Sync laeuft.
|