rag_mode.py:
- Default fuer neue/unbekannte Chats: RAG-first (True statt False)
- State wird auf Disk geschrieben (/opt/homelab-ai-bot/data/rag_mode.json),
ueberlebt Bot-Restarts; threadsicher.
llm.py:
- _LOCAL_OVERRIDES erweitert um persoenliche Possessiv-/Besitz-Marker:
wohnung(en), apartment, condo/kondo, immobilie, kambodscha/cambodia,
phnom penh, arakawa, gekostet, kaufpreis, bezahlt, ausgegeben, ueberweisung,
meine/mein/meines/..., was haben, wie viel habe ich, ich fuer/für.
Damit werden klar persoenliche Fragen nie mehr faelschlich an Sonar
geroutet, selbst wenn Web-Trigger wie "wie viel" im Text vorkommen.
Hintergrund: Eine Frage der Form "wie viel habe ich fuer die Wohnungen in
Kambodscha bezahlt" wurde an Perplexity/Sonar geroutet (Websuche) statt an
RAG, weil der Mode-Schalter durch einen Bot-Restart im RAM verloren ging und
der Router bei "wie viel" sofort MODEL_ONLINE waehlte.
- Neue Tastaturzeile: Unterlagen AUS/AN zeigt Modus und schaltet um.
- document_mode in ask_with_tools: erzwingt lokales Modell und RAG-Pflicht
wie bei Doc-Keywords (Session wird bei Suche wie bisher bereinigt).
- Optional: doku:/rag: Prefix fuer einmalige Suche ohne Modus.
- Sprache und Hilfetext ergaenzt.