bot: Text-Modell auf OpenRouter gpt-4o-mini umgestellt

- MODEL = openai/gpt-4o-mini (schnell, zuverlaessig, perfektes Deutsch)
- Vision bleibt lokal auf qwen3-vl:32b (Ollama)
- FALLBACK_MODEL = qwen3:30b-a3b (lokaler Fallback fuer Vision-Timeout)
- SYSTEM_PROMPT: Tool-Ergebnisse 1:1 weitergeben Regel ergaenzt
- Behebt Umlaut-Probleme und Timeout-Instabilitaet
This commit is contained in:
Homelab Cursor 2026-03-21 02:09:00 +01:00
parent 4d38c5302c
commit 91dc5d8261

View file

@ -18,11 +18,11 @@ log = logging.getLogger('llm')
OLLAMA_BASE = "http://100.84.255.83:11434"
OPENROUTER_BASE = "https://openrouter.ai/api/v1"
MODEL = os.environ.get("HAUSMEISTER_TEXT_MODEL", "qwen3:30b-a3b")
VISION_MODEL = os.environ.get("HAUSMEISTER_VISION_MODEL", "qwen3-vl:32b")
FALLBACK_MODEL = os.environ.get("HAUSMEISTER_TEXT_FALLBACK_MODEL", "qwen2.5:14b")
MODEL = "openai/gpt-4o-mini"
VISION_MODEL = "qwen3-vl:32b"
FALLBACK_MODEL = "qwen3:30b-a3b"
MAX_TOOL_ROUNDS = 3
OLLAMA_MODELS = {MODEL, VISION_MODEL, FALLBACK_MODEL}
OLLAMA_MODELS = {VISION_MODEL, FALLBACK_MODEL}
import datetime as _dt
_TODAY = _dt.date.today()
@ -78,6 +78,10 @@ SESSION-RUECKBLICK:
- Optional kurz erwaehnen was sonst noch Thema war.
- session_search nur fuer Stichwort-Suche in ALTEN Sessions (nicht aktuelle).
TOOL-ERGEBNISSE:
- Tool-Ausgaben sind bereits fertig formatiert (Umlaute, Einheiten, Struktur).
- Gib sie 1:1 wieder. NICHT umformulieren, kuerzen oder Umlaute ersetzen.
BILDERKENNUNG ALLGEMEIN:
Wenn der User ein Bild schickt das KEIN kritisches Dokument ist (z.B. Foto, Screenshot, Landschaft):
- Beschreibe strukturiert was du siehst.