From 91dc5d8261b2922e0f351eab22211e80fd8df7e3 Mon Sep 17 00:00:00 2001 From: Homelab Cursor Date: Sat, 21 Mar 2026 02:09:00 +0100 Subject: [PATCH] bot: Text-Modell auf OpenRouter gpt-4o-mini umgestellt - MODEL = openai/gpt-4o-mini (schnell, zuverlaessig, perfektes Deutsch) - Vision bleibt lokal auf qwen3-vl:32b (Ollama) - FALLBACK_MODEL = qwen3:30b-a3b (lokaler Fallback fuer Vision-Timeout) - SYSTEM_PROMPT: Tool-Ergebnisse 1:1 weitergeben Regel ergaenzt - Behebt Umlaut-Probleme und Timeout-Instabilitaet --- homelab-ai-bot/llm.py | 12 ++++++++---- 1 file changed, 8 insertions(+), 4 deletions(-) diff --git a/homelab-ai-bot/llm.py b/homelab-ai-bot/llm.py index fa4de9c0..0c460d48 100644 --- a/homelab-ai-bot/llm.py +++ b/homelab-ai-bot/llm.py @@ -18,11 +18,11 @@ log = logging.getLogger('llm') OLLAMA_BASE = "http://100.84.255.83:11434" OPENROUTER_BASE = "https://openrouter.ai/api/v1" -MODEL = os.environ.get("HAUSMEISTER_TEXT_MODEL", "qwen3:30b-a3b") -VISION_MODEL = os.environ.get("HAUSMEISTER_VISION_MODEL", "qwen3-vl:32b") -FALLBACK_MODEL = os.environ.get("HAUSMEISTER_TEXT_FALLBACK_MODEL", "qwen2.5:14b") +MODEL = "openai/gpt-4o-mini" +VISION_MODEL = "qwen3-vl:32b" +FALLBACK_MODEL = "qwen3:30b-a3b" MAX_TOOL_ROUNDS = 3 -OLLAMA_MODELS = {MODEL, VISION_MODEL, FALLBACK_MODEL} +OLLAMA_MODELS = {VISION_MODEL, FALLBACK_MODEL} import datetime as _dt _TODAY = _dt.date.today() @@ -78,6 +78,10 @@ SESSION-RUECKBLICK: - Optional kurz erwaehnen was sonst noch Thema war. - session_search nur fuer Stichwort-Suche in ALTEN Sessions (nicht aktuelle). +TOOL-ERGEBNISSE: +- Tool-Ausgaben sind bereits fertig formatiert (Umlaute, Einheiten, Struktur). +- Gib sie 1:1 wieder. NICHT umformulieren, kuerzen oder Umlaute ersetzen. + BILDERKENNUNG — ALLGEMEIN: Wenn der User ein Bild schickt das KEIN kritisches Dokument ist (z.B. Foto, Screenshot, Landschaft): - Beschreibe strukturiert was du siehst.