From 3f245ffea9f642ba6bd55a1bd6b4e3eb731b9f60 Mon Sep 17 00:00:00 2001
From: Homelab Cursor <homelab@orbitalo.net>
Date: Fri, 20 Mar 2026 21:30:53 +0100
Subject: [PATCH] feat: deep_research Tool fuer Hausmeister-Bot

Open Deep Research (CT 121) als neues LLM-Tool.
- LangGraph API auf 10.10.10.121:2024
- SearXNG + OpenRouter als Backend
- Polling-basiert (2-10 Min pro Recherche)
- Report wird fuer Telegram gekuerzt
---
 homelab-ai-bot/tools/deep_research.py | 135 ++++++++++++++++++++++++++
 1 file changed, 135 insertions(+)
 create mode 100644 homelab-ai-bot/tools/deep_research.py

diff --git a/homelab-ai-bot/tools/deep_research.py b/homelab-ai-bot/tools/deep_research.py
new file mode 100644
index 00000000..43306660
--- /dev/null
+++ b/homelab-ai-bot/tools/deep_research.py
@@ -0,0 +1,135 @@
+"""Deep Research Tool — Open Deep Research (CT 121) via LangGraph API.
+
+Ermoeglicht dem Hausmeister-Bot tiefe Web-Recherchen zu starten.
+Ergebnisse kommen als ausfuehrlicher Report zurueck.
+"""
+
+import requests
+import time
+import json
+
+DEEP_RESEARCH_URL = "http://10.10.10.121:2024"
+ASSISTANT_ID = "e9a5370f-7a53-55a8-ada8-6ab9ef15bb5b"
+RESEARCH_MODEL = "openai/gpt-4o-mini"
+POLL_INTERVAL = 10
+MAX_WAIT = 600
+
+SYSTEM_PROMPT_EXTRA = """DEEP RESEARCH:
+Du hast Zugriff auf deep_research — eine KI-gestuetzte Tiefenrecherche die 20-30 Quellen durchsucht.
+Nutze es wenn der User eine komplexe Frage stellt die gruendliche Recherche erfordert.
+Beispiele: "Recherchiere X", "Finde heraus...", "Vergleiche A und B", "Was gibt es Neues zu...".
+NICHT fuer einfache Fakten oder Homelab-Fragen — dafuer reichen die anderen Tools.
+Das Ergebnis ist ein ausfuehrlicher Report. Fasse ihn fuer Telegram zusammen (max ~3000 Zeichen).
+deep_research dauert 2-10 Minuten. Sage dem User dass es laeuft."""
+
+TOOLS = [
+    {
+        "type": "function",
+        "function": {
+            "name": "deep_research",
+            "description": "Startet eine tiefe Web-Recherche zu einem Thema. Durchsucht 20-30 Quellen und erstellt einen ausfuehrlichen Report. Dauert 2-10 Minuten.",
+            "parameters": {
+                "type": "object",
+                "properties": {
+                    "query": {
+                        "type": "string",
+                        "description": "Die Recherche-Frage, moeglichst spezifisch formuliert."
+                    }
+                },
+                "required": ["query"]
+            },
+        },
+    },
+]
+
+
+def _create_thread():
+    r = requests.post(f"{DEEP_RESEARCH_URL}/threads",
+                      json={}, timeout=10)
+    r.raise_for_status()
+    return r.json()["thread_id"]
+
+
+def _start_run(thread_id, query):
+    payload = {
+        "assistant_id": ASSISTANT_ID,
+        "input": {
+            "messages": [{"role": "user", "content": query}]
+        },
+        "config": {
+            "configurable": {
+                "summarization_model": f"openai:{RESEARCH_MODEL}",
+                "research_model": f"openai:{RESEARCH_MODEL}",
+                "compression_model": f"openai:{RESEARCH_MODEL}",
+                "final_report_model": f"openai:{RESEARCH_MODEL}",
+            }
+        }
+    }
+    r = requests.post(f"{DEEP_RESEARCH_URL}/threads/{thread_id}/runs",
+                      json=payload, timeout=30)
+    r.raise_for_status()
+    return r.json()["run_id"]
+
+
+def _poll_run(thread_id, run_id):
+    elapsed = 0
+    while elapsed < MAX_WAIT:
+        time.sleep(POLL_INTERVAL)
+        elapsed += POLL_INTERVAL
+        r = requests.get(
+            f"{DEEP_RESEARCH_URL}/threads/{thread_id}/runs/{run_id}",
+            timeout=10)
+        r.raise_for_status()
+        data = r.json()
+        status = data.get("status", "unknown")
+        if status == "success":
+            return True, None
+        if status in ("error", "failed"):
+            return False, data.get("error", "Unbekannter Fehler")
+        if status == "interrupted":
+            return False, "Research wurde unterbrochen"
+    return False, f"Timeout nach {MAX_WAIT}s"
+
+
+def _get_result(thread_id):
+    r = requests.get(f"{DEEP_RESEARCH_URL}/threads/{thread_id}/state",
+                     timeout=30)
+    r.raise_for_status()
+    state = r.json()
+
+    values = state.get("values", {})
+    messages = values.get("messages", [])
+
+    for msg in reversed(messages):
+        content = msg.get("content", "")
+        if isinstance(content, str) and len(content) > 200:
+            return content
+
+    return "Kein Report generiert."
+
+
+def handle_deep_research(query: str, **kw):
+    try:
+        thread_id = _create_thread()
+        run_id = _start_run(thread_id, query)
+
+        ok, error = _poll_run(thread_id, run_id)
+        if not ok:
+            return f"Deep Research fehlgeschlagen: {error}"
+
+        report = _get_result(thread_id)
+
+        if len(report) > 6000:
+            report = report[:6000] + "\n\n[... Report gekuerzt, Original war laenger]"
+
+        return report
+
+    except requests.ConnectionError:
+        return "Deep Research (CT 121) nicht erreichbar. Service laeuft moeglicherweise nicht."
+    except Exception as e:
+        return f"Deep Research Fehler: {e}"
+
+
+HANDLERS = {
+    "deep_research": handle_deep_research,
+}