[Session 2026-03-28] Cross-Encoder Reranking, Jellyfin Trickplay, Save.TV UI #53

Open
opened 2026-03-28 16:00:59 +00:00 by orbitalo · 0 comments
Owner

Was wurde gemacht

Cross-Encoder Reranking (RAG)

  • NexusRAG (github.com/LeDat98/NexusRAG) mit eigenem RAG-System verglichen
  • CT 123 (reranker) neu erstellt: Debian 12, 3 GB RAM, 2 CPUs, 16 GB Disk
  • FastAPI Reranker-Microservice mit BAAI/bge-reranker-v2-m3 (Cross-Encoder) auf CPU
  • tools/rag.py erweitert: nach ES-Suche werden Top-15 Kandidaten per Cross-Encoder reranked
  • RRF (Reciprocal Rank Fusion): Kombiniert ES-Rang + Reranker-Rang statt nur Reranker-Score
  • Snippets auf 512 Zeichen reduziert (von 4000) → Reranking in ~12s statt 71s
  • Fallback bei Timeout/Fehler: ES-Ergebnisse wie bisher (kein Ausfall)
  • Doku: ct999-docs/docs/container/ct-123-reranker.md erstellt, CT-116-Doku aktualisiert

Jellyfin (192.168.178.149)

  • Trickplay-Generierung aktiviert und optimiert (4 Threads)
  • Problematische Beethoven-Datei temporaer umbenannt (ffmpeg-Crash)
  • "2 Guns" als erster Film mit Trickplay fertig, Task laeuft weiter im Hintergrund
  • Plugins installiert: Fanart, TMDb Box Sets, Playback Reporting
  • 41 Duplikate geloescht (~65 GB frei), SSH-Zugang via Tailscale eingerichtet

Save.TV Web UI

  • Downloads-Seite: Sortierung nach Datum (neueste unten)
  • Archiv + Downloads: Disketten-Symbol bei bereits auf Hetzner gespeicherten Filmen

Aenderungen an Infrastruktur

  • CT 123 (reranker): Neuer LXC-Container, BAAI/bge-reranker-v2-m3, FastAPI auf Port 8099
  • CT 116 (hausmeister-bot): tools/rag.py — Reranking + RRF-Fusion, Fallback
  • Jellyfin (debian-jellyfin): Trickplay aktiviert, Plugins, Duplikat-Bereinigung
  • CT 116 (savetv): Downloads-Sortierung, Speicher-Indikator

Erkannte Probleme

  • Reranking auf CPU dauert ~12s fuer 15 Dokumente (512 Zeichen) — akzeptabel fuer Telegram, aber nicht ideal
  • ES-Recall bei Kambodscha-Wohnungen schlecht: Dokumente heissen "Arakawa", "G2010B", "Lease Agreement" — nicht "Wohnung Kambodscha". Multi-Query-Expansion wuerde helfen.
  • Jellyfin Trickplay: Beethoven-Sinfonie crasht ffmpeg, Datei wurde umbenannt

Naechste Schritte

  • RAG Multi-Query-Expansion: LLM generiert 3-5 Suchqueries pro Userfrage → besserer Recall
  • Jellyfin: Trickplay-Fortschritt pruefen, Beethoven-Datei untersuchen
  • Jellyfin Webhook-Plugin Kompatibilitaet klären

Betroffene Systeme

CT 116 (hausmeister-bot), CT 123 (reranker, NEU), Jellyfin (debian-jellyfin-homeassistent), CT 700 (ragflow/ES)

## Was wurde gemacht ### Cross-Encoder Reranking (RAG) - NexusRAG (github.com/LeDat98/NexusRAG) mit eigenem RAG-System verglichen - **CT 123 (reranker)** neu erstellt: Debian 12, 3 GB RAM, 2 CPUs, 16 GB Disk - FastAPI Reranker-Microservice mit `BAAI/bge-reranker-v2-m3` (Cross-Encoder) auf CPU - `tools/rag.py` erweitert: nach ES-Suche werden Top-15 Kandidaten per Cross-Encoder reranked - **RRF (Reciprocal Rank Fusion)**: Kombiniert ES-Rang + Reranker-Rang statt nur Reranker-Score - Snippets auf 512 Zeichen reduziert (von 4000) → Reranking in ~12s statt 71s - Fallback bei Timeout/Fehler: ES-Ergebnisse wie bisher (kein Ausfall) - Doku: `ct999-docs/docs/container/ct-123-reranker.md` erstellt, CT-116-Doku aktualisiert ### Jellyfin (192.168.178.149) - Trickplay-Generierung aktiviert und optimiert (4 Threads) - Problematische Beethoven-Datei temporaer umbenannt (ffmpeg-Crash) - "2 Guns" als erster Film mit Trickplay fertig, Task laeuft weiter im Hintergrund - Plugins installiert: Fanart, TMDb Box Sets, Playback Reporting - 41 Duplikate geloescht (~65 GB frei), SSH-Zugang via Tailscale eingerichtet ### Save.TV Web UI - Downloads-Seite: Sortierung nach Datum (neueste unten) - Archiv + Downloads: Disketten-Symbol bei bereits auf Hetzner gespeicherten Filmen ## Aenderungen an Infrastruktur - **CT 123 (reranker):** Neuer LXC-Container, `BAAI/bge-reranker-v2-m3`, FastAPI auf Port 8099 - **CT 116 (hausmeister-bot):** `tools/rag.py` — Reranking + RRF-Fusion, Fallback - **Jellyfin (debian-jellyfin):** Trickplay aktiviert, Plugins, Duplikat-Bereinigung - **CT 116 (savetv):** Downloads-Sortierung, Speicher-Indikator ## Erkannte Probleme - Reranking auf CPU dauert ~12s fuer 15 Dokumente (512 Zeichen) — akzeptabel fuer Telegram, aber nicht ideal - ES-Recall bei Kambodscha-Wohnungen schlecht: Dokumente heissen "Arakawa", "G2010B", "Lease Agreement" — nicht "Wohnung Kambodscha". Multi-Query-Expansion wuerde helfen. - Jellyfin Trickplay: Beethoven-Sinfonie crasht ffmpeg, Datei wurde umbenannt ## Naechste Schritte - [ ] **RAG Multi-Query-Expansion**: LLM generiert 3-5 Suchqueries pro Userfrage → besserer Recall - [ ] Jellyfin: Trickplay-Fortschritt pruefen, Beethoven-Datei untersuchen - [ ] Jellyfin Webhook-Plugin Kompatibilitaet klären ## Betroffene Systeme CT 116 (hausmeister-bot), CT 123 (reranker, NEU), Jellyfin (debian-jellyfin-homeassistent), CT 700 (ragflow/ES)
Sign in to join this conversation.
No milestone
No project
No assignees
1 participant
Notifications
Due date
The due date is invalid or out of range. Please use the format "yyyy-mm-dd".

No due date set.

Dependencies

No dependencies set.

Reference: orbitalo/homelab-brain#53
No description provided.