- STATE.md: Hybrid-Architektur, LLM-Routing, VRAM-Belegung - RAGFLOW.md: Warnung dass qwen2.5:14b Hauptmodell verdraengt
1.9 KiB
1.9 KiB
RAGFlow — PDF-RAG auf pve-mu-3
RAG (Retrieval-Augmented Generation) für ~20.000 PDFs aus Synology/Seafile.
Übersicht
| CT | 700 |
| Host | pve-mu-3 (192.168.178.250 / 100.109.101.12) |
| Hostname | ragflow |
| IP (LAN) | 192.168.178.154 |
Zugang
| Lokal | http://192.168.178.154:8080 |
| CF Quick Tunnel | journalctl -u cloudflared-ragflow -n 20 → URL (ändert sich bei Neustart) |
| Beispiel-URL | https://gbp-folder-explains-counter.trycloudflare.com |
Login-Daten
| User | Passwort | |
|---|---|---|
| Orbitalo | wuttili@gmx.de | Astral1966 |
| Admin | admin@ragflow.io | admin |
Architektur
- Docker Compose in
/opt/ragflow/docker/ - Elasticsearch (Vector-DB), MySQL, MinIO, Redis
- Ollama (KI-Server 100.84.255.83): nomic-embed-text (Embeddings, PERMANENT im VRAM), qwen2.5:14b (Chat)
- WICHTIG: qwen3:30b-a3b + nomic-embed-text sind permanent geladen (keep_alive=-1). RAGFlow-Chat mit qwen2.5:14b verdraengt das Hauptmodell! Empfehlung: Chat-Modell auf qwen3:30b-a3b umstellen.
- Synology SMB gemountet:
/mnt/synology/Seafile/Nextcloud-Migration/(~13k PDFs)
Wichtige Befehle
# Von pve-mu-3 aus:
pct exec 700 -- docker ps # Container-Status
pct exec 700 -- systemctl status cloudflared-ragflow # CF Tunnel
pct exec 700 -- journalctl -u cloudflared-ragflow -n 20 # Aktuelle Tunnel-URL
# Im CT 700:
cd /opt/ragflow/docker && docker compose restart # RAGFlow neu starten
Sprache ändern
- UI: Einloggen → Profil (oben rechts) → Benutzereinstellungen → Locale → Englisch/Deutsch
- Browser: Sprache auf Deutsch/Englisch setzen (RAGFlow nutzt Accept-Language)
Datasource (PDF-Ordner)
In RAGFlow: Datasource anlegen → Local Path → /mnt/synology/Seafile/Nextcloud-Migration/
Erstellt 2026-03-24