BUG: RAG-Indexstruktur — docnm_kwd nicht durchsuchbar, Grundkonzeptfehler #52
Labels
No labels
flugscanner
fuenfvoracht
infrastruktur
jarvis
ki-tower
nice-to-have
prio-1
wartung
wordpress
No milestone
No project
No assignees
1 participant
Notifications
Due date
No due date set.
Dependencies
No dependencies set.
Reference: orbitalo/homelab-brain#52
Loading…
Add table
Reference in a new issue
No description provided.
Delete branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
Problem
docnm_kwdist ein Keyword-Feld in Elasticsearch — matched nur exakt oder per Wildcard. Der Ordnerpfad/Dateiname enthält aber die wichtigsten Suchbegriffe (Thema, Ort, Dokumenttyp, Personen), z. B.:Die Hybrid-Suche (
_es_hybrid_searchintools/rag.py) trifft diese Dokumente nur, wenn der Suchbegriff zufällig im Chunk-Content vorkommt oder manuell als Subquery hartcodiert ist (_WIDE_SUBQUERIES_IMMOBILIENetc.). Das skaliert nicht.Lösung
docnm_text(Typtext, deutscher Analyzer) im Mapping anlegendocnm_kwdWert indocnm_textkopieren, dabei__und_als Trennzeichen behandeln_es_hybrid_searchaufdocnm_text(z. B. 4.0)_WIDE_SUBQUERIES_IMMOBILIEN) können danach großteils entfallenErwartetes Ergebnis
Fragen wie „welche Wohnungen habe ich in Kambodscha" finden die Arakawa-Dokumente ohne Spezial-Subqueries, weil
Kambodscha,Arakawa,Wohnung,Kaufvertragals einzelne Terme im Text-Feld matchen.Betrifft
homelab-ai-bot/tools/rag.py(Suche + Mapping-Update)ragflow_61f51c8c279011f1a174bd19863ba33eRAG: docnm_kwd als analysiertes Text-Feld indexierento BUG: RAG-Indexstruktur — docnm_kwd nicht durchsuchbar, Grundkonzeptfehler