[Session 03.04.2026] KI-Video Pipeline aufgebaut, erstes Video produziert #55

Open
opened 2026-04-03 20:23:46 +00:00 by orbitalo · 0 comments
Owner

Was wurde gemacht

  • KI-Video Pipeline produce.py v3 auf ki-server (Windows, RTX 3090) aufgebaut
  • Erstes Video erfolgreich produziert (38 MB, SadTalker-Avatar, DALL-E 3 Bilder)
  • SadTalker installiert und konfiguriert (Python 3.10, face_size=512)
  • Hallo2 Installation gestartet (bessere Avatar-Qualitaet als SadTalker)
  • Bug gefixt: Avatar plappert nach Wort-Enden -- geloest via Audio-Gate + Frame-Freeze-Postprocessing
  • Doku aktualisiert: /root/docs/projekte/ki-video.md in CT 999

Installationen auf ki-server heute

Zeit Was
07:13 TeamViewer (Remote-Zugriff)
13:56 Python 3.12.10
15:14 SadTalker (GitHub)
15:15 Python 3.10.11
18:45 Erstes Video produziert
19:09 Hallo2 geclont
20:07 VS Community 2022 + VC++ 2022 + Windows SDK
20:49 Hallo2 net.pth Download -- fehlgeschlagen (LFS hash mismatch)

Aenderungen an Infrastruktur

  • ki-server: TeamViewer, Python 3.10/3.12, SadTalker, Hallo2, VS Build Tools, Miniconda3 installiert
  • Kein Eingriff in Proxmox-Infrastruktur
  • Doku in CT 999 aktualisiert

Erkannte Probleme

  • Hallo2 net.pth fehlt (4.9 GB, LFS-Download schlaegt fehl)
    • Loesung: Direkt auf ki-server per PowerShell/Invoke-WebRequest laden
    • NICHT ueber pve-hetzner laden (versehentlich ausgeloest, sofort gestoppt)

Naechste Schritte

  • Hallo2 net.pth direkt auf ki-server laden: Invoke-WebRequest -Uri 'https://huggingface.co/fudan-generative-ai/hallo2/resolve/main/hallo2/net.pth' -OutFile '...'
  • Hallo2 Testlauf mit Beispiel-Avatar + Audio
  • produce.py um Hallo2-Backend erweitern (als Alternative zu SadTalker)
  • Erstes echtes Video fuer YouTube produzieren
  • gpu-worker (4x RTX 3080) aufbauen fuer Parallelproduktion

Betroffene Systeme

  • ki-server (Windows, RTX 3090, Tailscale 100.84.255.83)
  • CT 999 (Doku aktualisiert)

Kosten pro Video

~0.58 EUR Cloud (TTS + DALL-E 3), SadTalker/Hallo2 kostenlos lokal

## Was wurde gemacht - KI-Video Pipeline `produce.py` v3 auf ki-server (Windows, RTX 3090) aufgebaut - **Erstes Video erfolgreich produziert** (38 MB, SadTalker-Avatar, DALL-E 3 Bilder) - SadTalker installiert und konfiguriert (Python 3.10, face_size=512) - Hallo2 Installation gestartet (bessere Avatar-Qualitaet als SadTalker) - Bug gefixt: Avatar plappert nach Wort-Enden -- geloest via Audio-Gate + Frame-Freeze-Postprocessing - Doku aktualisiert: `/root/docs/projekte/ki-video.md` in CT 999 ## Installationen auf ki-server heute | Zeit | Was | |---|---| | 07:13 | TeamViewer (Remote-Zugriff) | | 13:56 | Python 3.12.10 | | 15:14 | SadTalker (GitHub) | | 15:15 | Python 3.10.11 | | 18:45 | **Erstes Video produziert** | | 19:09 | Hallo2 geclont | | 20:07 | VS Community 2022 + VC++ 2022 + Windows SDK | | 20:49 | Hallo2 net.pth Download -- fehlgeschlagen (LFS hash mismatch) | ## Aenderungen an Infrastruktur - ki-server: TeamViewer, Python 3.10/3.12, SadTalker, Hallo2, VS Build Tools, Miniconda3 installiert - Kein Eingriff in Proxmox-Infrastruktur - Doku in CT 999 aktualisiert ## Erkannte Probleme - **Hallo2 net.pth fehlt** (4.9 GB, LFS-Download schlaegt fehl) - Loesung: Direkt auf ki-server per PowerShell/Invoke-WebRequest laden - NICHT ueber pve-hetzner laden (versehentlich ausgeloest, sofort gestoppt) ## Naechste Schritte - [ ] Hallo2 net.pth direkt auf ki-server laden: `Invoke-WebRequest -Uri 'https://huggingface.co/fudan-generative-ai/hallo2/resolve/main/hallo2/net.pth' -OutFile '...'` - [ ] Hallo2 Testlauf mit Beispiel-Avatar + Audio - [ ] produce.py um Hallo2-Backend erweitern (als Alternative zu SadTalker) - [ ] Erstes echtes Video fuer YouTube produzieren - [ ] gpu-worker (4x RTX 3080) aufbauen fuer Parallelproduktion ## Betroffene Systeme - ki-server (Windows, RTX 3090, Tailscale 100.84.255.83) - CT 999 (Doku aktualisiert) ## Kosten pro Video ~0.58 EUR Cloud (TTS + DALL-E 3), SadTalker/Hallo2 kostenlos lokal
Sign in to join this conversation.
No milestone
No project
No assignees
1 participant
Notifications
Due date
The due date is invalid or out of range. Please use the format "yyyy-mm-dd".

No due date set.

Dependencies

No dependencies set.

Reference: orbitalo/homelab-brain#55
No description provided.