projekte:2023:ki-videos-generieren

Generierung von KI Videos

  • Achtung: Midjourney kann nur über die Kommunikationsanwendung „Discord“ verwendet werden
  • Wenn eingerichtet und bereit kann in einem Chat mit dem Discord Bot von Midjourney kommuniziert werden
  • Am besten beginnt man mit
    /imagine <Prompt>
  • An Stelle von <Prompt> wird das zu erstellende Bild beschrieben
    • Möglichst kurz und präzise in englischen Stichworten:
      • Prompt: neglected old men, sitting, beautiful scandinavian church from outside in background, holding candle, wearing long coat, beard, long white hair, snow –ar 16:9
      • Ergebnis #1:
      • Ergebnis #2:
    • Es gibt zusätzliche Parameter, welche mit „–“ gestartet werden wie z.B. –ar (apect ratio = seitenverhältnis)
    • Prompts und Parameter werden hier konkret dokumentiert: https://docs.midjourney.com/docs/command-list sowie https://docs.midjourney.com/docs/parameter-list
  • Preis für „Plus“ Variante (neueste Version, weniger Wartezeiten und geringere Limits) bei ~$20/Monat, man sieht die Preise erst wenn man bereits ein Konto hat
  • ChatGPT Prompts und die Anwendung sind ziemlich intuitiv, da man mit ChatGPT wie mit einem Menschen „Konversationen führen kann“
    • Hier sollte man sich trotzdem möglichst kurz und präsise fassen, damit weiterhin ein fokus auf das Ergebnis vorhanden ist
    • Sobald ChatGPT eine Antwort fertig hat, kann es diese innerhalb des gleichen „Chats“ referenziert werden z.B. „Ändere x“, „Kürzer“ oder „formlos“ oder allen erdenklichen weiteren Änderungswünschen
  • Wichtig! ChatGPT kennt nur Informationen und Fakten, welche bis 2021 im Internet zu finden waren
  • Wichtig! Es kann Fakten falsch darstellen und sollte daher immer auch noch zusätzlich auf Korrektheit geprüft werden.

Im Voice Lab kann man neue Stimmen erstellen, vorhandene nutzen oder auf Grundlage von bestehenden Audiodateien eine Stimme eintrainieren. Die folgenden Schritte müssen jeweils durchgeführt werden:

  • Stimme erstellen:
  • Stimme erstellen: „Add Voice or Cloned Voice“ → „Voice Desgin“
  • Stimme aus vorhandenen Auswählen: „Add Voice or Cloned Voice“ → „Voice Library“
  • Stimme Clonen: „Add Voice or Cloned Voice“ → „Instant Voice Cloning“

Sobald die Stimme erstellt ist, kann man im Speech Synthesiser den Text in Sprache umwandeln lassen. Hierzu folgende Schritte durchführen:

  • In den Settings die gewünschte Stimme konfigurieren. Hierzu gehört auch die Stabilität und die Klarheit der Stimme. Umso unstabiler die stimme, umso mehr (unkontrollierte) Variationen fließen in die Audio datei ein.
  • Wichtig: Umstellen von Eleven English v1 auf Eleven Mutlilingual v1, da sonst ein deutscher text mit stark englischem Akzent heraus kommt.

Dann kann der Text eingegeben werden. Durch den Button „Generate“ wird dann der Text in Sprache umgewandelt. Nach der Erzeugung der Datei, kann diese auch heruntergeladen werden.

Folgende Schritte müssen zum Animieren durchgeführt werden:

  • Anmelden
  • Im rechten oberen Eck „Create Video“ drücken
  • In den Standard-Präsentatoren gibt es einen „Add“ Button. Dieser muss verwendet werden, um das vorher in Midjourney generierte Bild hochzuladen
  • Sobald das Bild hochgeladen ist, kann dieses ausgewählt werden
  • In der rechten Spalte dann auf „Upload Audio File“ wechseln
  • Hier das zuvor in elevenlabs generierte Audio File hochladen
  • Die Videoerzeugung mit „Create“ starten
  • projekte/2023/ki-videos-generieren.txt
  • Zuletzt geändert: 2023/08/21 06:39
  • von djesionek