myGully.com Boerse.SH - BOERSE.AM - BOERSE.IO - BOERSE.IM Boerse.BZ .TO Nachfolger
Zurück   myGully.com > Talk > News
Seite neu laden

[Entertainment] GPT-4 und Stable Diffusion: South Park komplett mit KI generiert

Willkommen

myGully

Links

Forum

 
Antwort
Themen-Optionen Ansicht
Ungelesen 20.07.23, 17:01   #1
ziesell
das Muster ist das Muster
 
Registriert seit: Apr 2011
Ort: Oimjakon
Beiträge: 2.617
Bedankt: 2.710
ziesell leckt gerne myGully Deckel in der Kanalisation! | 204859437 Respekt Punkteziesell leckt gerne myGully Deckel in der Kanalisation! | 204859437 Respekt Punkteziesell leckt gerne myGully Deckel in der Kanalisation! | 204859437 Respekt Punkteziesell leckt gerne myGully Deckel in der Kanalisation! | 204859437 Respekt Punkteziesell leckt gerne myGully Deckel in der Kanalisation! | 204859437 Respekt Punkteziesell leckt gerne myGully Deckel in der Kanalisation! | 204859437 Respekt Punkteziesell leckt gerne myGully Deckel in der Kanalisation! | 204859437 Respekt Punkteziesell leckt gerne myGully Deckel in der Kanalisation! | 204859437 Respekt Punkteziesell leckt gerne myGully Deckel in der Kanalisation! | 204859437 Respekt Punkteziesell leckt gerne myGully Deckel in der Kanalisation! | 204859437 Respekt Punkteziesell leckt gerne myGully Deckel in der Kanalisation! | 204859437 Respekt Punkte
Standard GPT-4 und Stable Diffusion: South Park komplett mit KI generiert

Zitat:
GPT-4 und Stable Diffusion: South Park komplett mit KI generiert

Eine anscheinend völlig von KI-generierte South-Park-Folge ist im Umlauf. Dabei könnte es sich um einen Streich handeln.



Ein angebliches Start-up namens Fablestudio, das mit der Plattform The Simulation verbunden werden kann, hat eine Folge der bekannten Cartoon-Serie South Park generiert. Die Art, wie die Folge geschaffen wurde, könnte so auch in einer Folge der echten Serie als zynische Zukunftsvision behandelt werden. Die 22 Minuten lange Folge wurde ausschließlich mit KI-Tools generiert. Das Resultat ist bereits sehr überzeugend und kann die Essenz von South Park mit derbem Humor und der typischen Papierfigurenoptik einfangen.

Es gibt Hinweise darauf, dass es sich hierbei um einen Streich handelt – einen Kommentar zur Nutzung von KI und den aktuellen Autorenstreits in Hollywood. So könnte es sich beim Simulation-CEO Julian B. (für Brad) Adler um ein Anagramm handeln, das Jean Baudrillard, einen bekannten französischen Philosophen, darstellt. "Ich sage es jetzt: Matt und Trey sind bestimmt da mit involviert", schreibt der Twitter-Account von Samantha B.

Auch andere Hinweise deuten darauf hin, dass es sich hier um einen gut gemachten Streich handelt. So existiert die Adresse des Start-ups wohl nicht. Generell deuten viele Hinweise immer wieder auf den Philosophen Jean Baudrillard hin. So scheinen die Bilder der verschiedenen Teammitglieder KI-generiert zu sein.

Ursprünglicher Text

Um das Ziel zu erreichen, kombinierte das Team aus Wissenschaftlern mehrere verschiedene KI-Tools miteinander. Schließlich müssen Charaktere, Hintergründe, Dialoge und Stimmen der Figuren mittels Computer generiert werden. Für das finale Produkt namens Show-1 wurden alle Ergebnisse zu einem Cartoon zusammengefügt.

Für die Zeichnungen von Figuren und Hintergründen wurde ein Diffusion-Modell verwendet. Diese generieren aus anfangs zufälligem Rauschen ein immer schärferes Motiv. Die Methode findet etwa bei Stable Diffusion und anderen Bildgeneratoren Verwendung. Fablestudio hat zwei Diffusion-Modelle mit 1.200 Charakteren und 600 Hintergründen aus South Park trainiert.

Mit Stable Diffusion und GPT-4

Die für die Serie typischen einfachen Formen mit großen einfarbigen Flächen lassen sich von einem Computer zudem vergleichsweise schnell generieren. Hier ist jeweils ein Modell für die Figuren mit einfarbigem Hintergrund auf der einen und für die Szenenhintergründe auf der anderen Seite verantwortlich. In Kombination können Elemente in einer Szene unabhängig voneinander bewegt werden.

Aktuell werden die Bilder noch ausschließlich pixelbasiert generiert. Sie sind dadurch in ihrer Qualität limitiert und werden über einen weitere KI-Upscaler für TV-Qualität vergrößert. Das Team will künftig an einem vektorbasierten Modell arbeiten, das Vektorgrafiken erstellt. Diese skalieren unabhängig von der Auflösung, da sie nicht durch einzelne Pixel, sondern von Vektoren definiert werden.

Texte und Dialoge wurden im Projekt von GPT-4 generiert. Ein Vorteil: Viele Transkripte echter South-Park-Folgen sind bereits in den Trainingsdaten des Large Language Models enthalten. Es ist entsprechend einfacher, kohärente neue South-Park-Dialoge zu generieren.

Einfacher Editor für Serienerstellung

Damit die einzelnen generierten Textabschnitte eine in sich geschlossene Story ergeben, experimentierte Fablestudio mit Promptketten, die auf vorangegangenen Ereignissen aufbauen und diese mit in Betracht ziehen.

Alle Elemente wurden schlussendlich mittels Episodengenerator zusammengefügt. Dabei wird zunächst eine übergreifende Story generiert, die sich in bis zu 14 Szenen einteilen lässt. Dabei wird das auf GPT-4 basierende System mehrmals über Promptketten aufgerufen und das jeweils vorherige Ergebnis in das Resultat mit einbezogen. Daraus entsteht der Dialog für eine insgesamt 22 Minuten lange Folge.

Der Episodengenerator erstellte dann passende Charaktere und Szenen mittels Diffusion-Modell und fügte diese zusammen. Auch wurden Kameraperspektiven und die Stimmen der South-Park-Figuren von KI erstellt.

Fablestudio zeigt auch einen kompletten Editor, mit dem User sich eigene South-Park-Episoden generieren können. So wurde unter anderem auch die Beispielepisode Westland Chronicles erstellt, in der ein Schwein durch KI zynische und rassistische Witze generiert.

Nachtrag vom 20. Juli 2023, 14:46 Uhr

Die Golem.de-Community hat uns darauf aufmerksam gemacht, dass es sich hierbei möglicherweise um einen Streich handelt. Es gibt einige Hinweise darauf, die wir im Text ergänzt haben. Bisher ist dies noch nicht bestätigt.
[ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ]
ziesell ist offline   Mit Zitat antworten
Antwort


Forumregeln
Du kannst keine neue Themen eröffnen
Du kannst keine Antworten verfassen
Du kannst keine Anhänge posten
Du kannst nicht deine Beiträge editieren

BB code is An
Smileys sind An.
[IMG] Code ist An.
HTML-Code ist Aus.

Gehe zu


Alle Zeitangaben in WEZ +1. Es ist jetzt 15:02 Uhr.


Sitemap

().