Das Konzept von “Text to Image” und “Image to Image” mittels künstlicher Intelligenz (KI) hat in letzter Zeit erneut einiges an Aufmerksamkeit erregt. Der erste größere Hype innerhalb der Szene kam Anfang 2021 durch das Erscheinen des ersten DALL-E Models auf. Ein Duzend verschiedener KI-Generatoren wie ChatGPT, DALL-E 2, Midjourney, Leonardo.ai, Supermachine, kaiber.ai, Starry.ai und noch viele andere Angebote sind seit dem erschienen. Es ist kaum jemanden entgangen, dass es im Internet jetzt überall AI Bilder basierte Services und Produkte gibt.
Allerdings gehen mit vielen dieser AI Bildgeneratoren auch wiederkehrende Kosten einher, da sie auf Abonnementbasis betrieben werden. Zudem bestehen Bedenken hinsichtlich der Sicherheit der Eingabedaten, da sie online verarbeitet werden und unklar ist, wie die Entwickler sie letztendlich verwenden werden. Eine Alternative bietet die lokale Installation von Stable Diffusion, dem Bildgenerator hinter den meisten großen Projekten. Dadurch behält man die volle Kontrolle über die Eingabedaten und kann ohne laufende Abonnementgebühren eigene Bildkompositionen erstellen.
Noch besser als die Sicherheit & Kostenersparnisse sind allerdings die Möglichkeiten des Moddens von Stable Diffusion. Durch die gigantische Online Community gibt es eine Vielzahl an kostenlosen und bezahlten Mods, Prompts und LoRA Models. Mehr dazu findet man in anderen Blog Posts von mir.
Inhaltsverzeichnis:
- Systemvoraussetzungen (Windows & Nvidia)
- Installation der Hilfsprogramme: Kaffee trinken und Geduld beweisen
- Stable Diffusion herunterladen und installieren
- Stable Diffusion im Browser starten
- Erfahrung und präzise Wortketten steigern die Qualität
- Alle Downloadlinks in der Übersicht
Systemvoraussetzungen (Windows & Nvidia)
Um das Programm zu starten, genügt ein Computer mit mindestens 8 Gigabyte Arbeitsspeicher und Windows 10 / 11. Die Geschwindigkeit, mit der Stabile Diffusion Bilder erzeugt, hängt jedoch wesentlich von der Grafikkarte ab, da sie die Hauptlast beim Rendern trägt. Dieser Leitfaden richtet sich speziell an Nvidia-Nutzer.
Für den generellen Betrieb von Stabile Diffusion reicht vorerst auch eine ältere Nvidia GTX 890 mit 4 Gigabyte Videospeicher aus, sofern es nicht entscheidend ist, jede Sekunde einzusparen. In unserem Fall haben wir eine nVidia GeForce 2060 SUPER RTX mit 8 Gigabyte VRAM verwendet. Bei Stable Diffusion gilt: Je mehr VRAM zur Verfügung steht, desto besser.
Falls Sie über weniger VRAM verfügen, gibt es Lösungen, um die Leistung anzupassen. Eine Option besteht darin, die Befehle “–lowvram” oder “–medvram” zu verwenden. Informationen zu deren Verwendung finden Sie bei einer Google-Suche. Beachten Sie jedoch, dass das Erstellen der Bilder mit diesen Befehlen länger dauern kann. Dennoch ermöglichen sie es Ihnen, größere Bilder zu erstellen, ohne wegen fehlenden VRAMs einen Fehler ausgegeben zu bekommen. Eine weitere nützliche Funktion von Stabile Diffusion ist das sogenannte Token Merging. Dieser Vorgang wird am Ende dieses Beitrags detailliert erklärt und ermöglicht zusätzliche GPU Optimierungen.
Bitte beachten Sie, dass dieser Leitfaden speziell auf Nvidia-Nutzer ausgerichtet ist und möglicherweise nicht alle Informationen für Nutzer von AMD Grafikkarten oder Linux / Apple Betriebssystemen umfasst.
Benötigte Software, bevor wir Stable Diffusion installieren können
Python 3.10
Du brauchst eine bestimmte Version von Python auf deinem Rechner. Hier ist der offizielle Python 3.10 Download Link. ACHTUNG: Vergessen Sie nicht bei der Installation nicht den Haken bei “App Python to PATH” zu setzen! Auf dem Bild sehen Sie welche Box gemeint ist. Das Bild ist aus dem Netz geklaut, nicht über die Versionszahl wundern.
GIT
Nach der Installation von Python lädst du noch die Git auf deinen Rechner. GIT kannst du hier von der offiziellen Seite herunterladen. Bei der Installation von GIT werden einige Fragen gestellt. Drücken Sie einfach “weiter”, ohne etwas an der Auswahl zu ändern.
Microsoft Visual Studio
Jetzt fehlt noch Microsoft Visual Studio 2022. Das ist dann auch die letzte Installation für heute, damit auf deinem Computer eine Instanz von Stable Diffusion in deinem Browser laufen kann.
Stable Diffusion herunterladen und installieren
Um ganz genau zu sein: Wir laden & installieren hier das “Stable Diffusion Web UI” GitHub Repository von AUTOMATIC1111. Kurz umschrieben ist dieses Tool eine Oberfläche zur Nutzung von dem AI Code im Browser. Bevor du dir den Ordner auf deine Festplatte ziehst, solltest du dir sicher sein, dass du noch mindestens 10 GB Speicherplatz frei haben solltest.
Du gehst also in einen leeren Ordner auf deiner Festplatte oder erstellst einen. In diesem Ordner kannst du jetzt mit einem Rechtsklick “GIT Bash here” öffnen. In dem sich öffnenden Fenster gibst du jetzt ein: git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git und drückst Enter. Im nächsten Schritt musst du warten, bis alles heruntergeladen und installiert wurde.
Wenn alles fertig ist, solltest du jetzt den Ordner “stable-diffusion-webui” auf deiner Festplatte finden. Öffne diesen Ordner und klicke auf die Datei namens webui.bat und warte ein wenig. Beim ersten Mal öffnen der Datei kann die Installation bis zu 30 Minuten dauern, da du eine Menge an Dateien herunterladen musst.
Ist alles fertig, sollte dein CMD Fenster jetzt ungefähr so aussehen:
Der wichtige Punkt ist, dass man die URL “http://127.0.0.1:7860” in der Kommandozeile sehen kann. Wenn du diese Textzeile sehen kannst, dann gehe in deinem Browser auf die Seite http://127.0.0.1:7860/. Jetzt solltest du die Oberfläche von Stable Diffusion in deinem Browser sehen können.
Stable Diffusion im Browser starten (Chrome & Firefox getestet)
Jedes Mal, wenn du Stable Diffusion starten möchtest, musst du die webui.bat öffnen und warten, bis der Server läuft. Danach gehst du in deinen Browser und gibst die immer selbe URL ein.
Hier kannst du wie in anderen Bild-KIs die Prompts eingeben und verschiedene Parameter feinjustieren. Die wichtigsten Regler sind die für die Bildhöhe und -weite. Kommt eine Fehlermeldung, liegt dies vermutlich am zu geringen Video-RAM deiner Grafikkarte.
KI Bilder in Hochauflösender Qualität erstellen
Jetzt geht es mit der eigentlichen Arbeit los. Anfangs solltest du erstmal ein wenig die Optionen ausprobieren und testen. Wie man Stable Diffusion optimiert & seine Ergebnisse verbessert, zeigen wir dir in einem weiteren Blogartikel. Wenn du selbst ein wenig Recherchieren möchtest, solltest du dich mit der Plattform namens “Civitai” auseinandersetzen oder beispielsweise dich mit “Merged Tokens” beschäftigen. Beides wird in anderen Blogposts von mir in Zukunft erklärt.
Anfangs reicht es natürlich einfach englische Wörter in Stable Diffusion einzugeben und ein paar Bilder generieren zu lassen. Wenn man jetzt mehr als nur irgendwelche Ergebnisse möchte, muss man sich intensiv mit der KI beschäftigen. Einen detaillierten Guide zum Programm gibt es hier bald online!