Midjourney
Midjourney ist eine Künstliche Intelligenz (KI), die Bilder basierend auf Textbeschreibungen, sogenannten Prompts, erzeugt. Das Programm wurde von dem in San Francisco ansässigen Forschungsinstitut Midjourney, Inc. entwickelt und ist ähnlich wie OpenAI's DALL-E und Stability AI's Stable Diffusion.
Seit der ersten Version im Februar 2022 hat Midjourney verschiedene Versionen ihres Algorithmus veröffentlicht, die jeweils Verbesserungen und neue Funktionen mit sich brachten. Die neueste Version, Version 6, wurde im Dezember 2023 veröffentlicht. Jede Version zeichnet sich durch eine verbesserte Bildqualität und die Fähigkeit aus, Bilder noch präziser nach den gegebenen Prompts zu erstellen.
Midjourney ist aktuell noch (wird in Kürze geändert) ausschließlich über einen Discord-Bot auf ihrem offiziellen Discord-Server zugänglich. Benutzer verwenden den Befehl /imagine
, um Bildbeschreibungen einzugeben, woraufhin der Bot vier Bilder generiert. Benutzer können dann wählen, welche Bilder sie in höherer Auflösung erhalten möchten. Darüber hinaus bietet Midjourney verschiedene andere Befehle, um die Benutzererfahrung zu verbessern, wie z.B. das Mischen von Bildern oder das Verkürzen von Prompts.
Die Nutzung von Midjourney hat sowohl in der Kunst- als auch in der Werbebranche großes Interesse geweckt. Künstler verwenden das Programm beispielsweise für das schnelle Prototyping künstlerischer Konzepte, um diese ihren Kunden zu zeigen, bevor sie selbst mit der Arbeit beginnen. Auch in der Werbebranche wird die KI für die schnelle und effiziente Erstellung von Originalinhalten und Ideenfindung genutzt.
Midjourney hat auch Kontroversen hervorgerufen, insbesondere in Bezug auf Urheberrechte und die Originalität von KI-generierten Kunstwerken. Es gab Fälle, in denen KI-generierte Bilder Preise in Kunstwettbewerben gewannen, was zu Diskussionen über die Rolle und Anerkennung von KI in der Kunstwelt führte. Außerdem wurden Bedenken hinsichtlich der Verwendung urheberrechtlich geschützter Kunstwerke zur Schulung der KI geäußert.
Midjourney hat auch mit Herausforderungen im Bereich der Inhaltsmoderation zu kämpfen, insbesondere im Hinblick auf die Generierung von anstößigen oder kontroversen Bildern. Das Unternehmen hat Mechanismen implementiert, um problematische Inhalte zu filtern, obwohl diese Systeme nicht immer fehlerfrei sind.
Zusammengefasst ist Midjourney ein leistungsfähiges Werkzeug, das die Grenzen der digitalen Kunst erweitert, aber auch Fragen zur Ethik und Originalität in der digitalen Kreation aufwirft.
Was kostet Midjourney?
Midjourney bietet vier verschiedene Abonnementstufen an. Du kannst zwischen einer monatlichen oder jährlichen Zahlung wählen, wobei die jährliche Zahlung einen Rabatt von 20% bietet. Die verschiedenen Pläne sind wie folgt gestaltet:
- Basic Plan: Der monatliche Preis liegt bei 10 US-Dollar, während der jährliche Preis 96 US-Dollar beträgt, was 8 US-Dollar pro Monat entspricht.
- Standard Plan: Dieser Plan kostet monatlich 30 US-Dollar und jährlich 288 US-Dollar, was 24 US-Dollar pro Monat ausmacht.
- Pro Plan: Der monatliche Preis für diesen Plan beträgt 60 US-Dollar, und der jährliche Preis liegt bei 576 US-Dollar, also 48 US-Dollar pro Monat.
- Mega Plan: Dies ist der umfangreichste Plan und kostet monatlich 120 US-Dollar oder jährlich 1.152 US-Dollar, was auf 96 US-Dollar pro Monat hinausläuft.
Jeder Abonnementplan bietet verschiedene Funktionen, wie z.B. die Anzahl der gleichzeitig möglichen Aufträge und die Menge der GPU-Zeit, die pro Monat für schnelle Bildgenerierungen (Fast GPU Time) zur Verfügung steht. Außerdem gibt es bei den höheren Plänen unbegrenzte "Relax" GPU-Zeit.
Wenn du ein Abonnement abschließt, kannst du deine generierten Bilder ziemlich frei verwenden. Allerdings gibt es gewisse Einschränkungen, wenn dein Unternehmen mehr als 1.000.000 US-Dollar Bruttojahreseinkommen erwirtschaftet – in diesem Fall ist der Kauf des Pro- oder Mega-Plans erforderlich.
Zu beachten ist auch, dass jede generierte Grafik Midjourney eine uneingeschränkte Lizenz erteilt, mit dieser Grafik zu tun, was sie wollen, was bedeutet, dass sie das Bild kostenlos weitergeben oder unbegrenzte Lizenzen an Dritte verkaufen könnten. Außerdem gibt es Bedenken hinsichtlich der Urheberrechtsverletzungen, da Midjourney ihr KI-Modell möglicherweise mit Millionen von urheberrechtlich geschützten Bildern ohne Erlaubnis trainiert hat. Dies könnte sowohl für Midjourney als auch für die Nutzer, die von den generierten Bildern profitieren, rechtliche Folgen haben.
Für detaillierte Informationen zu den einzelnen Plänen und was sie beinhalten, kannst du direkt auf der offiziellen Webseite von Midjourney oder in deren Dokumentation nachsehen.
Wie du Midjourney verwendest
Um Midjourney zu verwenden, folge diesen Schritten:
- Discord Login: Melde dich bei Discord an. Du kannst den Midjourney Bot über den Webbrowser, die mobile App oder die Desktop-App von Discord nutzen. Stelle sicher, dass du ein verifiziertes Discord-Konto hast, bevor du dem Midjourney Discord-Server beitrittst.
- Abonnement abschließen: Um Bilder mit Midjourney zu generieren, musst du ein Abonnement abschließen. Gehe dazu auf die Midjourney-Website, melde dich mit deinem verifizierten Discord-Konto an und wähle einen Abonnementplan, der deinen Bedürfnissen entspricht.
- Midjourney Server beitreten: Tritt dem Midjourney Server auf Discord bei. Öffne Discord, finde die Serverliste auf der linken Seitenleiste, drücke den
+
-Button am unteren Rand der Serverliste, klicke im Pop-up-Fenster auf den ButtonServer beitreten
, füge die URL http://discord.gg/midjourney ein und drücke aufBeitreten
. - Zu einem Channel navigieren: Nachdem du dem Midjourney-Server beigetreten bist, siehst du mehrere Kanäle in der Seitenleiste. Wähle einen Kanal, der mit
general-#
odernewbie-#
gekennzeichnet ist. Diese Kanäle sind für Anfänger gedacht, um den Midjourney-Bot zu nutzen. - Verwende den /imagine Befehl: Tippe im Nachrichtenfeld '/imagine prompt:' ein und gib dann eine Beschreibung des Bildes ein, das du erstellen möchtest. Der Bot interpretiert deine Textaufforderung und beginnt mit der Generierung der Bilder.
- Bildgenerierungsprozess: Nachdem du einen Text-Prompt eingereicht hast, verarbeitet der Midjourney-Bot deine Anfrage und erstellt innerhalb einer Minute vier einzigartige Bildoptionen. Jede Bildgenerierung wird auf deine GPU-Zeit angerechnet, die in deinem Midjourney-Abonnement enthalten ist.
- Bild auswählen oder Variationen erstellen: Sobald dein anfängliches Bildgitter generiert wurde, stehen zwei Reihen von Schaltflächen unter deinem Bildgitter zur Verfügung. Mit den
U
-Schaltflächen kannst du dein gewähltes Bild aus dem Raster herauslösen, während dieV
-Schaltflächen verwendet werden, um Variationen des ausgewählten Bildes zu erstellen. - Bild verbessern oder ändern: Nachdem du ein Bild ausgewählt hast, stehen dir erweiterte Optionen zur Verfügung, um Variationen zu erstellen, das Bild zu vergrößern oder den Bildbereich in eine bestimmte Richtung zu erweitern.
- Bild speichern: Klicke auf das Bild, um es in voller Größe zu öffnen, und wähle dann mit der rechten Maustaste
Bild speichern
. Auf Mobilgeräten lange auf das Bild tippen und dann das Download-Symbol in der oberen rechten Ecke antippen.
Für detailliertere Informationen und Anleitungen zu Midjourney kannst du die offizielle Midjourney Dokumentation und den Midjourney Quick Start Guide konsultieren.
Was du bei der Erstellung von Midjourney-Prompts beachten musst
Wenn du Midjourney verwendest, um Bilder zu generieren, gibt es einige wichtige Tipps, die du beim Schreiben deiner Prompts beachten solltest:
- Einfache und wörtliche Sprache: Vermeide komplexe Wörter oder Redewendungen, die die KI von Midjourney verwirren könnten. Halte die Sprache einfach und direkt.
- Richtige Länge finden: Idealerweise sollten Prompts zwischen 5 und 75 Wörter lang sein. Zu kurze Prompts lassen Spielraum für Fehlinterpretationen, während zu lange die KI verwirren können.
- Klare und direkte Aufforderungen: Sorgen für klare und direkte Ergebnisse. Beispielsweise ist ein einfacher Prompt wie "Ein Hund" weniger beschreibend als "Ein Hund, der eine Frisbee jagt, während er auf einem Feld läuft. Realistisch. Weitwinkelaufnahme."
- Verwendung von Synonymen: Wenn die von der KI generierten Bilder nicht deinen Vorstellungen entsprechen, versuche, deine Vokabeln zu variieren. Anstatt immer die gleichen Worte zu verwenden, probiere Synonyme aus.
- Grammatik vernachlässigen: Im Gegensatz zu Menschen versteht der Midjourney-Bot keine Grammatik oder Satzstruktur. Du musst also nicht grammatikalisch perfekt sein, wenn du Prompts schreibst.
- Vermeidung negativer Sprache: Versuche, negative Formulierungen zu vermeiden, da die KI dazu neigt, sich auf das zu konzentrieren, was sie nicht tun soll.
- Details festlegen: Überlege dir genau, wie das Subjekt, die Aktion, die Umgebung, das Medium, die Beleuchtung, die Farbe und die Stimmung deines Bildes aussehen sollen. Verwende beschreibende Wörter, um diese Aspekte klar zu machen.
- Künstlerische Stile und Medien angeben: Wenn du einen bestimmten künstlerischen Stil oder ein bestimmtes Medium bevorzugst, wie zum Beispiel impressionistische Malerei oder CG 3D-Rendering, gib dies in deinem Prompt an.
- Parameter verwenden: Parameter wie Aspektverhältnis (--ar) und Stilisierung (--s) am Ende deines Prompts können dir helfen, die KI-Generierung genauer zu steuern.
- Experimentieren und Iterieren: Generiere mehrere Bilder für jeden Prompt, um verschiedene Variationen zu erkunden. Wenn du ein Bild magst, aber kleinere Fehler korrigieren musst, verwende die Upscale-Funktion und wähle "Vary (Subtle)", um kleine Änderungen am Originalbild vorzunehmen.
Denke daran, dass das Schreiben von Prompts eine Kunstform ist, die Übung erfordert. Mit der Zeit wirst du lernen, wie du deine kreativen Vorstellungen am besten in Midjourney umsetzen kannst.
Für weitere Tipps und Beispiele kannst du die Guides auf Sprinkle of AI, Anakin.ai und Superside besuchen.
Welche Einstellungen du in Midjourney vornehmen kannst
In Midjourney kannst du verschiedene Parameter einstellen, um die Generierung deiner Bilder zu beeinflussen. Diese Parameter fügst du am Ende deines Bildprompts hinzu. Hier sind einige der wichtigsten Parameter:
- Aspect Ratio (--aspect, --ar): Ändert das Seitenverhältnis des Bildes. Du kannst verschiedene Verhältnisse einstellen, um beispielsweise quadratische, breite oder hohe Bilder zu erzeugen.
- Chaos (--chaos): Bestimmt, wie unterschiedlich die Ergebnisse sein werden. Höhere Werte führen zu ungewöhnlicheren und unerwarteteren Bildern.
- Image Weight (--iw): Legt das Gewicht des Bildprompts im Verhältnis zum Textgewicht fest. Der Standardwert ist 1.
- Quality (--quality, --q): Bestimmt, wie viel Zeit für die Rendering-Qualität aufgewendet wird. Höhere Werte bedeuten eine höhere Detailgenauigkeit, verbrauchen aber mehr GPU-Minuten.
- Seed (--seed): Ein Seed-Wert wird verwendet, um die anfänglichen Bildgitter zu generieren. Wenn du denselben Seed-Wert und denselben Prompt verwendest, erhältst du ähnliche Bilder.
- Style (--style): Ermöglicht das Wechseln zwischen verschiedenen Versionen des Midjourney-Modells.
- Stylize (--stylize): Beeinflusst, wie stark der Standardstil von Midjourney auf die Bilder angewendet wird.
- Tile (--tile): Erzeugt Bilder, die als sich wiederholende Kacheln für nahtlose Muster verwendet werden können.
Diese Parameter bieten dir eine große Vielfalt an Anpassungsmöglichkeiten, sodass du das Aussehen und den Stil deiner Bilder genau steuern kannst. Es ist nützlich, mit verschiedenen Kombinationen von Parametern zu experimentieren, um zu sehen, wie sie die Bildergebnisse beeinflussen. Weitere Informationen zu den Parametern und ihren Auswirkungen findest du in der Midjourney-Dokumentation.
Welche Technologien stecken hinter Midjourney?
Midjourney basiert auf einigen faszinierenden Technologien, die es ermöglichen, Bilder aus Textbeschreibungen zu generieren. Zu den Haupttechnologien hinter Midjourney gehören:
- Diffusionsmodelle: Midjourney verwendet Diffusionsmodelle, eine fortschrittliche Methode des maschinellen Lernens. Diese Modelle modellieren die Bildentstehung als einen schrittweisen Verfeinerungsprozess, der mit Rauschen beginnt und sich langsam unter Anleitung der Textbeschreibung schärft.
- Natürliche Sprachverarbeitung (NLP): Zuerst analysiert Midjourney die Text-Prompts mit NLP. Dabei werden Sätze grammatisch zerlegt, um Schlüsseldetails semantisch zu erfassen. Das NLP-Modell decodiert die Wörter in strukturierte Daten, mit denen die KI arbeiten kann.
- Generative Adversarial Networks (GANs): Nach der Analyse des Prompts durch NLP setzt Midjourney generative Adversarial Networks ein, um neue Bilder zu generieren. Diese Technologie umfasst zwei neuronale Netzwerke – den "Creator" und den "Critic". Der Creator generiert das Bild, während der Critic es bewertet.
- Maschinelles Lernen und Künstliche Neuronale Netzwerke: Ähnlich wie beim Lehren eines Kindes, Objekte zu erkennen, funktioniert maschinelles Lernen, indem die KI Millionen von Bildern präsentiert bekommt, um Formen, Farben, Texturen und mehr zu erkennen.
- Reinforcement Learning from Human Feedback (RLHF): Hierbei handelt es sich um eine Methode, bei der die KI durch Rückmeldungen von Menschen trainiert wird. Diese Rückmeldungen formen ein "Belohnungsmodell", das der KI hilft zu beurteilen, ob ihre Ergebnisse mit menschlichen Werten, Verständnis und Vorlieben übereinstimmen.
Midjourney wurde von David Holz, dem Mitbegründer von Leap Motion, ins Leben gerufen und ist momentan nur über einen Discord-Bot auf ihrem offiziellen Discord-Server zugänglich. Die Nutzer generieren Bilder, indem sie den Bot direkt ansprechen oder den Bot zu einem Drittanbieter-Server einladen. Um den Bildgenerierungsprozess zu starten, geben die Benutzer den Befehl /imagine
gefolgt von einem Prompt ein, woraufhin der Bot eine Reihe von vier Bildern generiert.
Jede dieser Technologien trägt dazu bei, dass Midjourney einzigartige und kreative Bilder aus einfachen Texteingaben erstellen kann. Mit der kontinuierlichen Weiterentwicklung der Algorithmen und Modelle von Midjourney verspricht die Plattform, ein spannendes Werkzeug für Künstler, Werbetreibende und KI-Enthusiasten zu bleiben.
Zusammenfassung
Midjourney ist ein KI-basiertes Tool, das Bilder auf Basis von Textbeschreibungen erstellt. Es verwendet moderne maschinelle Lernmethoden wie Diffusionsmodelle, natürliche Sprachverarbeitung (NLP) und generative Adversarial Networks (GANs). Midjourney analysiert Text-Prompts mit NLP, um Schlüsselinformationen zu erfassen und nutzt GANs, um Bilder zu generieren. Diese Technologie ermöglicht es, vielfältige und kreative Bilder aus einfachen Texteingaben zu erstellen.
David Holz, Mitbegründer von Leap Motion, hat Midjourney ins Leben gerufen. Die Plattform, die seit Juli 2022 in der offenen Beta-Phase ist, hat verschiedene Versionen ihres Algorithmus veröffentlicht, wobei jede Version Verbesserungen und neue Funktionen bietet. Benutzer interagieren mit Midjourney über einen Discord-Bot, indem sie den /imagine
Befehl zusammen mit einem Text-Prompt eingeben. Der Bot erzeugt daraufhin vier Bilder, aus denen Benutzer auswählen können.
Das Tool hat in verschiedenen Bereichen wie Gaming, Werbung und Bildung Anwendung gefunden. Künstler nutzen es für schnelles Prototyping und Werbeagenturen erstellen damit visuelle Inhalte für Kampagnen. Trotz seiner Beliebtheit gibt es auch Kritik, vor allem bezüglich Urheberrechtsfragen, da Midjourney möglicherweise urheberrechtlich geschützte Bilder zum Training seiner KI verwendet hat.
Midjourney ist besonders für seine künstlerische Ausdruckskraft und Benutzerfreundlichkeit bekannt. Es bietet eine Balance zwischen Qualität, Zugänglichkeit und kreativem Ausdruck, was es zu einem spannenden Werkzeug für Künstler und Kreative macht.