最近の AI のイノベーションは、私たちのアートへのアプローチ方法を根本的に変える可能性があります。
DALL-E 2 などのモデルは、プレーン テキスト入力から高品質の画像を作成できることで有名になりました。
DALL-E 2 はまだ一般公開されていませんでしたが、多くの人が同じように機能する代替手段を探していました。 最も人気のある代替手段の XNUMX つは、オンライン サービス Midjourney です。
Discord サーバーには 3 万人を超えるユーザーがおり、画像やアートを生成するための最もアクセスしやすい拡散モデルの XNUMX つです。
この記事では、その内容について説明します ミッドジャーニー できることとその仕組み。 その後、ステップバイステップのガイドを使用して、初めて AI で生成された画像を作成する方法を説明します。
ミッドジャーニーとは?
ミッドジャーニー は、テキスト入力から画像を作成できる独自の AI 搭載ツールです。 同種の他のモデルとは異なり、Midjourney サービスはオンラインの Discord サーバーを介してアクセスされます。
Midjourney でアートを作成したいユーザーは、Discord アカウントを作成し、Midjourney の公式サーバーにアクセスする必要があります。 そこから、「チャネル」と呼ばれる多くの利用可能なオープン チャット ルームの XNUMX つに移動する必要があります。
これらのチャネルでは、ユーザーは他の複数のユーザーと一緒にテキスト プロンプトを送信します。 他のユーザーは、プロンプトと出力画像を見ることができます。
フロントエンド インターフェイス全体が基本的に Discord プラットフォームにあるため、過去数か月でサーバーが大幅に成長したのも不思議ではありません。 2022 年 XNUMX 月現在、プラットフォームの歴史の中で最大の Discord サーバーです。
創設者の David Holz 氏によると、ユーザーの約 30% が Midjourney をプロとして使用しています。 Holz 氏は、多くのグラフィック アーティストがコンセプト開発ワークフローの初期段階として Midjourney を使用していると述べました。
Midjourney は、コマーシャル イラスト業界にも影響を与え始めています。 英国の雑誌 The Economist は、Midjourney を使用して、最近発行された号の表紙を作成しました。
ミッドジャーニーはどのように機能しますか?
Midjourney はプロプライエタリであるため、モデルが他の画像生成モデルとどのように異なるかは正確にはわかっていません。 安定拡散 ただし、Midjourney がニューラル ネットワークを使用して画像を生成することはわかっています。
また、他の多くの画像生成アルゴリズムと同様に、Midjourney は拡散モデリングと呼ばれる手法に依存しています。
拡散モデルは、画像が無意味なノイズになるまで、基本的に画像を少しずつ分解することによって機能します。 次に、モデルは画像のノイズ除去を試みて、拡散プロセスを逆にする方法を学習します。
画像生成モデルは通常、最初のテキストを解釈するステップを追加します。 たとえば、ユーザーが Midjourney に、緑色の毛糸玉で遊ぶ猫の画像を作成するように依頼したとします。 テキスト エンコーダーは、入力テキスト「緑の毛糸の玉で遊ぶ猫」を受け取り、それを各単語を表す数字のリストに変換します。
ノイズのランダム グリッドから始めて、Midjourney は元のテキストから取得したセマンティック情報を組み込みながら、画像のノイズを除去しようとします。
最初の中間イメージの作成
このセクションでは、最初の Midjourney イメージを作成するのに役立つクイック ガイドを提供します。
まず、に参加する必要があります ミッドジャーニー Discord サーバー. Discord アカウントをまだ持っていない場合は、アカウントを作成するよう求められます。 Discord を使用すると、簡単にアカウントを作成でき、ブラウザからアプリケーション全体にアクセスできます。
サーバーに参加したら、利用可能な「新規」ルームの XNUMX つを選択する必要があります。 これらの部屋は、他の Midjourney ユーザーと一緒にテキスト プロンプトを送信する場所になります。
次に、「/imagine」コマンドを入力し、プロンプトを入力します。
Midjourney は、プロンプトに基づいて XNUMX つのオプションを生成します。 Discord ボットが出力を返すまでに最大 XNUMX 分かかる場合があります。 XNUMX つの画像のアップスケールまたはバリエーションの作成を選択できます。
この例では、「ファンタジー城の戴冠式」というプロンプトを入力しました。
特定の画像の追加のバリエーションを生成することを選択できます。 この例では、ボタン「V2」を選択して、XNUMX 番目の画像のバリエーションを作成しています。
画像を拡大することもできます。 画像をアップスケーリングすると、選択した画像の 1024 x 1024 ピクセルのより大きなバージョンが生成されます。 アップスケールされた画像には、多くの場合、追加の詳細も追加されます。
Midjourney には、実験的なリマスター機能も用意されています。 この機能により、品質と一貫性が向上した画像が再生成されます。
アップスケールまたはリマスターされたプロンプトを生成した後、画像をクリックしてダウンロードし、画像をフルサイズで表示できるようになりました。 画像を右クリックして選択 画像を保存 ローカルに保存します。
Discord アカウントを Midjourney の公式 Web アプリケーションに接続して、Midjourney が生成したすべての画像を表示できます。
価格(英語)
Midjourney には、Basic と Standard の XNUMX つの主なプランがあります。
基本プランは月額 10 ドルで、ユーザーは毎月約 200 のプロンプトを実行できます。 標準プランの価格は月額 30 ドルで、ユーザーはさらに 15 GPU 時間を使用して画像を生成できます。 これは、毎月のリクエスト数の約 4.5 倍に相当します。
標準プランにアップグレードすると、「リラックス」モードのロックも解除されます。これにより、ユーザーは待ち時間がわずかに長くなる代わりに、無制限の数のジョブを実行できます.
ユーザーは、月額 20 ドルを追加して、ユーザーがリクエストを非公開で実行できるようにすることもできます。
まとめ
Midjourney は、有料プランへのアップグレードを決定した場合に公正な価格を提供する AI 画像生成の優れたツールです。
ツール自体に加えて、アプリを取り巻くコミュニティにより、他の同様の AI ツールの中でも際立っています。 Discord サーバーには、ユーザーが参加できる毎日のコミュニティ イベントとチャレンジがあります。 サーバー内にはさまざまなチャネルがあり、質問をしたり、プロンプトを改善するためのヒントやコツを見つけることができます。
コメントを残す