GPT Image はネイティブなマルチモーダル画像生成モデルです。gpt-image-1、gpt-image-1-mini、gpt-image-2 の 3 バージョンが利用でき、gptimg.co のブラウザから API キーなしで直接使えます。

GPT Imageの使い方は？

テキストからの画像生成、画像から画像への編集、マスクによるインペインティング、スタイル転送をすべて1つのモデルで実行できます。写実、イラスト、アニメ、3D、ベクター、データビジュアライゼーションに対応し、最大4096×4096ピクセルで出力可能。GPT Imageは画像内の読めるテキスト描画において、現在利用可能なモデルの中で最も強力です。

GPT Imageの料金はいくら？

GPT Image 2 の API 直接価格は 1 枚あたり 0.009 ドル（Low、1024×1024）、0.034 ドル（Medium）、0.133 ドル（High）。縦横の High は 0.200 ドル。トークン課金は入力テキスト 100 万あたり 5 ドル、入力画像 100 万あたり 10 ドル、出力画像 100 万あたり 32 ドル。gptimg.co ではこれらを無料トライアル付きのクレジット制プランにまとめています — 詳細は料金ページをご覧ください。

GPT Imageの生成速度はどれくらい？

GPT Image 2 は 1 枚あたり 5〜8 秒で返ります。ローンチ当初の初代モデルと比べて約 4 倍高速です。速度は選択した品質・解像度・キュー混雑に依存します。バッチ用途では gpt-image-1-mini ティアが最速かつ最安となることが多いです。

GPT Image 2 はどの解像度・アスペクト比に対応していますか？

GPT Image 2 は 3 種のサイズを出力します — 1024×1024（正方形）、1024×1536（縦）、1536×1024（横）。印刷用途には 4096×4096 まで拡大可能です。各サイズは Low / Medium / High で選べるので、コストと用途を合わせて調整できます。

GPT Imageの注意点・できないことは？

約 20 語を超える長い本文にはタイプミスが混ざることがあります。中国語・アラビア語・ヘブライ語など非ラテン系の表記は英語より精度が落ちます。手足や複数の顔が同じ画像内にある場合、誤ってレンダリングされることがあります。瓶ラベルのような曲面上のテキストは歪む場合があります。GPT Image 2 はこれらの失敗モードを減らしますが、完全に排除するわけではありません。

GPT Imageの出力は商用利用できる？

はい。GPT Image API で生成されたコンテンツは、適用される利用規定の範囲内で商用利用可能です。性的コンテンツ、過激な暴力描写、著作権侵害の素材はプラットフォーム側でブロックされます。クライアント向けに公開する前に、適用される利用規約をご確認ください。

ネイティブマルチモーダル・ 4K 出力・画像内の正確なテキスト・マルチターン編集

GPT Image — ネイティブマルチモーダル画像ジェネレーターをワークフローへ

GPT ImageのAI画像生成で写真品質のシーン、きれいな文字、精密な画像編集を実現。ブラウザから数秒で使い始められ、インストールは不要です。

無料で試す

作例を見る

すでに 10,000人以上のクリエイターがGPT Imageを活用中

商品撮影のためのGPT Image

スタジオ不要でライフスタイル写真を生成

陽が差し込むキッチンカウンターや東京の街角に商品を置いた情景をプロンプトで指定すれば、GPT Imageが数秒で仕上げます。撮影を繰り返さずに、SKUカタログ全体の背景、カラー、季節を入れ替え可能。他のモデルでは崩れがちな文字ラベルやロゴもきれいに読めます。

SNS・広告のためのGPT Image

本物のコピーでスクロールを止めるビジュアル

入れたい見出しをプロンプトに書くだけで、GPT Imageが正しく画像内に配置します。Instagramのカルーセル、TikTokのカバー、YouTubeサムネイル、広告クリエイティブをデザイナー不在でも制作可能。キャンペーン全体でブランドカラーとフォントを統一できます。

デザイナー・ドキュメント担当者のためのGPT Image

インフォグラフィック、ダイアグラム、UIモックアップを作成

ダッシュボード、プロセス図、資料スライドのラフな記述をGPT Imageに渡すだけで、枠、矢印、ラベルを正確なテキストでレイアウトします。コンテンツチームはデザイナーを待たずに素早くビジュアルを仕上げられます。

精密な画像編集のためのGPT Image

一箇所だけ変え、ほかはそのまま。

参照写真をアップロードし、編集内容を平易な英語で指示するだけ。モデルは複数ラウンドの編集でも顔の同一性、ライティング、構図の一貫性を維持します。商品バリエーションの描き直し、ポートレートの補正、撮り直しなしのクリエイティブA/Bテストに最適です。

GPT Imageとは？

ネイティブマルチモーダル画像ジェネレーター

GPT Image は、大規模言語モデルと同じように言語を理解するネイティブなマルチモーダル画像生成モデルです。従来の拡散モデル系ツールと異なり、プロンプトは呪文ではなく自然な会話として機能します — フォトリアルな人物像、ベクターイラスト、4K ポスター、編集可能な UI モックアップ、インフォグラフィックスをすべて同じモデルから生成できます。本ページは現行のフラッグシップである GPT Image 2 上で動作するため、API キーを自分で設定せずに最新世代の品質を得られます。

画像内に読める文字を描写

GPT Imageは文字の羅列ではなく、実際に読めるテキストを描きます。ポスター、商品ラベル、SNSグラフィック、UIモックアップなど、タイポグラフィが重要な用途に最適です。

Explore

必要な部分だけを変える画像編集

写真をアップロードして変更箇所を伝えるだけで、GPT ImageのAI画像生成は指定した部分のみを書き換え、照明や顔、構図はそのまま維持します。複数回の編集にも対応します。

Explore

世界知識を内蔵

GPT Image は深い世界知識で学習されているため、MacBook、Tesla Cybertruck、ルネサンス絵画が実際にどう見えるかを正しく把握しています。誤りを修正する手間が減り、一発目から使える出力が増えます。

Explore

写実もスタイライズも1つで対応

GPT Image単体で写実、3D、アニメ、イラスト、ベクター、データビジュアライゼーションまで幅広い表現をカバー。解像度は最大4096×4096で印刷用途にも対応します。

Explore

テキストから画像、画像から画像のAI画像生成

白紙のプロンプト、参考写真、マスク領域のいずれから始めても、GPT Imageは同じワークフローの中で補完、バリエーション、スタイル転送を処理します。

Explore

gpt-image-2 — 4倍の高速化

2025年12月のアップデートでGPT Imageの生成時間は1枚あたり5〜8秒に短縮、価格は20%引き下げ、5回以上の編集でも顔の同一性を維持できるようになりました。

Explore

GPT Imageの使い方

プロンプトから完成画像まで4ステップ

プロンプトを書く

シーン、被写体、画像内に入れたい文字を記述します。GPT ImageはGPTと同じく自然言語を理解するため、詳しい指示ほど良い結果が得られます。

参照画像をアップロード（任意）

商品写真、ポートレート、モックアップをアップロードすると、GPT ImageのAI画像生成は一から生成する代わりに編集を行います。変更したい領域はマスクで指定します。

品質とサイズを選ぶ

低・中・高の品質と、正方形からワイドスクリーンまでのアスペクト比を選択できます。印刷用途には最大4Kの高画質で書き出せます。

ダウンロードして調整

1枚あたり約5〜8秒で結果が返ってきます。プロンプトを練り直したり、マスクを調整したり、参照写真を差し替えて再実行しましょう。生成結果はすべてMy Creationsに保存され、保持期間は7日間です。

GPT Image モデルファミリー

リリース以降に公開されたすべてのGPT Image

現行のフラッグシップは GPT Image 2 です。このグリッドでは、本日時点で本番運用されているモデル群と、それぞれが何をもたらすかを示します。

gpt-image-1（2025年4月）

最初の公開版。最大 4096×4096 解像度。初日からテキスト描画と世界知識に強く、出力画像トークン 100 万あたり 40 ドルで提供されました。

gpt-image-1-mini（2025年10月）

2025 年 10 月にリリースされたコスト最適化版 GPT Image。下書きやバルクジョブ向けにコア品質を維持しつつ、ベースモデル比でおよそ 80% 安価です。

GPT Image 2（2025 年 12 月）

現行のフラッグシップ。ローンチ当初の初代と比べて約 4 倍高速 — 1 枚あたり 5〜8 秒、価格は 20% 引き下げ、5 回以上の編集を経ても顔の同一性を保ちます。

3 段階の品質ティア

GPT Image 2 は Low / Medium / High の 3 段階と 3 種のアスペクト比（正方形・縦・横）に対応。Low は 1024×1024 で 0.009 ドルと草案用に十分安く、High は本番品質のテキストとフォトリアリズムを提供します。

マルチターン編集

GPT Image 2 は 5 回以上の編集ラウンドでも視覚的な一貫性を保ちます。背景を変え、次に光を変え、さらに構図を変えても、各ステップが前のステップの上に積み上がります。

テキスト描画ベンチマーク

独立系の画像内テキストベンチマークで首位。短い見出しは綺麗に描画されます。20語を超える長文ではまだ誤字が残ることがあるため、精度が重要な見出しコピー、ロゴ、ラベルでの利用がおすすめです。

GPT Image よくある質問

GPT Image に関するすべて

GPT ImageでAI画像生成を始めよう

写真品質のシーン、きれいな文字、精密な画像編集をGPT Imageで。無料クレジットでブラウザからすぐに試せ、インストールも設定も不要。その後は使った分だけのクレジット制です。

ネイティブマルチモーダル・ 4K 出力・画像内の正確なテキスト・マルチターン編集

GPT Image — ネイティブマルチモーダル画像ジェネレーターをワークフローへ

GPT ImageのAI画像生成で写真品質のシーン、きれいな文字、精密な画像編集を実現。ブラウザから数秒で使い始められ、インストールは不要です。

無料で試す

作例を見る

すでに 10,000人以上のクリエイターがGPT Imageを活用中

商品撮影のためのGPT Image

スタジオ不要でライフスタイル写真を生成

SNS・広告のためのGPT Image

本物のコピーでスクロールを止めるビジュアル

デザイナー・ドキュメント担当者のためのGPT Image

インフォグラフィック、ダイアグラム、UIモックアップを作成

精密な画像編集のためのGPT Image

一箇所だけ変え、ほかはそのまま。

GPT Imageとは？

ネイティブマルチモーダル画像ジェネレーター

画像内に読める文字を描写

Explore

必要な部分だけを変える画像編集

Explore

世界知識を内蔵

Explore

写実もスタイライズも1つで対応

Explore

テキストから画像、画像から画像のAI画像生成

Explore

gpt-image-2 — 4倍の高速化

Explore

GPT Imageの使い方

プロンプトから完成画像まで4ステップ

プロンプトを書く

シーン、被写体、画像内に入れたい文字を記述します。GPT ImageはGPTと同じく自然言語を理解するため、詳しい指示ほど良い結果が得られます。

参照画像をアップロード（任意）

品質とサイズを選ぶ

低・中・高の品質と、正方形からワイドスクリーンまでのアスペクト比を選択できます。印刷用途には最大4Kの高画質で書き出せます。

ダウンロードして調整

GPT Image モデルファミリー

リリース以降に公開されたすべてのGPT Image

現行のフラッグシップは GPT Image 2 です。このグリッドでは、本日時点で本番運用されているモデル群と、それぞれが何をもたらすかを示します。

gpt-image-1（2025年4月）

最初の公開版。最大 4096×4096 解像度。初日からテキスト描画と世界知識に強く、出力画像トークン 100 万あたり 40 ドルで提供されました。

gpt-image-1-mini（2025年10月）

2025 年 10 月にリリースされたコスト最適化版 GPT Image。下書きやバルクジョブ向けにコア品質を維持しつつ、ベースモデル比でおよそ 80% 安価です。