情報発信元:https://ja.stability.ai/blog/japanese-stable-diffusion-xl
(別サイト「Stability AI Japan」を別ウィンドウを開きます。)
【概要】
英国のStability AI社は、日本特化の画像生成AIモデル「Japanese Stable Diffusion XL(JSDXL)」を発表しました。
同社がこのような地域特化型の画像生成AIを公開するのは初めての試みとなります。このモデルは日本の文化やアートを反映した画像生成に特化しており、
日本語の指示文にも対応します。
従来のモデルでは欧米風の画像が生成されやすい一方で、日本風の画像は苦手とされていましたが、JSDXLでは日本風の画像が容易に生成できます。
商用利用も可能となり、国内向けの商品デザインや広告画像の作成に適しています。
【執筆者コメント】
初期の画像生成AIでは、美女や美少女といった比較的需要の高い画像の生成は、得意でしたがアジア人や男性(特におじさん)は学習データや需要が少なく、命令を出すとこれじゃない感満載の画像を吐き出すことが多かったように思います。
今回のStability AI社の取り組みでは、従来苦手としてきた日本風画像(日本人や日本固有の風景 等)の画像や日本語の説明文によるデータを大量に追加学習させることにより、日本語での命令(日本語特有の表見)やAI生成画像の精度向上を実現させています。
実際にデモ画像として「富士山」、「着物」、「忍者」、「京都の街並み」、「日本人の若者(特に男性)」の生成画像が載せられていましたが、Webサイトや雑誌等の挿絵として使用するには十分な出来栄えに思えました。これまでのなんちゃっての日本風画像と比べると1段階解像度が上がったように感じますね!
また、以前より本サイトでも度々触れてきましたが、以下の課題については引き続き注視していく必要がありそうです。
*無意識のバイアス(偏見)への課題
AIが生成する画像やコンテンツは、使用されるデータに大きく依存します。特に今回のような地域特化型生成AIでは、その地域の文化を学習してアウトプットを生み出すため、バイアスやステレオタイプを再生産しないよう、データの選択と管理には慎重な配慮が必要です。
*著作権や知的財産権の問題
今回の「Japanese Stable Diffusion XL(JSDXL)」は商用利用可能なモデルとなっていますが、既存の著作物との類似性と依拠性(既存の著作物をもとに創作したこと)が認められ、著作権法が定める利用行為(複製・翻案等)に該当すれば、著作権侵害が原則として成立する可能性があるため依然として注意が必要です。
今後は、このように地域や分野に合わせて必要なデータを追加学習させて特化型AIを公開する流れとなっていきそうですね!
執筆者/
リビルダーズ編集部 丹治 秀人