もっと詳しく
Image:ArsTechnica

このところ画像生成AI、つまり入力された文章から詳細な画像を作り出す人工知能システムが大人気を博している。その最先端に位置する中国BaiduのERNIE-ViLGが「天安門広場」や政治指導者の名前などの政治的なテキストを検閲していることが、科学技術誌MITテクノロジーレビューで報告されている。

Zeyi Yang記者の記事によると、2021年にERNIE-ViLGの公開デモをしていたところ、一部のユーザーが政治的フレーズの検閲に気づいたという。それを受けてテックメディアArsTechnicaが、米Hugging Face(自然言語処理に特化したディープラーニングのフレームワーク)がホストしているERNIE-ViLGのデモを独自にテストしたところ、「中国の民主化」や「中国国旗」といったフレーズでは画像を生成できないと確認されたそうだ。

その代わりに中国語で「入力内容が関連ルールに適合していません。調整してもう一度試してください!」と警告されるという。

実際に特定のフレーズを入力すると、別の言葉でやり直すよう促される

画像生成AIで入力テキストに制約があるのは、中国に限った話ではない。たとえばAI研究企業OpenAIのDALL-E 2の場合、ヌードや暴力、政治的な内容など、いくつかの種類のフレーズは制限されている。しかし、これはOpenAIの自主的な判断であり、米国政府の圧力によるものではない。Midjourney(VRゴーグルのLeap Motion共同創業者であるDavid Holz氏が起業)も、一部のキーワードが自主的にフィルタリングされているが、こちらも政府の方針とは無縁のはずだ。

さらにStability AIのStable Diffusionは、オープンソースゆえに「安全フィルター」を無効化できてしまい 、実行する環境によってはほとんど何でもできる。

実際Stability AI代表のEmad Mostaque氏も、政府や企業による画像生成AIの検閲を避けたいとツイートしている。また先週のReddit AMA(様々な人々が質疑応答を行うコミュニティ)では、「これらのモデルやサービスを作る際に、人々は自由に自分がベストと思うことを行うべきだと思う」と回答している

Baiduが自主的に検閲しているのは、中国政府とのトラブルを未然に防ぐためなのか、それとも隠された公的規制があるのかは不明である。今のところ中国政府は画像生成AIを検閲するとは公に言っていないが、いずれ法制化などが打ち出されるのかもしれない。