アンダーワークスのカオスマップ・プロジェクトチームです。テクノロジーの調査を終え、プロジェクトは最終局面に入りました。今年も生成AIはさまざまな業界で注目を集め、特にマルチモーダル機能を持つツールの普及が広がっています。企業にとっては、生成AIツールの選定がますます重要になってきており、どのように活用するかが競争力の鍵となります。本記事では、生成AIの進化とそれをどのように企業が活用しているかを紹介します。
カオスマップ2024-25の傾向:生成AIの進化と拡大
昨年、生成AIはカオスマップで新たなカテゴリとして登場し、今年もその成長は続いています。特に、テキスト生成だけでなく、画像や動画、音声といったマルチモーダルな生成AIツールが広く採用されており、それらのツールが均等に増加傾向にあります。しかし、ツールの淘汰はまだ始まっておらず、業界内の競争は活発化しています。この競争環境下で企業は、複数の選択肢を検討しながら最適なツールを見つけ、試行錯誤を続けることが求められるのではないでしょうか。
2024年国内のハイプサイクルにおける生成AIの位置づけ
生成AIは国内のハイプサイクルにおいて、昨年に続き2024年も「過度な期待」のピーク期に位置付けられています。
2024-25年版カオスマップに新しく追加したテクノロジーの中では、検索拡張生成 (RAG) も「過度な期待」のピーク期にあります。RAGは大規模言語モデル (LLM) と検索 (サーチ) のハイブリッド・アプローチですが、このアプローチによって企業は自社データを生成AIの出力に組み込むことができるため、より業務に特化した生成AIの利用が期待されています。
生成AIの技術的基盤:GoogleのTransformerの役割
Googleが2017年に発表したTransformerは、生成AIの技術的基盤として重要な役割を果たしています。このアーキテクチャは、従来の再帰型ニューラルネットワーク(RNN)や長短期記憶(LSTM)モデルの限界を克服し、並列処理による高速な学習と、長期依存関係の効果的な捕捉を可能にしました。
Transformerの革新性は、「自己注意機構(Self-Attention)」にあります。この機構により、入力シーケンスの各要素が他のすべての要素との関係性を考慮できるようになり、文脈の理解が飛躍的に向上しました。これは特に自然言語処理において画期的でした。
Googleの貢献は、Transformerのオープンソース化にも及びます。これにより、OpenAIのGPTシリーズを含む多くの後続モデルが開発され、生成AI技術の急速な進化と普及につながりました。Transformerは今や、テキスト生成だけでなく、画像認識や音声処理など、AI全般の基盤技術となっています。
生成AIの進化:GoogleやOpenAIのLLMリリース
生成AIの進化は、GoogleやOpenAIによる大規模言語モデル(LLM)のリリースによって加速しました。
・2018年10月:GoogleのBERTが登場し、自然言語処理タスクで高い性能を示す
・2019年2月:OpenAIがGPT-2をリリース、テキスト生成能力が大幅に向上
・2020年6月:OpenAIがGPT-3を発表、175Bパラメータの巨大モデルで話題に
・2022年3月:ChatGPT(3.5)が一般公開され、対話型AIの新時代を開く
・2023年3月:GPT-4がマルチモーダル機能を備えて登場、AIの応用範囲を拡大
・2024年9月:OpenAIがo1をリリース
ChatGPT(3.5)はリリースからわずか2ヶ月でユーザー数が1億人に到達するという驚異的なスピードで普及しました。この急速な普及は、それだけ生成AIが幅広い分野で受け入れられ、役立つツールとして認知されていることを示しています。
また、最新のo1は、従来のGPTモデルよりも文脈理解やタスク自動化が強化され、より人間に近い対話やクリエイティブな作業をサポートします。処理速度と柔軟性も向上しており、幅広い業界での応用が期待されています。さらに、安全性と倫理面での配慮も強化されています。
生成AIの進化した機能:テキスト以外の生成AI(画像、動画、音声)
OpenAIを筆頭に、生成AIの機能は急速に拡大しています。GPT-4の登場により、テキストだけでなく画像も入力として理解できるマルチモーダルAIが実現しました。これにより、画像の詳細な説明や、画像に基づいた複雑なタスクの遂行が可能になりました。
画像生成の分野
DALL-E 3が高品質で創造的な画像生成を実現しています。プロンプトエンジニアリングの進化により、より細かい指示に基づいた画像生成が可能になり、デザイナーやアーティストの創作プロセスに革命をもたらしています。
動画生成技術
短い動画クリップの生成やエディティングが可能になっています。これは広告制作やソーシャルメディアコンテンツの作成に新たな可能性を開いています。
音声生成技術
テキストから自然な音声を生成したり、既存の音声を別の話者の声に変換したりすることが可能になっています。これは、ポッドキャスト制作や音声ブック作成、さらにはバーチャルアシスタントの開発などに応用されています。
これらの技術の進化により、コンテンツ制作のワークフローが大きく変わりつつあり、クリエイティブ産業に新たな可能性と課題をもたらしています。
他社の生成AI技術:競争が激化するAI市場
生成AI市場では、OpenAI以外にも多くの企業が独自の技術開発を進めています。
・Google:PaLMやLaMDAなどの大規模言語モデルを開発し、Bardという対話AIサービスを展開
・Meta:LLaMAシリーズを開発し、オープンソースでの提供を通じてAI開発コミュニティに貢献
・Anthropic: ConstitutionalAIアプローチを採用したClaudeを開発、倫理的なAI開発に注力
・Stability AI:画像生成AI「Stable Diffusion」を開発、オープンソースでの提供により幅広い応用を促進
各社は、モデルの大規模化、マルチモーダル機能の強化、推論速度の向上、エネルギー効率の改善など、さまざまな方向性で技術開発を進めています。また、特定の産業やタスクに特化したAIモデルの開発も活発化しています。
この競争の激化により、AIの性能向上とコスト低下が進み、より多くの企業や個人がAI技術を活用できる環境が整いつつあります。今後は、AIの特殊化と汎用化の両面で開発が進むと予想されます。
生成AIの具体的な活用事例
広告産業:PARCO HAPPY HOLIDAYS キャンペーンCM
株式会社パルコによる、広告内の全ての要素に最先端の画像生成AIを活用したファッション広告
・モデル撮影を行わず、プロンプトから人物を生成
・グラフィック・ムービーのほか、ナレーション・音楽も画像生成AIで制作
・クリスマスオーナメントやプレゼントボックスなどのモチーフも画像生成AIで制作
ゲーム産業:Red Ram
モリカトロン株式会社が開発した、コンテンツ全てを生成AIが生成するマーダーミステリーゲーム
・ストーリー構成、トリック、フロー(プログラム)、キャラクター、背景画像などを生成AIによって生成・展開
・プレイヤーが入力した情報に基づいて、ストーリーや証拠品などが変化
・テキストと画像生成AIの自動連動により、人の手を介さず、キャラクター・背景などのイメージをもとに絵を生成
アニメ産業:AI×アニメ プロジェクト
株式会社K&Kデザインと株式会社タジクによる、AIとクリエイターの共創による新しいアニメの可能性を探求するプロジェクト
・ラフデザインや手描きスケッチをベースに、生成AIを利用してキャラクターのバリエーションを自動生成
・生成AIで生成した背景画像を編集・加工して利用
・手描きスケッチへの自動彩色
出典:経済産業省「コンテンツ制作のための生成AI利活用ガイドブック」より、アンダーワークス作成
https://www.meti.go.jp/policy/mono_info_service/contents/ai_guidebook_set.pdf
生成AI利活用の法的問題点
生成AIは、コンテンツ制作の分野においてもその活用が期待されています。しかし、生成AIの利用には、著作権、意匠権、商標権、肖像権、パブリシティ権など、様々な法的問題点が存在します。
1.著作権侵害のリスク:AIが学習に使用するデータや生成物が他人の著作物と類似する可能性があり、これが著作権侵害に該当するリスクがあります。生成物の利用や公開に際しては、著作権侵害がないか確認する必要があります。具体的には、AIが生成したコンテンツが他人の著作物と「類似性」や「依拠性」を持っているかどうかを確認することが重要です。
2.プロンプトの入力時の注意: AIに指示を与えるプロンプトに他人の著作物を利用することが権利侵害につながる場合があります。例えば、特定の著作物に関連する指示を行うと、その生成物が著作権侵害に該当する可能性が高まるため、入力内容にも配慮が必要です。
3.学習用データの取り扱い:AIが学習に利用するデータセットには、著作権を有するデータを利用しないようにすることが求められます。許諾を得たデータや著作権保護期間が過ぎたデータを使用することが推奨されます。
4.肖像権やパブリシティ権の保護:人物の肖像や声を生成物に含める場合、肖像権やパブリシティ権の侵害のリスクがあります。特に著名人やキャラクターの権利に対しては慎重な対応が求められます。
5.誹謗中傷や差別表現の防止:AI生成物において、差別的な表現や誹謗中傷を含まないように、事前にフィルタリングを行うことが重要です。
生成AIの利用に関する法的問題点は多岐にわたり、複雑なケースも存在します。そのため、法的問題やコンテンツ制作における問題については、弁護士等の専門家に相談することが推奨されます。
まとめ
生成AIは急速に進化し、テキスト生成から画像、動画、音声まで機能が拡大しています。広告、ゲーム、アニメなど様々な産業で革新的な活用事例が生まれ、創造性と効率性を大きく向上させています。著作権侵害や肖像権問題などの法的課題はありますが、これらの課題に真摯に向き合うことで、より安全で信頼性の高いAI活用が実現できるでしょう。生成AIは私たちの創造力を拡張し、新たな可能性を開く強力なツールです。今後、AIの特殊化と汎用化が同時に進む中、これらの課題に適切に対処しながら、AIの恩恵を最大限に活用していくことが、企業や社会にとって重要な課題となるでしょう。
アンダーワークスの支援サービス
自分たちがやりたいこと・得意なこと・売りたいものではなく、中立的な立場でお客様に最適なテクノロジーの選定から効果的な活用まで、包括的な支援を提供しております。
・最適なマーケティングツールと技術の組み合わせの提案
・導入から運用までの一貫したサポート
・最大限の効果を引き出すための専門的なコンサルティング
マーケティングツールや技術の選定、導入、運用支援に関するご相談は、こちらからお気軽にお問い合わせください。お客様一人ひとりのニーズに合わせた、カスタマイズされたマーケティングテクノロジーソリューションをご提案いたします。