授業紹介・ゼミ活動

PBL

新田ゼミ

新田ゼミ 2025年度卒業研究要旨

2026/03/17

2025年度卒業研究要旨リンク集

赤岡ゼミ鰺坂ゼミ和泉ゼミ奥居ゼミ井上ゼミ榎並ゼミ
庄野ゼミ大野ゼミ
大森ゼミ尾関ゼミ萩原ゼミ株本ゼミ
中野ゼミ肥後ゼミ平井ゼミ福井ゼミ藤本ゼミ/新田ゼミ

 

「生成AI を用いた効率的な体験伝承のための映像生成」

 本研究は,画像・映像生成AI を活用した歴史の体験伝承のための再現映像の自動制作を目的とする.画像・映像生成AI は.,入力されたテキストプロンプトに応じて単一の画像もしくは短い映像を生成できるが,複数のシーンから構成される映像の制作にこれを活用する場合,シーン構成,及び各シーンの画像もしくは映像を生成するためのプロンプトは人手で決定する必要がある.そこで本研究では,体験の口頭伝承テキストが存在することを前提に,口頭伝承テキストからテキスト生成AI を用いてシーン構成,及びプロンプトを自動生成することにより,映像制作の効率化を目指す.提案手法では特に複数のシーン間の連続性を担保するため,各シーンに共通する文脈情報と,各シーンの個別の情報をそれぞれ考慮してプロンプト生成を行う.実験により,文脈情報を考慮する場合としない場合を比較し,提案手法の有用性を検証する.

 

「画像とテキストの整合性に基づくニュース記事における印象操作の解析」

 インターネット上に公開されたニュース記事では,テキストに加えて画像を用いることにより,比較的容易に読者に特定の印象を与えることができると考えられる.本研究では,テキストと画像の意味の整合性を評価可能な深層学習モデルであるCLIP を用いて,ニュース記事における画像とテキストの印象の整合性を評価する方法を提案する.提案手法では,既存の学習済みモデルであるCLIP は学習時のデータの特性により印象の類似性を十分に表現できないと考えられるため,印象を表すと考えられる形容詞が名詞とともにラベル付けされた画像データセットを用いてファインチューニングを行うことにより,より高精度な印象の整合性評価を目指す.実験では,複数のメディアから収集したさまざまニュース記事に提案手法を適用し,実際のニュース記事における印象操作の傾向を比較した.

 

「テキストを用いた画像生成における感情空間モデルを用いた簡易な印象操作手法の検討」

 近年,テキストから画像を自動生成する AI 技術が発展しているが,画像生成の労力がテキスト生成の労力へと移行していると考えられる.そこで本研究では,特定の対象物の画像を生成する際,意図する印象を持つような印象操作をテキストを用いずに実現する方法について検討する.具体的には,感情価・覚醒度・支配度(VAD 値)からなる感情空間モデルに着目し,画像生成技術の一つであるStable Diffusion を対象に,テキストと画像の意味の整合性を評価可能なCLIP を用いて生成画像を制御するCLIP guidance を利用し,入力したVAD 値に応じて生成画像を制御する手法を提案する.実験により,まずCLIP のファインチューニングによりCLIP guidanceによる印象操作の性能が向上することを示した後,多様な物体に対し,VAD 値を用いて印象操作が簡易に行えることを示す.

 

トップへ戻る