ポッドキャストやオーディオブックなどの音声コンテンツを聴くことは,人々が知識と関与する方法の一つです.聴く行為は,目で読む読書と違ってながらで行うことができ,学習の機会を広げることができます.本研究では,大規模言語モデル(LLM)を用いてテキスト文書を音声コンテンツに変換する可能性を探り,研究論文のようなニッチなコンテンツにおいて聴きやすい教材が不足している課題に取り組みます.この目的に向けて,学術論文のPDFを会話形式のポッドキャストに変換するプロトタイプ「PaperWave」(https://paperwave.app)を開発しました.著者を含む11名の参加者を対象としたフィールド調査を伴う自伝的デザインにより,文書–音声変換システムに対するニーズのニュアンスとそれによって生じうる知識との関与の変化を記述しています.これにより,文書から音声への変換システムを設計する際に,リスナーと環境とのインタラクションを考慮することの重要性を浮き彫りにしています.
矢作優知, 中條麟太郎, 原田悠我, 韓燦教, 杉山昂平, 苗村健: “PaperWave: 研究論文を会話形式ポッドキャストとして聞く\システムの自伝的デザイン,” ヒューマンインタフェース学会論文誌, vol. 27, no. 4, pp. xx–xx (2025.11). (印刷中)
[Free Access] Yuchi Yahagi, Rintaro Chujo, Yuga Harada, Changyo Han, Kohei Sugiyama, and Takeshi Naemura: “PaperWave: Listening to Research Papers as Conversational Podcasts Scripted by LLM,” in Extended Abstracts of the CHI Conference on Human Factors in Computing Systems (CHI EA ‘25), Yokohama, Japan (2025.4.29). Acceptance rate: 23.7%
[Demo] [YouTube] [Slide (CHI2025)] [GitHub (CLI)] [GitHub (Web)]
[Free Access] 矢作優知, 中條麟太郎, 原田悠我, 韓燦教, 杉山昂平, 苗村健: “LLMを用いた研究論文の対話形式ポッドキャストへの変換システムPaperWaveの開発,” 電子情報通信学会技術研究報告, HCGシンポジウム2024, (2024.12.11). 🏆 最優秀インタラクティブ発表賞 (上位 3.9%)
Best Presentation Award, IIW Poster Session by PhD Students in 2024, 2025.1.6. (上位 4.3%, 3/69件) (PaperWave, 主著)
最優秀インタラクティブ発表賞, HCGシンポジウム2024, 2024.12.13. (Top 3.9%, 5/129) (PaperWave, 主著)
