アナウンス技術の練習支援システムに向けた基礎検討

本研究では,音声情報処理技術を用いたアナウンスの練習支援システムを提案する.アナウンスとは一般的にテレビやラジオなどでアナウンサーが情報を分かりやすく伝えるための技術である.本研究では,高校や大学で行われる競技アナウンスの採点基準を参考にして,アナウンス技術の評価指標を考察する.さらに,アナウンス初心者/経験者の音声データを収集し,評価指標に基づいて実装したシステムを用いて,アナウンス技術の定量的な分析を試みる.こうした分析を通して,アナウンス技術の練習支援システムに向けた基礎検討を行う.

システム構成図

発表

  • 山田 真那子, 塚田 浩二. アナウンス技術の練習支援システムに向けた基礎検討. 情報処理学会研究報告, 2024-HCI-208(34), pp.1-8. 2024-6. [PDF]

大規模言語モデルを用いた日本語ラップ創作支援システム

近年ラップ(HIPHOP)は世界的に人気のある音楽ジャンルであり,J-POP など別ジャンルにおいても,歌詞の一部にラップや押韻表現を取り入れる例が増えている.ラップ歌詞(Verse)の作成は,意味的な表現に加えて,押韻表現(Rhyme)を組み合わせる必要があるため,難易度が高い.
そこで,本研究では Verse 生成の初級者を対象として,任意のキーワードを入力として,大規模言語モデルを介して,意味表現・押韻表現を備えた Verse を生成する創作支援システムを提案する.キーワードの入力やシステムの提示する歌詞候補からの選択を対話的に行うことで,歌詞のテーマやユーザの意思を反映した一貫性のある Verse の生成を目指す.

左:通常の歌詞作成と Rhyme 表現を用いた歌詞作成手順の比較.
右:システム画面の一例.

発表

  • 廣 晴輔, 塚田 浩二. 大規模言語モデルを用いた日本語ラップ創作支援システム. インタラクション2024論文集, インタラクティブ発表, 1B-54, pp.416-419. 2024-3. [PDF]

WordCloudを用いたPC利用時の発話可視化手法の提案

スマートウォッチなどの普及により,個人のライフログを残すことが容易になった.しかし,個人のライフログとして発話情報を利用する試みは少ない.そこで本研究は,話者が気軽に日常を振り返ることを目的に, PC本体から流れる音声(PC音声)とPCを利用するユーザの音声(ユーザ発話)を同時に記録する.さらに,両者をWordCloud等を用いて可視化することで,PCの利用場面と発話内容を同時に可視化する振り返りシステムを提案する.

提案の概要

発表

  • 友広 純々野, 塚田 浩二. ワードクラウドを用いたPC利用時の発話場面の分析と応用. 情報処理学会研究報告, 2023-HCI-202(20), pp.1-7. 2023-3. [PDF]
  • 友広 純々野, 塚田 浩二. WordCloudを用いたPC利用時の発話可視化手法の提案. WISS2022予稿集, 1-A04. 2022-12. 【ユニティ・テクノロジーズ・ジャパン賞】 [PDF]

先頭に戻る