本文へジャンプ
お客さまインタビュー

キャラクターの声を忠実に再現する超高度な音声合成
おしゃべりアプリを音声技術で支える「ToSpeak™ Gx Neo」

カンパニー:株式会社ブックウォーカー × RECAIUS 音声合成ミドルウェア「ToSpeak™」

プロジェクトメンバーの皆様

 電子書籍ストア「BOOK☆WALKER」を運営するなど電子書籍を中心に事業を展開している株式会社ブックウォーカーでは、キャラクターとおしゃべりできるスマートフォンアプリ「進化型おしゃべりアプリISEKAI」を提供し、ファンとの新たなコミュニケーション手法を活用したビジネスを推進している。アプリ内では声優の声を忠実に再現する音声合成の仕組みを活用しているが、この音声合成エンジンに採用されたのが、東芝デジタルソリューションズ(以下、東芝)が提供しているRECAIUS™ 音声合成ミドルウェア「ToSpeak™ Gx Neo」だ。

新規ビジネスを検討していたと当初、スマートスピーカーやIOT家電など音声UIの今後の広がりに注目。今後は自分の好きなアニメキャラの声に対するニーズと市場が育つと考えた。音声合成のクオリティが以前と比べ、かなり向上したこと、KADOKAWAグループとしての強みを活かすために、ビジネスの検討を始めた。BtoBでの音声合成を使ったビジネスを推進していくのと並行に、ショウケースとしてBtoCに着手。また、ビジネスも含めた継続的な開発、実装、及びビジネスの検討を開始するにあたり、同社の立場で考え、一緒に歩んでいけるパートナーのような存在の企業を探していた。

RECAIUS 音声合成ミドルウェア「ToSpeak Gx Neo」を採用することで、まるで声優がしゃべるような臨場感のある声を音声合成で再現することに成功。チューニングしやすく、キャラクターの声の忠実な再現に貢献。アニメの新たな付加価値を提供できる可能性を作った。

導入の背景

テクノロジーとアニメの相性を考えるなかで着目した音声

 KADOKAWAグループのデジタル戦略子会社として2005年に設立され、電子書籍ストア「BOOK☆WALKER」の運営をはじめ、電子書籍や電子雑誌など電子コンテンツの制作、配信および販売を行っている株式会社ブックウォーカー。配信コンテンツは、マンガや小説、ライトノベルなど60万冊を超える。さらに、講談社や集英社、小学館などKADOKAWA以外の電子書籍も取り扱うことで作品ラインナップの充実を図りながら、出版社直営の総合電子書籍ストアとして新たな読書スタイルを提案している。

原田 由佳氏

常務取締役

原田 由佳氏

 そんな同社では、アニメ事業に注力するKADOKAWAグループの強みを生かした新たなビジネスの可能性を探るべく、テクノロジーとアニメを融合させた新サービスの開発を進めてきた。「アニメの配信やグッズ販売などとは異なる、テクノロジーとアニメを活用したコンテンツを模索してきました。」音声に関しては、すでに海外では書籍の朗読を楽しむオーディブルな世界が広がっていることもあり、日本でも期待されている音声関連のテクノロジーに着目したという。

 「その過程の中で、初めに取り組んだのが音声合成を活用してキャラクターと会話を楽しむことができる“おしゃべりアプリ”です」と常務取締役 原田 由佳氏は説明する。

導入の経緯

おしゃべりアプリ実現に欠かせない音声合成の技術

 実際のアプリでは、海外でも人気の高い「この素晴らしい世界に祝福を!」というアニメ作品に登場する“めぐみん”というキャラクターと会話を楽しむことができる。Android端末のローカル音声認識機能を通じて会話の内容をアプリ側で把握、事前に用意された回答パターンによって会話が成り立つ仕組みだ。ユーザー自身の名前や誕生日などの情報を登録することで、会話の中で自分の名前が読み上げられたり、誕生日にはお祝いコメントが楽しめたりといった仕掛けが施されている。

導入のポイント

声優がしゃべっているような高い再現性、ともに歩めるパートナーが必要に

山根 亨子氏

キャラボイス事業推進室
シニアマネージャー

山根 亨子氏

 そのなかで同社が注目したのが、東芝が提供しているRECAIUS 音声合成ミドルウェア「ToSpeak Gx Neo」だった。「視聴してみると機械っぽさが残ってしまうものも多い。関係者に納得してもらえるような再現性の高い技術が必要だったのです」と原田氏。実際に複数の技術を聞き比べてみたところ、「東芝の最新のToSpeak Gx Neo技術は一番再現性が高かった」と語るのは、キャラボイス事業推進室 シニアマネージャー 山根 亨子氏だ。

 実際のアプリで音声のチューニングを行った石倉 洋輔氏も、まずは日本語で文章を作成し、それを一括変換して音声合成で読ませてみたところ、自然な読み上げができたことを高く評価する。「初期の段階だけでも自然な発話が可能でしたし、そこから抑揚をつけて音声の高低を調整してみると、さらに自然な声が再現できました。」

 さらに東芝を高く評価したのは、関係者それぞれが、同社と同じ方向を向いて、一緒に作り上げていくパートナーというような姿勢で携わってくれたことだった。「おしゃべりアプリは1度作ったら終わりではなく、これからも進化を続けていくものです。技術的な拡張の可能性はもちろんですが、その進化を一緒に歩んでもらえるパートナーかどうか、というのも重要なポイントでした」と原田氏。実際には、スマートフォンにて最適な動作が可能になるよう、スピード感を持って対応いただきました。更に、今後の継続的な技術の進化に期待したい。

また、音声辞書制作にあたり、声優さんの声の収録を行うが、今後は、声優の負担が更に軽くなるよう収録自体が簡素化できることを期待するという。

導入の効果

アニメキャラといえば“東芝の音声合成”

石倉 洋輔氏

キャラボイス事業推進室

石倉 洋輔氏

 現在は、2019年4月にリリースした「進化型おしゃべりアプリISEKAI」の音声合成エンジンに「ToSpeak Gx Neo」が利用されており、ファンとのコミュニケーションに必要な発話の8割ほどが音声合成エンジンによって生成された声となっている。現状はAndroid版が中心だが、2019年8月中旬にiOS版もリリースし、今後が期待されている。また、現状は日本語版だけだが、すでに海外からの問い合わせもあるほどで、海外ファンからも注目されるアプリとなっている状況だ。

 「アニメキャラの音声合成の理解が少しずつ広がっていることを実感しています。データサイズも当初は1.5Gbyteほどあったものが、技術開発によって最終的には70Mbyte程度にまで小さくすることができた。「私たちの意図をくんで、要望せずとも前倒しで技術を開発してくれました」と原田氏は語った。

 なお、声優の生声と音声合成を両方使うアプリだけに、ユーザーから比較されやすく、クオリティには賛否両論あるのは事実だ。「SNS上ではいろんな意見がありますが、自分の名前をキャラクターが呼んで話しかけてくれるといった機能は好評いただいています」と山根氏は分析する。

 実際の声に近づけるための音声チューニングについては、あまり苦労はなかったと石倉氏。「マニュアルがしっかりしており、違和感なくチューニングできました。ただ、一度作業を始めると没頭してしまうため、少し時間をあけてから改めて確認し、違和感があれば再度調整するなど、作業自体も自分のペースで進めることができました」と使い勝手の良さを話している。特に今回は石倉氏自身も見ていた作品で、キャラクターが使う固有名詞や性格による抑揚、テンションが上がったときの声の高低などが可能な限り再現できたという。

 「今回新たなサービスを始めたものの、まずは広く認知されていく段階にあり、まだ課題があるのも事実だが、これまで多くの作品を手掛けてきたKADOKAWAが十分に踏み込めていなかった音声合成を活用し、アニメに新たな付加価値を提供できる可能性をもたらしたが、どのように本ビジネスを成長させるのか、まだまだ考えることだらけです」と山根氏。

 東芝については、「音声合成をどのようにビジネスとして育てていくのかについて意見をもらったこともありますし、社内に説明する際にも、アドバイスをいただきました。重要な場面では、何かあれば私たちがすぐに駆けつけます!と、傍で待機してくれました。この対応は、何よりも嬉しく感じました」と山根氏は話す。

 今回の音声合成のために声優による収録があった。これは同社にとって初めてのことだったが、現場では当日のディレクションが行われたので、声優の不安も払しょくしながら円滑に収録できたと評価する。

将来の展望

グローバル対応を進めながらビジネス向けへの展開も検討

 海外でも人気の高い作品だけに、今後は海外向けの展開を検討している。マネタイズの検討だけでなく、日本語の可愛らしさをそのまま生かせるよう、音声吹き替えではなく、テロップを翻訳するなど、工夫を凝らしながらグローバルサービスを考えたいという。

 また、現状はコンシューマに向けたサービスとなっているが、音声合成を活用することでKADOKAWAが手掛けている映画館などリアルな空間にキャラクターを展開し、新たなおもてなしの形を演出する一方で、B to Bへの展開も早急に進めて行きます。東芝のエンジンを搭載したサービス上での展開など、技術のみでなく ビジネス展開においても、パートナーとして一緒にビジネスを創っていきたいと考えています」と原田氏。

 東芝は、今後もRECAIUSをきっかけに、高い音声技術と関係者のあたたかな思い、真摯な姿勢で、多くの企業を魅了していくだろう。

SOLTION FOCUS

「ToSpeak™」

 テキストから自然な声の発話に自動変換するソフト(音声合成ミドルウェア)。テキストを用意するだけで音声を手軽に出力でき、短時間の収録で声優やオリジナルの声から合成音を生成。良好な音質を小さなメモリサイズで提供できるのが特徴。音素やアクセント情報に応じて音声の特徴パラメータを動的に選択することで自然な発話を実現するToSpeakをベースに、次世代の音声合成として開発。パソコンやクラウドサーバー上だけでなく、お客様の機器やシステム、スマートフォンやタブレット上のアプリケーションソフトウェアへの組み込みも可能。
 現在は、組み込み機器用のエンジンとして、電話機、ゲーム機などに使われている。東芝の音声合成技術は、人々の生活を支えており、エレベーターやカーナビなどの音声ガイドのエンジンは、高いシェアを獲得している。

この記事の内容は2019年8月に取材した内容を元に構成しています。
記事内における数値データ、社名、組織名、役職などは取材時のものです。

COMPANY PROFILE

会社名
株式会社ブックウォーカー
設立
2005年12月1日
代表者
代表取締役社長 橋場 一郎
本社所在地
東京都千代田区五番町3-1
事業概要
電子書籍等電子コンテンツの制作、配信及び販売
URL
www.bookwalker.co.jp 別ウィンドウで開きます

お問い合わせ

ソリューションのより詳しい情報はこちらから RECAIUS
音声合成ミドルウェア
「ToSpeak™」