英語合成音声の課題「アクセントとイントネーションの編集」

三省堂中1英語 NEW CROWNのデイジー版を製作しています。日本語解説部分は人の声で録音していますが、英文は合成音声です。英文の合成音声読み上げは、思っていた以上に聞きやすいものでした。ですがやはり、限界(課題というべきか)はありました。

合成音声の読みは、機械が読んでいるという感じはあまりせず聞きやすいのですが、一気にすらすらと読んでいく読み方です。この読み上げ方では、ディスレクシアのユーザーにとっては、聞きながら書いてある内容を理解していくのは難しいだろうと思われました。そこで合成音声の英文読みをそのまま使わず。各単語間に適度な無音長を入れた読みに編集する手間を加えました。

また今回製作してみて、英語の合成音声のアクセントや文末のイントネーションの自由な修正は難しいということが分かりました。
例えば、Indiaという単語のアクセントは、教科書では「índiə」と書いてありますが、使っている合成音声ではIn[di]a と[di]のところが強く聞こえてしまいます。このアクセントは結局、修正ができませんでした。

Which do you like soccer ⤴or baseball?⤵ のような文で、文末を上げたり下げたりして読むのところも不自然です。そもそも実際の英語会話では矢印のように文末を上げ下げしないものなのかもしれませんが、中1英語ですので、教科書には文末のイントネーションが矢印で表示されています。その部分の読み上げだけでも教科書の示す矢印と同じように聞こえるよう音声調整したかったのですが、うまくできないままデータをアップせざるを得ませんでした。

音声を聞きながら書いてあることの内容を理解しようとしているユーザーに対して、できるだけ原本と合った読み上げをするデイジー教科書を提供したいと思っています。それなのに現状では調整できていないことがとても気になっています。