JP2002351486A - 音声合成編集装置及び音声合成編集方法並びに音声合成編集プログラム - Google Patents
音声合成編集装置及び音声合成編集方法並びに音声合成編集プログラムInfo
- Publication number
- JP2002351486A JP2002351486A JP2001162622A JP2001162622A JP2002351486A JP 2002351486 A JP2002351486 A JP 2002351486A JP 2001162622 A JP2001162622 A JP 2001162622A JP 2001162622 A JP2001162622 A JP 2001162622A JP 2002351486 A JP2002351486 A JP 2002351486A
- Authority
- JP
- Japan
- Prior art keywords
- information
- prosody
- phonetic
- prosody information
- corrected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
を得ようとする音声合成の編集において、韻律情報の修
正後に表音情報を修正すると、修正した韻律情報が再び
修正されることがあり、操作者が表音情報の修正と韻律
情報の修正の順番を意識することがあり不便であった。 【解決手段】本発明は、音声合成すべきテキストに対し
て言語処理を行い、言語処理の結果得られる表音情報を
記憶し、記憶した表音情報を基に韻律情報を生成し、生
成した韻律情報を記憶し、記憶した韻律情報を基に合成
音を生成し、生成した合成音を出力する。さらに、表音
情報が修正された場合は、表音情報が修正された部分に
ついてのみ韻律情報を変更するものである。
Description
より得られる合成音を対話的に編集する音声合成編集装
置に関し、特に言語処理により生成される表音情報と韻
律制御により生成される韻律情報とを修正して合成音を
編集する音声合成編集装置及び音声合成編集方法並びに
音声合成編集プログラムに関する。
テキストを言語処理し、その結果得られる表音情報を基
に韻律制御を行って韻律情報を生成し、この韻律情報を
基に合成音を生成して最終的にDAコンバータを介して合
成音を出力する。
力される合成音には単語の読み間違えなど言語処理にお
ける誤りが明らかな場合や韻律が不自然である場合が少
なくない。
成の結果の誤り修正や韻律の自然性改善を操作者が対話
的に行えるようにするものであり、上述のテキスト音声
合成における問題を補うものとして有効なツールであ
る。
結果出力される品詞、係り受け、読み、アクセント型、
区切り位置、区切りの種別等の表音情報を表音記号列と
して出力し、これを直接あるいは専用のインターフェー
スを用いて間接的に変更できるようにして言語処理にお
いて発生した誤りを対話的に修正できるようにするもの
があった。
すなわちピッチパターンと音韻継続時間長を対話的に変
更できるようにして、表音情報のみの修正ではできなか
ったイントネーションの微妙な変更や読む速さの調整等
のさらに詳細な修正を可能とし、より自然性の高いある
いは多様な韻律の合成音を作成可能とするものがあっ
た。
音声合成の処理プロセスで生成される表音情報あるいは
韻律情報を対話的に修正できるようにし、正確な合成音
や自然性の高い合成音の作成を操作者の判断で行えるよ
うにするものである。
は表音情報あるいは韻律情報を修正し、修正した結果を
操作者自身が聞いて確かめるという修正・試聴の作業が
必須であり、通常、この作業は操作者が納得できる合成
音が得られるまで繰り返し行われる。
すものであり、合成音を「いろいろ試しながら変えてい
く」ことができるということが、音声合成編集装置の特
長であるといえる。
試行錯誤を十分に支援する環境、すなわち操作者が編集
上の制約を受けず、表音情報あるいは韻律情報を自由に
修正して試すことのできる場を提供するものでなければ
ならない しかし、上述のようにテキスト音声合成には言語処理結
果の表音情報を基に韻律制御を行って韻律情報を生成す
るという処理手順が存在し、従来の音声合成編集装置は
この処理手順に依存する形で、表音情報の修正は韻律情
報の修正の前に行わなければならないという編集上の制
約を操作者に課すものであった。
情報の誤りに気が付いてそれを修正すると、修正された
表音情報を基に再び韻律制御が行われ、新たな韻律情報
が生成されるので出力される合成音は修正された表音情
報を反映するものの、先に修正された韻律情報は全て失
われて反映されず、操作者にとっては先に行った韻律情
報の修正が無駄な作業となってしまう。
ものとする場合、アクセント句の韻律情報を修正した後
に他のアクセント句の表音情報を修正すると、表音情報
を修正したアクセント句のみならず表音情報を修正しな
かったアクセント句についても韻律情報が新に変更され
てしまうのは操作者にとっては予想外の結果になる。操
作者としては他のアクセント句について表音情報の修正
を行っても、すでに韻律情報を修正してあるアクセント
句についてはその修正結果が保持されることを期待す
る。しかし、従来の音声合成編集装置は表音情報が一部
でも修正されると全てのアクセント句に対して韻律情報
をリセットし、結果として操作者に編集作業のやり直し
を強要するものであった。
やり直しという作業効率の悪化を防ぐために表音情報の
修正は韻律情報の修正の前に行うという手順を常に意識
して作業しなければならなかった。
とは操作者の試行錯誤を阻害するものであり音声合成編
集装置の改善すべき問題点であった。
問題を解決するためになされたもので、表音情報と韻律
情報とを修正して所望の合成音を得ようとする音声合成
の編集において、韻律情報の修正後も継続して表音情報
を修正可能とし、操作者が表音情報の修正と韻律情報の
修正の順番を意識することのなく自由に所望の合成音を
編集できる音声合成編集装置及び音声合成編集方法並び
に音声合成編集プログラムを提供することを目的とす
る。
に、本発明の音声合成編集装置では入力された音声合成
すべきテキストに対して所定の単位毎に表音情報及び韻
律情報を生成し、所望の音声を合成するために前記生成
された単位毎の表音情報及び韻律情報に対して修正を行
う音声編集合成装置において、前記表音情報が修正され
た場合、単位毎に修正された表音情報の対応する韻律情
報を変更することを特徴とするものである。
に対して所定の単位毎に表音情報を生成する言語処理手
段と、この言語処理手段により生成した表音情報を記憶
する表音情報記憶手段と、この表音情報記憶手段におい
て記憶した表音情報を基に所定の単位毎に韻律情報を生
成する韻律情報生成手段と、この韻律情報生成手段によ
り生成した韻律情報を記憶する韻律情報記憶手段と、前
記表音情報記憶手段において記憶した表音情報を修正さ
せる表音情報修正手段と、前記韻律情報記憶手段におい
て記憶した韻律情報を修正させる韻律情報修正手段と、
前記韻律情報を基に合成音を生成する合成音生成手段
と、この合成音生成手段において生成した合成音を出力
する合成音出力手段とを有し、前記表音情報修正手段に
おいて表音情報が修正された場合、前記韻律情報生成手
段は、前記表音情報修正手段において単位毎に修正され
た部分のみの韻律情報を変更することを特徴とするもの
である。
入力手段と、前記入力手段により入力されたテキストに
対して表音情報を生成する言語処理手段と、この言語処
理手段により生成した表音情報を記憶する表音情報記憶
手段と、この表音情報記憶手段において記憶した表音情
報を基に韻律情報を生成する韻律情報生成手段と、この
韻律情報生成手段により生成した韻律情報を記憶する韻
律情報記憶手段と、前記表音情報記憶手段において記憶
した表音情報を対話的に修正させる表音情報修正手段
と、前記韻律情報記憶手段において記憶した韻律情報を
対話的に修正させる韻律情報修正手段と、前記韻律情報
を基に合成音を生成する合成音生成手段と、この合成音
生成手段において生成した合成音を出力する合成音出力
手段と、前記表音情報修正手段において修正された部分
を記憶する表音修正部分記憶手段と、前記韻律情報修正
手段において修正された部分を記憶する韻律修正部分記
憶手段とを有し、前記表音情報修正手段において表音情
報が修正された場合、前記韻律情報生成手段は、修正さ
れた表音情報を基に韻律情報を生成し、生成した韻律情
報を第二の韻律情報記憶手段に記憶し、前記表音修正部
分記憶手段で記憶した表音情報修正部分と、前記韻律修
正部分記憶手段で記憶した韻律情報修正部分とにより変
更部分を決定し、前記韻律情報記憶手段に記憶してある
韻律情報と、前記第二の韻律情報記憶手段に記憶した韻
律情報とを参照し、前記韻律情報記憶手段に記憶してあ
る韻律情報のうち、決定した前記変更部分についての韻
律情報を変更することを特徴とするものである。
された音声合成すべきテキストに対して表音情報を生成
する言語処理ステップと、この言語処理ステップにより
生成した表音情報を記憶する表音情報記憶ステップと、
前記表音情報記憶ステップにおいて記憶した表音情報を
基に韻律情報を生成する韻律情報生成ステップと、この
韻律情報生成ステップにより生成した韻律情報を記憶す
る韻律情報記憶ステップと、この表音情報記憶ステップ
において記憶した表音情報を修正させる表音情報修正ス
テップと前記韻律情報記憶ステップにおいて記憶した韻
律情報を修正させる韻律情報修正ステップと、前記韻律
情報を基に合成音を生成する合成音生成ステップと、こ
の合成音生成ステップにおいて生成した合成音を出力す
る合成音出力ステップと、前記表音情報修正ステップに
おいて表音情報が修正された場合に、前記表音情報修正
ステップ゜において修正された部分のみの韻律情報を変
更するステップとを含むことを特徴とするものである。
は、入力された音声合成すべきテキストに対して表音情
報を生成する言語処理と、この前記言語処理により生成
した表音情報を記憶する表音情報記憶処理と、この表音
情報記憶処理において記憶した表音情報を基に韻律情報
を生成する韻律情報生成処理と、この韻律情報生成処理
により生成した韻律情報を記憶する韻律情報記憶処理
と、前記表音情報記憶処理において記憶した表音情報を
修正させる表音情報修正処理と、前記韻律情報記憶処理
において記憶した韻律情報を修正させる韻律情報修正処
理と、前記韻律情報を基に合成音を生成する合成音生成
処理と、この合成音生成処理において生成した合成音を
出力する合成音出力処理と、前記表音情報修正処理にお
いて表音情報が修正された場合に、前記表音情報修正処
理において修正された部分のみの韻律情報を変更する処
理とを含むことを特徴とするものである。
る音声合成編集装置及び音声合成編集方法並びに音声合
成編集プログラムの一実施形態を説明する。
音声合成編集装置の一つの実施例を示すブロック図であ
る。この音声合成編集装置はテキスト入力部1、言語処
理部2、表音情報記憶部3、韻律制御部4、韻律情報第
一記憶部5、表音情報修正部6、表音情報表示部6−
1、韻律情報修正部7、韻律情報表示部7−1、合成音
生成部8、合成音出力部9、表音修正部分記憶部10、
韻律情報第二記憶部11、及び韻律情報変更部12を有
する。
キストを入力させるインターフェースである。テキスト
はキーボードによる入力あるいはテキストファイルの読
み込みによって入力される。
言語処理を行い、表音情報を生成する処理モジュールで
ある。
れる情報であり、すなわち形態素解析の結果得られる品
詞などの形態情報、係り受けなどの構文情報、読み、ア
クセント型、区切り位置、区切りの種別などを表した一
般に中間言語と呼ばれる表音記号列を指す。
クセント句単位に分割し、各アクセント句に対応する形
で表音情報を出力する。また、後述の表音情報修正部
6、韻律情報修正部7における修正はここで分割された
アクセント句を単位に行わせるものとする。
た表音情報を記憶するメモリである。言語処理部2で分
割した各アクセント句には先頭のアクセント句から順番
に番号付けを行い、アクセント句の番号とそのアクセン
ト句の表音情報が一対一に対応するようにメモリに記憶
する。
憶された表音情報を操作者が修正するインターフェース
であり、表音情報表示部6−1に表音情報を表示させな
がら対話的に修正させる。
6及び表音情報表示部6−1の一例を示すGUI(Grap
hical User Interface)画面である。
るテキスト入力/表示部分100と言語処理結果表示部
分101とがある。ここでは、「今日は良い天気で
す。」という漢字仮名混じりテキストが入力された様子
を示している。
結果得られた読み、アクセント型、区切りの種別をアク
セント句単位で区切ってわかりやすく表示する。したが
って、表音記号列をそのまま表示するのではなく一般の
操作者でもわかりやすいように記号を変換して表示す
る。例えばここでは「きょーわ」、「よい」、「てんき
です」の3つのアクセント句に分かれており、1番目の
アクセント句「きょーわ」では「きょ」にアンダーライ
ンを引いてここにアクセントがあることを示し、語尾に
「(小)」を付けて区切りの種別が小ポーズであること
を示す。
ウスによってアクセント句を選択することができる。こ
こではマウスカーソル(矢印)で示された1番目のアク
セント句「きょーわ」が選択されている。
選択されたアクセント句について読み、アクセント型、
アクセント強弱、区切りの種別を言語処理結果に基づい
て表示するとともに、これらを修正可能とするインター
フェースを備えている。これらのインターフェースで修
正がなされた場合、表音情報記憶部3で記憶された表音
情報を修正された結果で更新し、さらに言語処理結果表
示部分101の表示も更新する。
修正部分102で修正可能であり、読み修正部分102
に修正する読みを入力した後、読み変更ボタン103が
押されると選択されているアクセント句の読みを入力さ
れた読みに変更する。
クセント修正部分104で行われる。ここでは、「きょ
ーわ」のアクセント型が1型であって「きょ」にアクセ
ントがあり、強いアクセントであることを示している。
アクセント型の修正は「きょーわ」の場合はアクセント
型が0〜2型の3通りであり、1と表示されている所で
数値を変えて入力するか、その横の縦横の矢印ボタンに
よって数値を変更することにより行える。また、アクセ
ント強弱は右側の選択ボタンにより変更できる。
分割)の修正は一番下側の区切り修正部分105で行え
る。区切りの種別は強結合、弱結合、小ポーズ、大ポー
ズの中から選択できる。ここで、区切りの種別が小、大
ポーズの場合は呼気段落の終わりであることを示す。
とによって行える。図2のように1番目のアクセント句
「きょーわ」が選択されていて連結ボタンが押された場
合、2番目のアクセント句「よい」と連結して「きょー
わよい」というアクセント句を構成する。また、アクセ
ント句の分割は分割ボタンを押すことによって行える。
分割位置は言語処理結果表示部分101のマウスカーソ
ルの位置で指定できる。図2では、マウスカーソルが
「きょー」の後に位置しているので、「きょー」と
「わ」の2つのアクセント句に分割する。
報表示部6−1は言語処理結果の表音情報を表示すると
ともに操作者が対話的にこれを修正できるインターフェ
ースを備えており、修正が為されると表音情報記憶部3
で記憶された表音情報を修正された結果で更新する。
6で修正された部分が何処であるかを記憶するためのメ
モリである。例えば、図2で1番目のアクセント句「き
ょーわ」のアクセント型が0型に変更されたとするとア
クセント句の番号すなわち1番を表音情報が修正された
部分としてメモリに記憶する。
れた表音情報を基に韻律制御を行って韻律情報を生成す
る処理モジュールである。ここで、韻律情報とは音韻継
続時間長およびピッチパターンを指す。例えば、図2で
「きょーわ」、「よい」、「てんきです」の3つのアク
セント句すべてに対して、表音情報を基に音韻継続時間
長とピッチパターンを生成する。
成した韻律情報を記憶するメモリである。韻律情報は1
次元配列Pitch[i]で表現する。ここで、iは時間に
相当するフレーム番号であり、Pitch[x]とはフレー
ム番号xが指すピッチである。後述の韻律情報修正部7
では、横軸を時間(フレーム)、縦軸をピッチ(オクタ
ーブ)としてピッチパターンを表示する。
から始まるか、ポインタを設定して韻律情報全体からあ
るアクセント句の韻律情報が抽出できるように記憶す
る。
1は韻律情報第一記憶部5で記憶された韻律情報を、表
示し対話的に修正させるインターフェースである。
7及び韻律情報表示部7−1の一例を示すGUI画面で
ある。
力と表示が行えるテキスト入力/表示部分100と言語
処理結果表示部分101とがある。
6がある。ピッチパターン修正部分106は言語処理結
果表示部11で選択されたアクセント句について横軸を
時間(フレーム)、縦軸をピッチ(オクターブ)とした
ピッチパターンを韻律制御の結果に基づいて表示すると
ともに、音韻継続時間長およびピッチパターンの形状を
修正可能とするインターフェースを提供する。
理結果表示部11で選択されたアクセント句のピッチパ
ターンを中心に表示し、その音韻継続時間長およびピッ
チパターンの形状を修正させる。ここでは、1番目のア
クセント句「きょーわ」が選択されており、そのピッチ
パターンが中心に表示され2番目のアクセント句「よ
い」のピッチパターンが右側に表示されている。
ンの形状修正インターフェースは、韻律情報第一記憶部
5で記憶された韻律情報、すなわち1次元配列で表され
たデータを間接的に修正できるようにするGUIであ
る。
て説明する。
各モーラやアクセント句全体について、あるいは区切り
の長さについて行うことができる。アクセント句内の各
モーラは縦線(点線を含む)で境界が示され、マウスで
縦線の位置を左右に動かすことにより各モーラの音韻継
続時間長を修正することが出来る。
スでアクセント句の先頭(左端)にある縦線を左右に動
かすことにより伸縮することができる。また、隣のアク
セント句、図3では2番目のアクセント句「よい」の先
頭にある縦線をマウスで左右に動かすことにより区切り
間隔の時間長を修正することができる。あるアクセント
句の音韻継続時間長が修正されると他のアクセント句に
ついても修正された長さ分で時間をシフトして韻律情報
全体の整合性を保つようにする。
チパターン上に自由曲線を描くことにより行うことがで
きる。図4にピッチパターンの形状修正例を示す。図4
aのようにピッチパターン全体を自由曲線(点線)で修
正することができ、また、図4bのようにピッチパター
ンの一部を自由曲線(点線)で修正することもできる。
また、ピッチパターン修正部分106内の左端にあるス
ライダーバーをマウスで上下に動かすことにより選択さ
れているアクセント句のピッチパターン全体を上下に動
かしてピッチの高低を修正することができる。
報表示部7−1は韻律制御結果の韻律情報を表示すると
ともに操作者が対話的にこれを修正できるインターフェ
ースを備えており、修正が為されると韻律情報第一記憶
部5で記憶した韻律情報を修正された結果で更新する。
6で表音情報が修正された場合にのみ、韻律制御部4が
生成した韻律情報を記憶するメモリである。表音情報修
正部6で表音情報が修正された場合は、直接、韻律情報
第一記憶部5には韻律情報を記憶しない。
表音情報が修正された場合に、表音情報が修正されたア
クセント句についてのみ韻律情報を変更する処理モジュ
ールである。韻律情報変更部12では表音修正部分記憶
部10で記憶したアクセント句の番号を参照し、韻律情
報第一記憶部5で記憶した韻律情報のうち上記番号のア
クセント句に対応する韻律情報を韻律情報第二記憶部1
1で記憶した韻律情報のうち上記番号のアクセント句に
対応する韻律情報で置き換える。
ト句のみ修正された表音情報に基づいて生成した韻律情
報で置き換える。図2で挙げた例では1番目のアクセン
ト句「きょーわ」の表音情報が修正された場合は、アク
セント句「きょーわ」についてのみ修正された表音情報
に基づいて生成した韻律情報で置き換えを行う。表音情
報が修正されなかった「よい」、「てんきです」の2つ
のアクセント句については変更しない。したがって、
「よい」、「てんきです」の2つのアクセント句につい
てすでに韻律情報修正部7で韻律情報の修正が行われて
いれば、この2つのアクセント句についてはすでに修正
された韻律情報をそのまま保持する。
部5で記憶された韻律情報を基に合成音を生成する処理
モジュールであり、合成音出力部9は合成音生成部8で
生成された合成音をDA変換して出力する処理モジュー
ルである。
5〜図7に示したフローチャートを用いて説明する。
テキストが入力されると、ステップS1によりステップ
S2〜S8へと処理が進む。ステップS2では言語処理
部2が入力されたテキストに対し言語処理を行いその結
果としてアクセント句単位に分割された表音情報を生成
する。ステップS3では分割された各アクセント句に番
号付けを行う。図2に示した例では「きょーわ」を1
番、「よい」を2番、「てんきです」を3番とする。
る形で表音情報を表音情報記憶部3に記憶する。ステッ
プS5では表音情報記憶部3に記憶された言語処理結果
の表音情報を表音情報表示6−1において表示する。
記憶部3で記憶した表音情報を基に韻律制御を行い韻律
情報Pを生成する。ここで、韻律情報にPを付けている
のは前の状態の韻律情報という意味を持たせるためであ
る。後述するように、韻律情報として他に韻律情報Nと
記述したものがある。ステップS7では各アクセント句
に対応する形で韻律情報Pを韻律情報第一記憶部5に記
憶する。ステップS8では韻律情報第一記憶部5に記憶
された韻律情報Pを韻律情報修正部7において表示す
る。
キストが入力されたら再びステップS2〜S8へと進
み、新たなテキストが入力されなければステップS11
へ進む。
て表音情報が修正されたかどうかを判定し、修正された
ならば図6のBへ、そしてステップS15に進む。ステ
ップS15では表音情報記憶部3に記憶された表音情報
を表音情報修正部6において修正された結果で更新す
る。ステップS16では表音情報修正部6において修正
されたアクセント句の番号Xを表音修正部分記憶部10
に記憶する。ステップS17では、修正された結果の表
音情報を表音情報表示部6−1において表示する。
報修正部6において修正された結果の表音情報を基に韻
律情報Nを生成する。ステップS19では各アクセント
句に対応する形で韻律情報Nを韻律情報第二記憶部11
に記憶する。ステップ20ではすでにあるアクセント句
に対して操作者が韻律情報の修正を行ったかどうかを判
定し、韻律情報の修正がなされていればステップS21
へ進む。
表音修正部分記憶部10で記憶したアクセント句の番号
Xを参照し、韻律情報第一記憶部5に記憶した韻律情報
PのうちX番のアクセント句に対応する韻律情報Pxを
韻律情報第二記憶部11に記憶した韻律情報NのうちX
番のアクセント句に対応する韻律情報Nxで置き換え
る。つまり、表音情報の修正が為されたアクセント句に
ついてのみその韻律情報を変更し、他のアクセント句に
ついては前の状態の韻律情報を保持する。
記憶部5に記憶した韻律情報Pを韻律情報変更部12で
行った置き換えの結果で更新する。ステップS23では
韻律情報第一記憶部5に更新して記憶された韻律情報P
を韻律情報修正部7において表示する。その後、図5に
示したAへ戻る。
セント句にも韻律情報を修正していなかった場合は、前
の状態の韻律情報を保持する必要がないのでステップS
22で韻律情報第一記憶部5に記憶した韻律情報Pを韻
律情報第二記憶部11に記憶した韻律情報Nで置き換え
て更新する。ステップS23では韻律情報第一記憶部5
に更新して記憶された韻律情報Pを韻律情報修正部7に
おいて表示する。その後、図5に示したAへ戻る。
れているかどうかを判定するものとして説明したが、ス
テップS21に進むかどうかを操作者に決定させる、つ
まり、表音情報が修正されたアクセント句のみの韻律情
報を変更させるかどうかを操作者に決定させその決定に
よってステップS21かステップS22に分岐させるも
のであってもよい。この場合、表音情報の修正があった
場合には表音情報が修正されたアクセント句のみの韻律
情報を変更させるモードと全てのアクセント句の韻律情
報を常に更新するモードとを用意し、これらのモードを
切り替えられるようにし操作者はあらかじめあるいは毎
回モードを決定し、ステップS20ではそのモードを判
定する。
修正部7において韻律情報が修正されたかどうかを判定
し、修正されたならば図7のCへ、そしてステップS2
4に進む。ステップS24では韻律情報第一記憶部5に
記憶した韻律情報を修正された韻律情報で更新する。ス
テップS25では韻律情報第一記憶部5に更新して記憶
された韻律情報を韻律情報表示部7−1において表示す
る。その後、図5に示したAへ戻る。
力が指示された場合はステップS9へ進む。ステップS
9では、韻律情報第一記憶部5に記憶した韻律情報を基
に合成音生成部8が合成音を生成する。ステップS10
では合成音生成部8が生成した合成音を合成音出力部9
がDA変換して出力する。その後、図5に示したAへ戻
る。
合、システムを終了する。
具体例を示して説明する。図8では入力テキスト「今日
は良い天気です」について操作者が表音情報の修正と韻
律情報の修正を行うものを示している。ここでは2種類
の修正を例にする。一つは、表音情報の修正でアクセン
ト句「きょーわ」のアクセント型を0型から1型に修正
する修正αであり、もう一つは、「よい」、「てんきで
す」の2つのアクセント句について韻律情報(ピッチパ
ターン)の形状を変形する修正βである。図8の四角で
囲った中の上と下に、各状態(a〜d)での、表音情報
を示す文字列と韻律情報を示すピッチパターンを表す。
修正方法としては(1)修正αを行った後に修正βを行
う方法と(2)修正βを行った後に修正αを行う方法が
ある。
図8のaは初期状態でありテキストが入力され言語処理
部2で言語処理を行い表音情報(a−1)が表音情報記
憶部3に記憶され、さらに表音情報(a−1)に対して
韻律制御部4で韻律制御が行われ韻律情報(a−2)が
韻律情報第一記憶部5に記憶された後の状態である(ス
テップS2〜S8)。この状態ではまだ操作者による修
正は行なわれていない。表音情報(a−1)を示す文字
列で「きょーわ」のようにアンダーラインが何処にもな
い場合は0型としている。また、アクセント句の番号と
して「きょーわ」を1、「よい」を2、「てんきです」
を3としている。
行い、表音情報を修正した後の状態である。修正後の表
音情報(b−1)は表音情報記憶部3に表音情報(a−
1)を更新して記憶される(ステップS15)。また、
表音情報(b−1)の中の「きょーわ」は修正されてい
るので「きょーわ」のアクセント句の番号1が表音修正
部分記憶部10に記憶される(ステップS16)。さら
に、修正後の表音情報(b−1)に対して韻律制御部4
で韻律制御が行われ(ステップS18)、韻律情報(b
−2)が韻律情報第二記憶部11に記憶される(ステッ
プS19)。
正されていないので、韻律情報第一記憶部5に記憶した
韻律情報(a−2)を韻律情報第二記憶部11に記憶さ
れた音韻情報(b−2)で置き換えて更新する(ステッ
プS22)。
り修正βが行われ図8のdの状態になる。図8のdの状
態では韻律のみが修正されているので表音情報(d−
1)は図8のbの状態の表音状態(b−1)と同じにな
り、韻律情報(d−2)は図8のbの状態の表音状態
(b−2)から変更される。
8のaの初期状態までは(1)と同じである(ステップ
S2〜S8)。操作者による修正βが行われると「よ
い」と「てんきです」の韻律情報(a−2−2,a−2
−3)が修正され図8のcの韻律情報(c−2−2,c
−2−3)になる。すなわち、修正後の韻律情報(c−
2)は韻律情報(a−2)を更新して韻律情報第一記憶
部5に記憶される(ステップS12,S24,S2
5)。
から「きょーわ」について操作者による修正αが行なわ
れると図8のdの修正後の表音情報(d−1)は表音情
報記憶部3に表音情報(c−1)を更新して記憶される
(ステップS15)。また、表音情報(d−1)の中の
「きょーわ」は修正されているので「きょーわ」のアク
セント句の番号1が表音修正部分記憶部10に記憶され
る(ステップS16)。
−1)に対して韻律制御部4で韻律制御が行われ(ステ
ップS18)、韻律情報が韻律情報第二記憶部11に記
憶される(ステップS19)。なお、韻律情報第二記憶
部11に記憶される韻律情報は修正後の表音情報(c−
1)に対して韻律制御が行われているので、すでに図8
のaの初期状態から図8のcの状態で修正した「よい」
「てんきです」に対する韻律情報(c−2−2,c−2
−3)ではなくて、図8のbの韻律情報(b−2−2,
b−2−3)となる。そこで、図8のcから図8のdへ
修正をするときはすでに操作者により韻律情報が修正さ
れているのでS21の動作を行う。
れている韻律情報(c−2)の中の表音情報が修正され
たアクセント句の番号1「きょーわ」に対する韻律情報
(c−2−1)のみを韻律情報第二記憶部11に記憶さ
ている(b−2)のアクセント句の番号1「きょーわ」
に対する韻律情報(b−2−1)と置き換えて図8のd
に示すような韻律情報(d−2)を得ることができる。
(1)修正αを行った後に修正βを行う方法と(2)修
正βを行った後に修正αを行う方法とで得られる状態が
同じになる。これは、図8の右下dに示した表音情報お
よび韻律情報をそれぞれ修正した後の状態を得るために
は、修正αを行った後に修正βを行う方法をとっても、
修正βを行った後に修正αを行う方法をとってもどちら
でも構わないことを意味する。
処理を行わない場合、まず、(1)修正αを行った後に
修正βを行う方法で得られる状態は、上で述べた置き換
え処理を行う場合と同じ、図8の右下dに示した表音情
報および韻律情報をそれぞれ修正した後の状態になる。
しかし、(2)修正βを行った後に修正αを行う方法で
得られる状態は、図8の右下dに示した表音情報および
韻律情報をそれぞれ修正した後の状態にはならず、図8
の左下bに示す表音情報を修正した後の状態になる。
え処理を行わない場合は、(1)修正αを行った後に修
正βを行う方法と(2)修正βを行った後に修正αを行
うとで得られる状態とが異なり、図8の右下dに示した
表音情報および韻律情報をそれぞれ修正した後の状態を
得るためには、修正αを行った後に修正βを行う方法を
とらなければならない。
韻律制御部4が生成した韻律情報を韻律情報第二記憶部
11に記憶するが、韻律情報第一記憶部5には直接記憶
せず韻律情報変更部12を通して表音情報が修正された
部分のみ韻律情報を置き換え、その後に、韻律情報第一
記憶部5に記憶した韻律情報を韻律情報変更部12の置
き換え結果で更新するものである。
の修正が行われても表音情報が修正されなかった部分に
ついてはすでに行なわれた韻律情報の修正結果が保持さ
れるので、操作者は表音情報の修正により編集作業が振
り出しに戻されることなく合成音の編集を継続して行う
ことができ、表音情報の修正と韻律情報の修正の順番を
意識せずに自由に所望の合成音を編集できるようにな
る。
ント句単位で行わせることができ、ある一部のアクセン
ト句の表音情報が修正されても表音情報が修正されなか
った他のアクセント句についてはすでに行なわれた韻律
情報の修正結果が保持され、表音情報が修正されたアク
セント句のみの韻律情報が変更されるので、操作者は他
のアクセント句の韻律情報がリセットされることを心配
せずに一部のアクセント句の表音情報を修正できるよう
になる。
の表音情報が修正された場合、アクセント句単位で表音
情報と韻律情報の修正の有無を参照し、韻律情報の変更
部分をアクセント句単位で決定することができる。
換えの対象となったアクセント句(上の例では「きょー
わ」)の音韻継続時間長(フレーム数)が、韻律情報第
一記憶部で記憶したものと、韻律情報第二記憶部で記憶
したものとで異なる場合、すなわち表音情報の修正によ
って音韻継続時間長が変わった場合、単純に置き換えた
だけを行うと、韻律情報が時間軸おいて不整合になる。
これを回避するために、置き換えの対象となったアクセ
ント句以降のアクセント句の韻律情報を、置き換えによ
ってできる音韻継続時間長(フレーム数)の差分だけシ
フトすればよい。
であった場合、すなわちアクセント句の分割あるいは連
結が為された場合、韻律情報第一記憶部で記憶した韻律
情報のアクセント句数と韻律情報第二記憶部で記憶した
韻律情報のアクセント句数とが異なるため、単純に置き
換えただけだと、韻律情報が不整合なものとなる。例え
ば、上の例で、1番目のアクセント句「きょーわ」に対
して連結が指示され2番目のアクセント句「よい」と連
結された場合、韻律情報第二記憶部で記憶する韻律情報
は、「きょーわよい」、「てんきです」の2つのアクセ
ント句に対応するものであるのに対し、韻律情報第一記
憶部で記憶した韻律情報は「きょーわ」、「よい」、
「てんきです」の3つのアクセント句に対応するもので
あり、それぞれアクセント句数が異なるため、単純な置
き換えだけでは不整合が生じる。
に対して分割が指示され「きょー」と「わ」に分かれた
場合、韻律情報第二記憶部で記憶する韻律情報は、「き
ょー」、「わ」、「よい」、「てんきです」の4つのア
クセント句に対応するものであるのに対し、韻律情報第
一記憶部で記憶した韻律情報は上述のように3つのアク
セント句に対応するので、この場合も不整合が生じる。
3で連結が指示された場合は、置き換える前に韻律情報
第一記憶部に記憶した韻律情報のうち、置き換え対象の
アクセント句の次にくるアクセント句(上の例では2番
目のアクセント句「よい」)に対応する韻律情報を消去
する。
た場合は、置き換えの対象となったアクセント句につい
て置き換えを行い(上の例では「きょーわ」→「きょ
ー」)、分割によってできたもう一つのアクセント句を
置き換えたアクセント句の次に挿入すれがばよい。すな
わち、上の例では置き換えたアクセント句「きょー」の
後にもう一つのアクセント句「わ」を挿入することであ
る。
ト句について韻律情報第一記憶部に記憶した韻律情報を
韻律情報第二記憶部に記憶した韻律情報で置き換える例
を説明したが、逆に、表音情報が修正されなかったアク
セント句について韻律情報第二記憶部に記憶した韻律情
報を韻律情報第一記憶部に記憶した韻律情報で置き換え
るようにしてもよい。
ぞれ修正モード切り替えボタンなどを設けて、図2の画
面下段に示す表音情報の修正インターフェースと図3の
画面下段に示す韻律情報の修正インターフェースとを切
り替えて表示できるようにし、操作者が交互に修正モー
ドを切り替えて表音情報と韻律情報の修正を行えるよう
にすることもできる。また、修正モード切り替えボタン
を設けず図2の画面下段と図3の画面下段を同時に表示
するようにしてもよい。
説明する。
間接的ではあるが、音韻継続時間長とピッチという生の
パラメータを修正させるものであったが、この変形例で
の韻律情報修正部7はそれに加え韻律情報をメタなパラ
メータによって修正させることも可能である。すなわ
ち、韻律情報第一記憶部5は上述のメタなパラメータの
修正情報を修正メタ情報としてすでに述べてきた韻律情
報とともに記憶する。さらに、韻律情報変更部12はす
でに述べた表音情報が修正された部分のみの韻律情報の
置き換えに加え韻律情報第一記憶部5に記憶した修正メ
タ情報を参照して置き換えた後の韻律情報を修正メタ情
報でさらに変更する。
韻律情報修正部7の一例を示す図3ではピッチパターン
修正部分106内の左端にあるスライダーバーの値であ
る。スライダーバーの値は修正対象となっているアクセ
ント句のピッチパターンの平均ピッチを表し、スライダ
ーバーをマウスで上下させることによりピッチパターン
を上下させることができる。
参照して説明する。アクセント句「きょーわ」について
スライダーバーが動かされてピッチパターンに修正が加
わると、スライダーバーの値を修正メタ情報として時間
とピッチの韻律情報と共に韻律情報第一記憶部に記憶す
る。その後、アクセント句「きょーわ」について表音情
報が修正された場合、韻律情報変更部12はまず、アク
セント句「きょーわ」に対応する韻律情報についてすで
に述べた置き換え処理を行い、次に韻律情報第一記憶部
5に記憶したスライダーバーの値を参照し、アクセント
句「きょーわ」のピッチパターンのピッチ平均がスライ
ダーバーの値と同じになるようにピッチパターンの各時
間(フレーム)におけるピッチを上下して変更する。
ーバーの値が置き換え処理後のピッチ平均よりも大きい
場合は、両者の差分を各時間(フレーム)におけるピッ
チの増加分として加え、ピッチパターン全体を底上げす
る。これにより、表音情報が修正されたアクセント句に
ついては修正された表音情報に基づく韻律情報で単に置
き換えられるだけでなく、すでに行なわれた韻律情報の
修正結果(ここではスライダーバーによるピッチパター
ンの修正結果)を置き換えた韻律情報に反映させること
が可能になり、韻律情報の修正結果を有効に活用して合
成音の編集が行えるようになる。
ジを変更するなどある計算式に基づいてピッチパターン
を変形する場合、計算式に与える定数をメタなパラメー
タとして使用することができる。ピッチパターンのダイ
ナミックレンジは各時間に対応するピッチを平均ピッチ
から拡大/縮小することによって変更することができ
る。ここで、拡大/縮小率をメタなパラメータとして採
用し、韻律情報修正部7に拡大/縮小ボタンを用意して
ダイナミックレンジの修正を可能とさせて上述のスライ
ダーバーの場合と同じように適用することができる。
明する。
に述べた表音情報が修正された部分のみの韻律情報の置
き換えに加え、置き換えた部分とその前後の部分とが韻
律において不連続にならないように表音情報が修正され
た部分の境界においてつなぎ処理を行う。
え処理の対象となったアクセント句の区切りが、ポーズ
のように呼気段落の切れ目ではなく、強結合、弱結合の
ように息継ぎはないが一つのアクセント句として単位付
けされる切れ目であった場合である。この場合、単純な
韻律情報の置き換えによって、置き換えの対象となった
アクセント句と次のアクセント句との境界でピッチパタ
ーンにズレが生じると出力する合成音に歪が生じる可能
性がある。これを回避するために、韻律情報変更部12
はすでに述べた置き換え処理を行った後、置き換え対象
となったアクセント句についてその境界部分のピッチパ
ターンを後続のアクセント句の先頭ピッチと連続的につ
ながるようにつなぎ処理を行う。
る。図9aは入力テキスト「今日は良い天気です。」に
ついて言語処理に続き韻律制御が行われた後の初期状態
である。状態の表し方は図8と同じである。図9bは初
期状態からアクセント句「きょーわ」の句切りが小ポー
ズから強結合に修正された状態である。この状態でのア
クセント句「きょーわ」に対応するピッチパターンは実
線で示した曲線である。この状態ではアクセント句「き
ょーわ」と次のアクセント句「よい」の境界、すなわち
図9bの○印で示した終端ピッチと先端ピッチにおいて
ズレが生じている。
クセント句「きょーわ」の終端ピッチがアクセント句
「よい」の先端ピッチと同一になるようにアクセント句
「きょーわ」のピッチパターンを変形する。この変形は
例えばアクセント位置以降のピッチパターン、すなわち
アクセント位置「きょ」の後の「−わ」に対応するピッ
チパターンに2次曲線を適用して滑らかに行う。図9c
はつなぎ処理後の状態でありアクセント句「きょーわ」
の終端ピッチとアクセント句「よい」の先端ピッチにお
いてズレが解消されている。
うが、それにより起こりうる韻律の不連続性が解消され
出力される合成音は歪のないなめらかなものとなる。
ント句とその前のアクセント句とをつなげる場合にも同
様に行える。この結果、この変形例では表音情報が修正
された部分のみ韻律情報を変更するが、それにより起こ
りうる韻律の不連続性が解消され、出力される合成音は
歪のないなめらかなものとなる。
明する。この変形例では表音情報記憶部3で記憶した表
音情報の内容を表音情報ファイルに韻律情報第一記憶部
5で記憶した韻律情報の内容を韻律情報ファイルに保存
する。これらのファイル保存は操作者の指示によるか、
あるいは表音情報か韻律情報が修正された際に自動的に
行う。ただし、これらのファイル保存は別々の編集状態
で行うのではなく、後述するようにこれらのファイルを
読込んだ際に編集状態に不整合が起きないように同時に
行う。つまり、表音情報が修正されたならばその修正さ
れた表音情報に基づいて韻律情報を生成あるいは変更
し、その後に表音情報と韻律情報をファイル保存する。
また、韻律情報が修正されたならばその時点での表音情
報と修正された韻律情報をファイル保存する。
と上記ファイル保存した表音情報および韻律情報を関連
付けて記憶する編集ファイルも保存する。編集ファイル
にはテキスト文字列に続いて表音情報ファイル名、韻律
情報ファイル名を記述する。保存するタイミングは表音
情報と韻律情報のファイル保存時である。
上記編集ファイルを入力させてテキストを入力するとと
もに、テキストに関連付けられた表音情報および韻律情
報を付随して入力する。すなわち、編集ファイルに記述
された表音情報ファイルと韻律情報ファイルを入力す
る。
力されると言語処理部2での言語処理は行わず、入力し
た表音情報ファイルの内容を表音情報記憶部3に展開し
て記憶し、また、韻律制御部4での韻律制御も行わず、
入力した韻律情報ファイルの内容を韻律情報第一記憶部
5に展開して記憶する。
後の表音情報と修正後の韻律情報とが関連付けて記憶さ
れるので、一旦、編集作業が終わった後でもテキストと
関連付けされた表音情報および韻律情報を読込んで以前
行った編集に引き続いて再度編集を継続して行うことが
できるようになる。
の修正の順番を意識することなく、自由に所望の合成音
を再編集できるようになる。
コンピュータに実行させることのできるプログラムとし
て構成することも可能である。さらに、このプログラム
を磁気ディスク(フロッピー(登録商標)ディスク、ハ
ードディスクなど)、光ディスク(CD−ROM、DV
Dなど)、半導体メモリなどの記録媒体に格納して頒布
することもできる。
音声合成編集装置及び音声合成編集方法並びに音声合成
編集プログラムの他の実施の形態を説明する。
一つの実施例を示すブロック図である。この音声合成編
集装置は、テキスト入力部1、言語処理部2、表音情報
記憶部3、韻律制御部4、韻律情報第一記憶部5、表音
情報修正部6、表音情報表示部6−1、韻律情報修正部
7、韻律情報表示部7−1、合成音生成部8、合成音出
力部9、表音修正部分記憶部10、韻律情報第二記憶部
11、韻律情報変更部12、及び韻律修正部分記憶部1
3を有する。
2、表音情報記憶部3、韻律制御部4、韻律情報第一記
憶部5、表音情報修正部6、表音情報表示部6−1、韻
律情報修正部7、韻律情報表示部7−1、合成音生成部
8、合成音出力部9、表音修正部分記憶部10、及び韻
律情報第二記憶部11は、図1に示したものと同じであ
る。
7で修正された部分が何処であるかを記憶するためのメ
モリである。例えば、図3で1番目のアクセント句「き
ょーわ」のピッチパターンの形状が変形されたとすると
アクセント句の番号すなわち1番を韻律情報が修正され
た部分としてメモリに記憶する。
2は表音情報修正部6で表音情報が修正された場合にど
のアクセント句の表音情報が修正され、またどのアクセ
ント句に対してすでに韻律情報が修正されていたかを調
べて韻律情報を変更すべきアクセント句を決定し、決定
したアクセント句について韻律情報を変更する処理モジ
ュールである。
ント句の条件を表音情報と韻律情報の修正の有無で定め
ることができる。ここでは、韻律情報を変更すべきアク
セント句の条件を韻律情報の修正の有無に関わりなく表
音情報が修正されたアクセント句であること、または、
韻律情報、表音情報共に修正されなかったアクセント句
であることと定める。
憶部10で記憶した表音情報が修正されたアクセント句
の番号を参照し、さらに、韻律修正部分記憶部13で記
憶した韻律情報が修正されたアクセント句の番号を参照
して上述の条件に合致する韻律情報を変更すべきアクセ
ント句を決定する。次に、韻律情報変更部12は上述の
条件に合致するアクセント句について韻律情報第一記憶
部5で記憶した韻律情報を韻律情報第二記憶部11で記
憶した韻律情報で置き換える。すなわち、上述の条件に
合致するアクセント句のみ修正された表音情報に基づい
て生成した韻律情報で置き換えて変更する。
修正されるとすでに韻律情報が修正されており表音情報
が修正されなかったアクセント句については韻律情報の
修正結果が保持され、それ以外のアクセント句の韻律情
報は修正された表音情報に基づいて変更される。
句を示す一例である。図11では「きょーわ」と「てん
きです」の2つのアクセント句についてすでに韻律情報
が修正されており、アクセント句「きょーわ」について
表音情報が修正された場合を示す。ここで、上述の条件
に合致するアクセント句は「きょーわ」と「よい」であ
るのでこの2つのアクセント句については、「きょー
わ」に対して修正された表音情報を基にして新に生成し
た韻律情報で置き換えて変更し、アクセント句「てんき
です」については変更せずすでに修正された韻律情報を
そのまま保持する。
修正されなかったアクセント句を韻律情報の変更すべき
アクセント句と定めているのであるアクセント句に為さ
れた表音情報の修正が他のアクセント句の韻律情報に影
響を与えるような場合、韻律情報が修正されなかったア
クセント句に上記影響を反映させることができる。例え
ば、図11ではアクセント句「きょーわ」の表音情報が
修正されその修正がアクセント句「よい」の韻律情報に
影響を及ぼす場合、アクセント句「よい」の韻律情報を
修正された表音情報に基づいた韻律情報で変更すること
により上記影響をアクセント句「よい」に反映させるこ
とができる。このように、表音情報と韻律情報の修正の
有無で韻律情報を変更すべきアクセント句の条件を定め
ることができるので、条件の定め方によって韻律情報の
変更部分の決定をより細かくより妥当に行うことができ
るようになる。
の条件の定め方で韻律情報が修正されたアクセント句以
降のアクセント句は韻律情報を変更せず、修正された韻
律情報を保持するというように記憶した修正部分を起点
とした一定の範囲で条件付けを行ってもよい。
修正が行われた場合、ある部分の韻律情報を変更するか
どうかを表音情報の修正の有無と韻律情報の修正の有無
で決定することができる。例えば、すでに韻律情報が修
正されており表音情報が修正されなかった部分以外につ
いては韻律情報を変更するというように、韻律情報の変
更部分を表音情報と韻律情報の修正の有無で条件を定め
ることができる。この例ではある部分の表音情報が修正
された場合、すでに韻律情報が修正されており表音情報
が修正されなかった部分は修正された韻律情報を保持す
るが、韻律情報の修正の有無に関わりなく表音情報が修
正された部分、または韻律情報及び表音情報共に修正さ
れなかった部分は修正された表音情報を基に生成する新
な韻律情報で変更する。
の修正が他の部分の韻律情報に影響を与えるような場
合、韻律情報が修正されなかった部分に上記影響を反映
させることができるようになる。このように、表音情報
と韻律情報の修正の有無を見ることによって、韻律情報
の変更部分の決定をより妥当に行うことができ、操作者
は合成音の編集を適切かつ表音情報の修正と韻律情報の
修正の順番を意識せずに自由に所望の合成音を編集でき
るようになる。
コンピュータに実行させることのできるプログラムとし
て構成することも可能である。さらに、このプログラム
を磁気ディスク(フロッピーディスク、ハードディスク
など)、光ディスク(CD−ROM、DVDなど)、半
導体メモリなどの記録媒体に格納して頒布することもで
きる。
と韻律情報とを修正して所望の合成音を得ようとする音
声合成編集において、韻律情報の修正後も継続して表音
情報を修正可能とし、操作者は、表音情報の修正と韻律
情報の修正の順番を意識することのなく、自由に所望の
合成音を編集できるようになる。
ある。
る。
る。
る。
ためのフローチャートである。
ためのフローチャートである。
ためのフローチャートである。
る。
る。
である。
例である。
Claims (13)
- 【請求項1】入力された音声合成すべきテキストに対し
て所定の単位毎に表音情報及び韻律情報を生成し、所望
の音声を合成するために前記生成された単位毎の表音情
報及び韻律情報に対して修正を行う音声編集合成装置に
おいて、前記表音情報が修正された場合、単位毎に修正
された表音情報の対応する韻律情報を変更することを特
徴とする音声合成編集装置。 - 【請求項2】入力された音声合成すべきテキストに対し
て所定の単位毎に表音情報を生成する言語処理手段と、
この言語処理手段により生成した表音情報を記憶する表
音情報記憶手段と、この表音情報記憶手段において記憶
した表音情報を基に所定の単位毎に韻律情報を生成する
韻律情報生成手段と、この韻律情報生成手段により生成
した韻律情報を記憶する韻律情報記憶手段と、前記表音
情報記憶手段において記憶した表音情報を修正させる表
音情報修正手段と、前記韻律情報記憶手段において記憶
した韻律情報を修正させる韻律情報修正手段と、前記韻
律情報を基に合成音を生成する合成音生成手段と、この
合成音生成手段において生成した合成音を出力する合成
音出力手段とを有し、前記表音情報修正手段において表
音情報が修正された場合、前記韻律情報生成手段は、前
記表音情報修正手段において単位毎に修正された部分の
みの韻律情報を変更することを特徴とする音声合成編集
装置。 - 【請求項3】前記表音情報修正手段において修正された
部分を記憶する表音修正部分記憶手段を有し、前記表音
情報修正手段において表音情報が修正された場合、前記
韻律情報生成手段は、修正された表音情報を基に韻律情
報を生成し、生成した韻律情報を第二の韻律情報記憶手
段に記憶し、前記韻律情報記憶手段に記憶してある韻律
情報と、前記第二の韻律情報記憶手段に記憶した韻律情
報とを参照し、前記韻律情報記憶手段に記憶してある韻
律情報のうち、前記表音修正部分記憶手段で記憶した修
正部分についての韻律情報を変更することを特徴とする
請求項2に記載の音声合成編集装置。 - 【請求項4】音声合成すべきテキストを入力する入力手
段と、前記入力手段により入力されたテキストに対して
表音情報を生成する言語処理手段と、この言語処理手段
により生成した表音情報を記憶する表音情報記憶手段
と、この表音情報記憶手段において記憶した表音情報を
基に韻律情報を生成する韻律情報生成手段と、この韻律
情報生成手段により生成した韻律情報を記憶する韻律情
報記憶手段と、前記表音情報記憶手段において記憶した
表音情報を対話的に修正させる表音情報修正手段と、前
記韻律情報記憶手段において記憶した韻律情報を対話的
に修正させる韻律情報修正手段と、前記韻律情報を基に
合成音を生成する合成音生成手段と、この合成音生成手
段において生成した合成音を出力する合成音出力手段
と、前記表音情報修正手段において修正された部分を記
憶する表音修正部分記憶手段と、前記韻律情報修正手段
において修正された部分を記憶する韻律修正部分記憶手
段とを有し、前記表音情報修正手段において表音情報が
修正された場合、前記韻律情報生成手段は、修正された
表音情報を基に韻律情報を生成し、生成した韻律情報を
第二の韻律情報記憶手段に記憶し、前記表音修正部分記
憶手段で記憶した表音情報修正部分と、前記韻律修正部
分記憶手段で記憶した韻律情報修正部分とにより変更部
分を決定し、前記韻律情報記憶手段に記憶してある韻律
情報と、前記第二の韻律情報記憶手段に記憶した韻律情
報とを参照し、前記韻律情報記憶手段に記憶してある韻
律情報のうち、決定した前記変更部分についての韻律情
報を変更することを特徴とする音声合成編集装置。 - 【請求項5】前記表音情報修正手段における単位毎の修
正は、アクセント句を単位として行わせることを特徴と
する請求項1又は2又は4に記載の音声合成編集装置。 - 【請求項6】前記韻律情報修正手段における単位毎の修
正は、アクセント句を単位として行わせることを特徴と
する請求項1又は2又は4に記載の音声合成編集装置。 - 【請求項7】前記表音情報修正手段において表音情報が
修正された場合、前記韻律情報生成手段は、韻律情報を
変更する部分とその前後の部分とが韻律において不連続
にならないように韻律情報を変更する部分の境界におい
てつなぎ処理を行うことを特徴とする請求項1又は2又
は4に記載の音声合成編集装置。 - 【請求項8】前記表音情報記憶手段において記憶された
表音情報と前記韻律情報記憶手段において記憶された韻
律情報とを対応するテキストに関連付けして記憶するた
めの関連付け記憶手段を有することを特徴とする請求項
1又は2又は4に記載の音声合成編集装置。 - 【請求項9】前記テキスト入力手段は、テキストを入力
するとともに前記関連付け記憶手段によりテキストと関
連付けされた表音情報および韻律情報をも付随して入力
することを特徴とする請求項8に記載の音声合成編集装
置。 - 【請求項10】前記表音情報修正手段は前記表音情報を
対話的に修正されることを特徴とする請求項2又は4記
載の音声合成編集装置。 - 【請求項11】前記韻律情報修正手段は前記韻律情報を
対話的に修正されることを特徴とする請求項2又は4記
載の音声合成編集装置。 - 【請求項12】入力された音声合成すべきテキストに対
して表音情報を生成する言語処理ステップと、この言語
処理ステップにより生成した表音情報を記憶する表音情
報記憶ステップと、前記表音情報記憶ステップにおいて
記憶した表音情報を基に韻律情報を生成する韻律情報生
成ステップと、この韻律情報生成ステップにより生成し
た韻律情報を記憶する韻律情報記憶ステップと、この表
音情報記憶ステップにおいて記憶した表音情報を修正さ
せる表音情報修正ステップと、前記韻律情報記憶ステッ
プにおいて記憶した韻律情報を修正させる韻律情報修正
ステップと、前記韻律情報を基に合成音を生成する合成
音生成ステップと、この合成音生成ステップにおいて生
成した合成音を出力する合成音出力ステップと、前記表
音情報修正ステップにおいて表音情報が修正された場合
に、前記表音情報修正ステップ゜において修正された部
分のみの韻律情報を変更するステップとを含むことを特
徴とする音声合成編集方法。 - 【請求項13】入力された音声合成すべきテキストに対
して表音情報を生成する言語処理と、この前記言語処理
により生成した表音情報を記憶する表音情報記憶処理
と、この表音情報記憶処理において記憶した表音情報を
基に韻律情報を生成する韻律情報生成処理と、この韻律
情報生成処理により生成した韻律情報を記憶する韻律情
報記憶処理と、前記表音情報記憶処理において記憶した
表音情報を修正させる表音情報修正処理と、前記韻律情
報記憶処理において記憶した韻律情報を修正させる韻律
情報修正処理と、前記韻律情報を基に合成音を生成する
合成音生成処理と、この合成音生成処理において生成し
た合成音を出力する合成音出力処理と、前記表音情報修
正処理において表音情報が修正された場合に、前記表音
情報修正処理において修正された部分のみの韻律情報を
変更する処理とを含むことを特徴とする音声合成編集プ
ログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001162622A JP3721101B2 (ja) | 2001-05-30 | 2001-05-30 | 音声合成編集装置及び音声合成編集方法並びに音声合成編集プログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001162622A JP3721101B2 (ja) | 2001-05-30 | 2001-05-30 | 音声合成編集装置及び音声合成編集方法並びに音声合成編集プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2002351486A true JP2002351486A (ja) | 2002-12-06 |
| JP3721101B2 JP3721101B2 (ja) | 2005-11-30 |
Family
ID=19005719
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2001162622A Expired - Fee Related JP3721101B2 (ja) | 2001-05-30 | 2001-05-30 | 音声合成編集装置及び音声合成編集方法並びに音声合成編集プログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3721101B2 (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015055793A (ja) * | 2013-09-12 | 2015-03-23 | 富士通株式会社 | 音声合成装置、音声合成方法、およびプログラム |
| JP2015172625A (ja) * | 2014-03-11 | 2015-10-01 | 富士通株式会社 | 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム |
| WO2018164278A1 (ja) * | 2017-03-09 | 2018-09-13 | ヤマハ株式会社 | 音声対話方法および音声対話装置 |
| JP2022169012A (ja) * | 2021-04-27 | 2022-11-09 | 日本放送協会 | 編集装置、音声合成装置及びプログラム |
-
2001
- 2001-05-30 JP JP2001162622A patent/JP3721101B2/ja not_active Expired - Fee Related
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015055793A (ja) * | 2013-09-12 | 2015-03-23 | 富士通株式会社 | 音声合成装置、音声合成方法、およびプログラム |
| JP2015172625A (ja) * | 2014-03-11 | 2015-10-01 | 富士通株式会社 | 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム |
| WO2018164278A1 (ja) * | 2017-03-09 | 2018-09-13 | ヤマハ株式会社 | 音声対話方法および音声対話装置 |
| JP2018146906A (ja) * | 2017-03-09 | 2018-09-20 | ヤマハ株式会社 | 音声対話方法および音声対話装置 |
| JP2022169012A (ja) * | 2021-04-27 | 2022-11-09 | 日本放送協会 | 編集装置、音声合成装置及びプログラム |
| JP7685869B2 (ja) | 2021-04-27 | 2025-05-30 | 日本放送協会 | 編集装置、音声合成装置及びプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3721101B2 (ja) | 2005-11-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5482042B2 (ja) | 合成音声テキスト入力装置及びプログラム | |
| US7487092B2 (en) | Interactive debugging and tuning method for CTTS voice building | |
| JP3070127B2 (ja) | 音声合成装置のアクセント成分制御方式 | |
| JPH10153998A (ja) | 補助情報利用型音声合成方法、この方法を実施する手順を記録した記録媒体、およびこの方法を実施する装置 | |
| JP2005345699A (ja) | 音声編集装置、音声編集方法および音声編集プログラム | |
| US9020821B2 (en) | Apparatus and method for editing speech synthesis, and computer readable medium | |
| JP4856560B2 (ja) | 音声合成装置 | |
| JP3728173B2 (ja) | 音声合成方法、装置および記憶媒体 | |
| JP2002351486A (ja) | 音声合成編集装置及び音声合成編集方法並びに音声合成編集プログラム | |
| JP4311710B2 (ja) | 音声合成制御装置 | |
| JP2009157220A (ja) | 音声編集合成システム、音声編集合成プログラム及び音声編集合成方法 | |
| JP6340839B2 (ja) | 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム | |
| JP4639932B2 (ja) | 音声合成装置 | |
| JP4026512B2 (ja) | 歌唱合成用データ入力プログラムおよび歌唱合成用データ入力装置 | |
| JP2001134283A (ja) | 音声合成装置および音声合成方法 | |
| JPH07160289A (ja) | 音声認識方法及び装置 | |
| JPWO2009044596A1 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
| JP6767128B2 (ja) | 手話cg生成装置及びプログラム | |
| JP2003330482A (ja) | 基本周波数パターン生成方法、基本周波数パターン生成装置、音声合成方法、音声合成装置、基本周波数パターン生成プログラムおよび音声合成プログラム | |
| JP3414326B2 (ja) | 音声合成用辞書登録装置及び方法 | |
| JPH0642158B2 (ja) | 音声合成装置 | |
| JP2012163721A (ja) | 読み記号列編集装置および読み記号列編集方法 | |
| JP6727477B1 (ja) | ピッチパターン補正装置、プログラム及びピッチパターン補正方法 | |
| JP2004054063A (ja) | 基本周波数パターン生成方法、基本周波数パターン生成装置、音声合成装置、基本周波数パターン生成プログラムおよび音声合成プログラム | |
| JP3086333B2 (ja) | 音声合成装置及び音声合成方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20041207 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050107 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050308 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20050414 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050606 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050906 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050909 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080916 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090916 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090916 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100916 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110916 Year of fee payment: 6 |
|
| LAPS | Cancellation because of no payment of annual fees |