琉球語とアジアの言語の音声分析と合成

Autor: Takara, Tomio, Ooishi, Takashi
Jazyk: japonština
Rok vydání: 2008
Předmět:
Popis: 平成17年度~平成19年度科学研究費補助金(基盤研究(C))研究成果報告書
研究概要:(平成18年度時点)高速コンピュータ及び高速通信網の発達により、音声や映像を用いた通信や処理、すなわちマルチメディア通信処理が進展しつつある。音声を用いた高度のヒューマンインターフェースとしての音声合成技術や音声自動認識も実用化されつつある。しかし、これらの技術は、主として西欧語、日本語、中国語などの主要な言語に対するものであり、必ずしも主要でない言語に対応した音声合成・認識の研究は進展しているとはいえない。そこで本研究では,琉球方言の音声合成システムを発展させた汎用音声合成システムを、アジアのいくつかの言語に適用し、これらの言語にも応用可能な、より汎用的な音声合成シェルを構成する。今年度は、以下のことを行った。 (1)ヴェトナム語の連続音声合成システムの構成平成17年度のプロトタイプを基にして、ヴェトナム語の連続音声合成システムを完成させた。特に、Broken Toneについてパワーの生成モデルを提案した。ヴェトナム出身の学生が本研究室に再留学したので、この研究を大いに推進した。 (2)バングラデシュ語の音声合成システムのプロトタイプの作製音声合成シェルを利用してバングラデシュ語の音声合成システムのプロトタイプを作製した。ここでは、バングラデシュ語の母音のすべてにある対応する鼻母音の規則化が研究課題である。この研究の中で、同じ一つの母音がバングラデシュ人と日本人とでは別の音韻に聞こえることを見出し、国際会議で発表した。 (3)音声合成スペクトルエディタの評価・改良前年度に構成された音声合成スペクトルエディタを評価し、これを改善した。また、これを用いて音声に含まれる個人性の要因分析を行った。まず、音声を、個人性の特徴と考えられるスペクトル、基本周波数、パワー、及びスペクトルのタイミングに分解し、いくつかの組み合わせで合成して、これがどの話者の声に聞こえるかを聴取実験により確認した。また、エチオピア語のストレスの物理的要因がパワーでなく、ストレス母音の直後の子音が長くなることによることを合成音声の聴取実験により示した。
未公開:P.1以降(別刷論文のため)
Databáze: OpenAIRE