研究内容
複素信号処理を研究の柱として、
携帯電話、IP電話でも実現できる音声認識、音声合成、音声強調、
IP電話の必修技術であるパケットロス隠蔽方式の研究を行っています。
複素音声分析
Time-varying complex ARモデルに基づく音声分析法の構築とその応用を行なっ ています。 以下の分析法を構築済みです。
- MMSE (EUSIPCO-98@ロドス島、ギリシャ)
- Robust M推定 (ICSLP-98@シドニー)
- 補助変数(IV)法 (ICSLP-2000@北京)
- 一般化最小2乗法(GLS)
- 拡大最小2乗法(ELS) (EUROSPEECH-2001@オールボー、デンマーク)
- 前向き後向きLP-ELS (ICSLP-2002@デンバー、アメリカ)
- 前向き後向きLP-GLS (MMSP-2002@セントトーマス、アメリカ領バージン諸島)
- Output error法による前向き後向きLP-ELS (ISSPIT-2003@ダルムシュタッド、ドイツ)
- WLP(MAVEBA2013@Firenze)
さらに、拡張すると共に、音声のF0推定、音声強調、音声認識などの音声処理で評価を行ないます。
@基本周波数(F0)推定(金城竜彦⇒比嘉健人⇒堀田⇒魏)
時変複素音声分析を用いた音声のF0推定の研究を行なっています。
- 複素音声分析を用いたF0推定(IEEE DSPワークショップ@グランドテートン国立公園、USA)
- ELS基準複素音声分析を用いたF0推定(EUSIPCO2008,ローザンヌ、スイス)
A音声強調(照屋裕人)
時変複素音声分析を用いた音声強調の研究を行なっています。
- 複素音声分析を用いたWienerフィルタ型音声強調(EUSIPCO2008,ローザンヌ、スイス)
B音声の電子透かし(賀数)
時変複素音声分析を用いた音声のパラメトリック電子透かしの研究を行なっています。
C音声認識(金城竜彦⇒又吉慶伍⇒比嘉啓太)
時変複素音声分析を用いた音声認識の研究を行なっています。
ETSI AFEの改良を行い、いろいろ発表しています。
- 複素音声分析を用いたHMM音声認識(IECON2006@パリ)
- APSIPA2015@香港
- APSIPA2016@Jeju
D音声合成(水谷⇒稲福)
時変複素音声分析を用いた音声合成の研究を行なっています。
E音声符号化(舟木)
時変複素音声分析を用いた音声符号化の研究を行なっています。
MPEG-4 ALSの改良とG.711.1の改良を行っています。
Fパケットロス隠蔽(仲村⇒休止中)
VoIPにおけるパケットロス隠蔽に関する研究を行っています。
- 時変分析を用いたPLC方式(MAVEBA2003@フィレンツェ、イタリア)
- LPC分析によるG.711 PLC方式の改良(EuroIMSA2005@グリンデルワルド、スイス)
- Sinusodal分析予測を用いたPLC(EUROCON2005@ベオグラード、セルビア)
GBiquaternion
(舟木)
虚数単位を3個有するHamilton数で各要素が複素数の信号を
Biquaternionと言います。
複素信号処理の拡張として、Biquaternion信号処理の研究を始めています。
HVandermonde変換(島袋泰志⇒)
戻る