RWCP 実環境音声・音響データベース マイクロホンアレーデータベース |
ATR音声言語通信研究所 第一研究室 中村 哲、西浦 敬信
http://www.slt.atr.co.jp/dept1/index.html
| 1.収録の方針 |
ドライソースと種々の部屋のインパルス応答(音響伝達特性)を畳み込むこ とで、多種類の音環境をシミュレートする目的で、本データベースは構築され ている。また、畳み込みでシミュレートできない音源である、移動音源などは 実音場で収録を行う。本データベースは、9種類の部屋でのインパルス応答と5 種類の部屋での実収録した音声、および5種類の部屋での実収録した移動音源 などが存在する。
| 2.マイクロホンアレー 収録の概要 |
| AD/DA | MD-8000 mk2 (PAVEC) |
|---|---|
| アンプ | マイクロホンアンプ (PAVEC MD-8000 mk2)、スピーカアンプ (YAMAHA P4050) |
| 受音器 | 音響測器(株) ( マイクロホン (Hoshiden KUC1333)) |
| スピーカ | (DIATONE DS-7) |
| 音源移動 | 専用音源移動装置 ((株)野木) |
| 位置計測 | OPTOTRAK (Nothern Digital Inc.) |
データ収録に使用した機器を表1に示す。本収録では以下の2つのマイクロホ ンアレー(受音器)を用いた。
circle: 円形マイクロホンアレー(16channel)
cirline: 円形+直線マイクロホンアレー(30channel)
図1に素子の配置図を示す。素子番号1が正面方向である。円形アレーの 直径は30cmでその円周上に等間隔に16素子が配置してある。また直線型ア レーは素子間隔2.83cmで14素子配置されている。


| 3. OPTOTRAK |
◎実時間3次元位置計測装置
1.最大で256個の赤外線ダイオードを実時間で追跡
2.3次元位置データと剛体位置データのリアルタイム表示が可能
3.最大0.01mmの分解能、0.1mmのRMS精度
4.最大400Hzのデータ収録が可能
System Design : Data Acquisition Unit II(by Nothern Digital Inc.)
◎同期信号入出力システム
OPTOTRAKの位置データと同期させて信号を収集
1.アナログ: 16ch 入力, 2ch 出力
2.デジタル: 8ch 入力

| 4. 収録条件 |
無響室と残響可変室(パネル)において測定した騒音レベルおよび温度・湿 度を下表に示す。この値は全収録時間中の平均の値である。ただし、移動音声 においてはOPTOTRAKの影響により騒音レベルが高めの値となっているので注意 が必要である。表中のdBA欄にある(*)印は騒音計が''under flow''したことを 示す。
| 部屋 | 残響時間 | 温度 | 湿度 | dBA | dBC |
|---|---|---|---|---|---|
| 無響室 | 0.0 | 21.4度 | 44.4% | 15.9* | 29.9 |
| 残響可変室(シリンダ) | 0.12 | - | - | 18.5* | 48.0 |
| 残響可変室(シリンダ) | 0.31 | - | - | 18.5* | 48.3 | 残響可変室(シリンダ) | 0.38 | - | - | 17.4* | 46.0 | 残響可変室(パネル) | 0.3 | 22.1度 | 37.1% | 18.9* | 43.8 |
| 残響可変室(パネル) | 1.3 | 22.1度 | 37.1% | 19.6* | 49.6 |
| 会議室 | 0.78 | 20.7度 | 36.2% | 43.2 | 50.9 |
| 畳部屋(大) | 0.60 | 11.5度 | 37.0% | 44.7 | 55.1 |
| 畳部屋(小) | 0.47 | 12.0度 | 36.8% | 44.8 | 56.7 |
| 5. 収録風景 |
![]() |
![]() |
![]() |
![]() |
| 6. 収録状況 |
![]() |
![]() |
![]() |
| 7. データの種類 |
本データベースでは以下に示す5項目が収録されている。データはインパ ルス応答がfloat型(4バイト)、音声データがshort型(2バイト)ですべてリ トルエンディアンとなっている。また、サンプリング周波数は48KHzである。
2.移動音源
3.拡散音場
4.背景雑音
5.ピストンホン
インパルス応答
インパルス応答はTSP[1]を用いて収録した。TSP長は65536点である。同期加算は16回行った。収録に使用したTSPとその時間反転TSPを下記に記載する。なお、インパルス応答の求め方はDB内のインパルス応答解説ページを参照。また測定に使用したTSPと時間反転TSPを下記に置く。図にサンプルのインパルス応答を示す。
[TSPデータ], [時間反転TSPデータ]
![]() 測定したインパルス応答例 |
音声データ
音声データはATR音韻バランス50文とTIMIT(The DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus)データベース中に含まれる10文×4名のあわせて90文を収録した。データは各音声ごとにZIPしている。解凍すると各音声ごとにディレクトリ構造になっており、その中に各チャンネルに対応するファイル(mmysda01.1, mmysda01.2,...)が格納されている。以下に無響室と残響可変室にて収録した音声波形の一例を示す。
![]() |
![]() |
移動音源
移動音源は図2に示す移動音源装置を用いて収録した。棒の先にスピーカを固定して支柱の根元にマイクロホンアレーを配置した。2.の移動音源に対する固定のインパルス応答もこの軌道上の数点において収録されたものである。移動音声に対しては人力により棒を動かすことによりデータ収録を行った。そこで各時刻においての音源位置をOPTOTRAKを用いて測定しデータベース内に保存されている。音源位置データのフォーマットはリトルインディアン、 float型(4バイト)、周波数は100Hzでx, y, z座標がfile.x, file.y, file.z となっている。座標は受音器の中心からの距離で単位は[mm]である。図は移動音源装置とOPTOTRAKを用いた音源移動の軌跡を示す。
![]() |
![]() |
拡散音場
拡散音場についてはスピーカを壁側に向けてインパルス応答の測定を行った。
以下に収録風景を示す。
![]() |
![]() |
背景雑音
会議室において背景雑音を10秒間2セット収録した。
ピストンホン ピストンホンは素子校正用のキャリブレーション用のデータとして収録。ピストンホンONSOKU TYPE2126を使用した。
| 8. データの一覧表 |
RT: 室内の残響時間
CH: マイクロホンの素子数
Ang: 収録データの方向数
Len: 1素子あたりの長さ(音声では全体の文数)
Byte: ファイルのバイトオーダー(全てリトルインディアン表記)
Total: 全容量
部屋 RT CH Ang Len Byte Total
/micarray/MICARRAY/data1 ... インパルス応答
+--/circle
| +--- ANE/imp000 無響室 0.00 16 36 5000 4 11.2MB
| +--- E1A/imp000 残変室(シリンダ)A 0.12 16 1 12000 4 753kB
| +--- E1B/imp000 残変室(シリンダ)B 0.31 16 19 30000 4 34.9MB
| +--- E1C/imp000 残変室(シリンダ)C 0.38 16 19 36000 4 41.8MB
|
+ --/cirline
+--- E2A/imp000 残変室(パネル)A 0.30 30 9 30000 4 31.0MB
+--- E2B/imp000 残変室(パネル)B 1.30 30 9 125000 4 128.8MB
+--- OFC/imp000 会議室 0.78 30 9 75000 4 77.3MB
+--- JR1/imp000 畳部屋(大) 0.60 30 9 60000 4 61.9MB
+--- JR2/imp000 畳部屋(小) 0.47 30 7 45000 4 36.1MB
/micarray/MICARRAY/data2 ...音声(E2A は DVD-ROM Vol.1, E2B OFC JR1 JR2 は DVD-ROM Vol.2)
+-- /cirline/
+--- E2A/mmysda01 残変室(パネル)A 0.30 30 1 90sent. 2 1.2GB
+--- E2B/mmysda01 残変室(パネル)B 1.30 30 1 90sent. 2 1.2GB
+--- OFC/mmysda01 会議室 0.78 30 1 90sent. 2 1.2GB
+--- JR1/mmysda01 畳部屋(大) 0.60 30 1 90sent. 2 1.2GB
+--- JR2/mmysda01 畳部屋(小) 0.47 30 1 90sent. 2 1.2GB
/micarray/MICARRAY/data3 ...移動(インパルス応答)
+-- /cirline
+--- ANE/imp000 無響室 0.00 30 5 5000 4 2.9MB
+--- E2A/imp000 残変室(パネル)A 0.30 30 5 30000 4 17.2MB
+--- E2B/imp000 残変室(パネル)B 1.30 30 5 125000 4 71.6MB
+--- OFC/imp000 会議室 0.78 30 5 78000 4 43.0MB
+--- JR1/imp000 畳部屋(大) 0.60 30 5 60000 4 34.4MB
/micarray/MICARRAY/data4 ...移動(音声)(DVD-ROM Vol.3)
+-- /cirline
+--- ANE/mmysda01 無響室 0.00 30 1 90sent. 2 1.2GB
+--- E2A/mmysda01 残変室(パネル)A 0.30 30 1 90sent. 2 1.2GB
+--- E2B/mmysda01 残変室(パネル)B 1.30 30 1 90sent. 2 1.2GB
+--- OFC/mmysda01 会議室 0.78 30 1 90sent. 2 1.2GB
+--- JR1/mmysda01 畳部屋(大) 0.60 30 1 90sent. 2 1.2GB
/micarray/MICARRAY/data5 ...拡散音源
+-- /cirline
+--- OFC/imp_rev 会議室 0.78 30 1 75000 4 8.6MB
/micarray/MICARRAY/data6 ...背景雑音
+-- /cirline
+--- OFC/ambient1 会議室 0.78 30 1 480000 2 27.5MB
+--- OFC/ambient2 会議室 0.78 30 1 480000 2 27.5MB
/micarray/MICARRAY/data7 ...ピストンホン
+--/cirline
+--- Equalize - - 30 1 144000 2 8.3MB
| Reference |