喉頭機能外科 : IV 発声障害検査診断法 : A 検査法 : 5 音声の分析
: 4 最長持続発声時間の測定
: 6 喉頭鏡検査


IV-A-5 音声の分析

音声 (嗄声) を分析する意義は主に2つある. 第1に音声の分析を通じ, 嗄声の要因を解明, ひいては疾患の診断に役立てる. 第2には嗄声の程度の分析を通じ, 治療効果の判定に役立てる事である.

音声の分析ないし評価の方法を大別すれば,

  1. 聴覚印象にもとづく心理計量学的評価
  2. 各種電気音響器機による客観的分析

各々長短所があるが, 聴覚印象にもとづく評価の特徴は,

  1. 患者の立場からすれば, 人間がその人の声をどう感ずるか, 最も実利的評価に 結びついている.
  2. 機械ではできない総合的判断が可能である.
  3. 判定者による主観の相異が問題だが, これが予想外に小さい.
  4. 高価な機械を要しない.
  5. その評価は過去の成績から嗄声のメカニズム, 疾患とも関連づける事が出来る.

しかし何といっても本法の最大の短所は, 1) 主観的という事と, 2) 一体何を, 音のどんな特徴をどう感じているのか, つまり音響的特徴と聴覚印象との関係が解明されていない事であろう.

主観的という欠点を補う意味で筆者は 1966 年, Osgood の意味微分法を用いてこの欠点を補う様試みた.

a) 意味微分法による聴覚判定

詳細は既発表論文を参照していただくとして, その要点をのべると, 各種嗄声を種々の形容詞対 (例えば「細い―太い」, 「かわいた―ぬれた」などで,これを scale という) について7点法で評点, これを意味微分法で因子分析の結果, 次の4因子が抽出された.

  1. R 因子 (rough) ガラガラ, ゴロゴロ声で粗[米造]性
  2. B 因子 (breathy), 囁き声の時の様に息もれの声で気息性
  3. A 因子 (asthenic) 無力性
  4. D 因子 (degree) 嗄声の種類に関係なく程度を表わす因子

嗄声各因子の聴覚印象を文章で表現しても, 充分に尽くせるものではない. 表紙裏のレコードに各因子を代表する嗄声を集録しておいたので参照ねがいたい.

→ : レコード集録の音声

表現法としては RBAD 各因子について 0, 1, 2, 3, の評価をする. 0 はなし, 1やや, 2 かなり, 3 極めて,というわけで,例えば R2B1A0D2ならば "かなり粗で,やや気息性で嗄声の程度は中等度" という意味である.

この様にして同じ嗄声サンプルを全国10数ケ所の医療機関で判定した結果は予想外の一致度を示した. また各種疾患別にこれをみると, 疾患によりある種の嗄声傾向を認める事も判った. 現在, これらデータにもとづいて当教室で編集されたテープが基準テープとして頒布されている. 聴覚印象と音響特徴についてはすでに広戸の報告している通りでR 型は基本周波数振巾変動を主特徴とし, B 型は高周波帯域雑音 (乱流雑音と思われる) を主とし楽音成分を認めない. A 型はあまりはっきりしないが, 音の強さや, 倍音成分 (高周波倍音成分の減衰度) が関連ある様である. 疾患により嗄声の特徴がある程度認められる(図93).

b) サウンドスペクトラムの分析 (Sonagram)

嗄声についてNessel, 柳原, 広戸ら数多く研究がなされ, ここに特記すべき事はない. 音の強さの等高線を示す特殊なもの voice print についても岩田, von Leden らの報告がある. 当然の事ではあるが, 注意すべき事を一つだけのべるならば, 口前音の分析では共鳴腔の影響があり従って音声のソナグラムを論ずる場合 (術前術後の比較とか), 喉頭原音と共鳴の影響を区別すべきで, 「声帯の手術々後フォルマントの位置が変った」とかいう様な記述は従って問題である.フィルターのバンド巾によって, 分析される要因, 従ってソナグラムパターンも異なって来るが, 広域フィルターでは周波数の瞬時変動が, 挟域フィルターでは高周波雑音の要因がよく判る. これは周波数成分について精密に知ろうとすれば時間要因を犠牲にせねば ならぬという不確定原理によるものである.

c) 電子計算機による分析

最近この領域での進歩発展はめざましいものがある. Lieberman が, 嗄声における基本周期の瞬時変動 (pitch perturbation) を計算機により解析して以来, 多くの分析ならびに合成的研究がなされて来た. 我国においても平野, 比企らによる声帯波の抽出とその自己相関関数, 基本周期, 最大振巾のゆるぎについて報告, その他岩田の pitch perturbation について, Koike, Kitajima らの振巾のゆらぎ, Koike らの inverse filter 後の残存波 (residue) についての報告もなされている.

ここでは我々の pitch perturbation についての研究, 臨床応用の成果とその特徴を簡単に記載する. 詳細は既発表の北嶋論文を参照されたい.

音声の基本周波数瞬時変動の電子計算機による解析.

従来の研究と異なる点は, 分析結果がなるべく人間の聴覚印象に近い方が望ましいので, 基本周期や基本周波数そのものの変動の代りに, 音の高さの感覚と対応する基本周波数の対数すなわち semitone を用いた点である.

semitone は 39.86×log f2/f1 で表わされる2音間の間隔 (scale) である. 具体的には録音した音声を計算機 PDP-12 に入力せしめ,基本周期を測定したのちこれを semitone scale に変換した上で,相隣る周波数 (セミトーン) の差 (ΔF) の平均を求めた.数式で示せば

= (t =1ΣN -1 |Fi - Fi+1 |) / ( N -1 )

但し Fi は瞬時周波数 (semitone scale)

N は計測個数.単語発声時にはアクセントによるピッチ変動があるので5点加重移動平均処理後に上式を適用した.

測定例を図94, 95に示す.

正常音声における ΔF の範囲.

持続発声 /ア/ における正常域は男子 0.08〜0.23 semitone, 女子 0.14〜0.25 semitone である (5% 水準).

嗄声における ΔF

ΔF が 1 semitone を越える高度変動例ではいずれも声帯に大きな腫瘍を有する場合であり,質量ないし容積の変化,非対称が ΔF に大いに関与している.高度気息性嗄声ではそもそもピッチの抽出が出来ず,従ってピッチの瞬時変動は声門閉鎖不全軽度でR 型嗄声の程度を表わすのによく適している.喉頭炎,声帯結節,反回神経麻痺では口前音はかなり気息性因子優勢のものが多く, ΔF は正常範内のものがかなりある.

音声の分析についての基本方針

電子計算機利用による音声の分析は精度, 分析パラメターの数などの面で益々進歩するものと思われる. 音声分析について重要と思う事は, 1st approximation→2nd approximation という事である. いきなり音声のごく一要因のみをとり上げ詳細に分析, 全体を論ずるよりも, まず大体の見当をつけ, 徐々に細部にわたり分析して行くという方針が肝要である. 具体的にはまず聴覚印象とソナグラムで音声の特徴をほぼつかんだ上で, 計算機による分析を行うべきと考える. 今後音声の分析は多変数解析の方向に進むであろうが, 全体における指南を失わぬためにも, 聴覚判定, ソナグラムの意義は当分変わらぬものと考える.


喉頭機能外科 : IV 発声障害検査診断法 : A〕検査法 : 5 音声の分析
: 4 最長持続発声時間の測定
: 6 喉頭鏡検査


mailto: webmaster@hs.m.kyoto-u.ac.jp
Last update: March 16, 1999