2016年05月09日

電話の声は、本人の声が伝わっているわけではなかった!という話。勘違いしやすそう。

先日、テレビ番組で、「あなたの常識が覆る」っていうようなことをやっていて、その中に、「携帯電話の音声は、話し相手の声が伝わっているわけではない」という話題が入っていました。

最初に聞いたときはわけがわからなくて、まぁたしかに電話の声はクグもって聞こえてくるし、mp3みたいな非可逆圧縮もしているんだろうし、そりゃ、本人の声とは違う声が伝わっているってのは当たり前だろう・・・みたいに考えてしまったのですが・・・。

いや、そんなこと如きだったら、ゴールデンタイムのテレビ番組で流すような内容ではないな、と、思い直しまして、改めてググってみることにしました。


携帯電話で聞こえる声は、コードブックの合成音であり、音の辞書から選ばれているとのこと。
携帯電話は通信量を抑えるために音声情報そのままではなくて、コードブックの番号を通信して相手側で似たような音を再生しているんだとかいう話です。最初に聞いた時は、訳が分からなかった。

音声パターンとして、数千種類の音が登録されいて、そのコードブックの中から話し手の声の特徴に最も近い音が選ばれているんだそうです。
テレビ番組では「数億通りの音声パターン」という事になっていましたが、おそらく合成のパターン数がそれくらいあるということでしょう。音声データが数億件も、携帯電話に入っているとは思えないので。

人間の話し声のうち、意味を通じさせるための要素のみを取り出して情報量を下げるだけの場合、声質が相手に伝わらず、誰が話しているのか分からないので、相手の声質データを別途伝える手段が存在しているってことでしょうかね。
人間の話し声以外の音もあるみたいで。

音のパターンを番号かなんかにして伝えて、その分の音のデータを省力化しているんですね。効率の良い作戦です。近しい親族や年齢の近い人の声が聞き分けづらいって話もあるので、もしかするとオレオレ詐欺の成立がしやすい土壌になっているのでは?という指摘もあるらしいですが、まあ、確かにそうなのかもしれませんね。

こういうやつって、聞いた瞬間には理解できなくて、今持っている自分の知識の中で理解しようとして勝手に納得してしまうことが多いんですが、多分それではいけないパターンなんだろうな。多分、自分の持っている知識とは全然違う技術が使われていそう。

ああ、こういうことを書くと、去年の勘違いさんをまた思い出しちゃうな。


続きを読む
posted by ayacy at 00:00 | Comment(0) | TrackBack(0) | 日記