音声読み上げ

.log - 辞書に載っていない英単語の発音はOperaに聞こうから、辞書に載っていない英単語の発音を調べる方法を経由して、Text-To-Speech (TTS) -- Our Demo Speaks Your Text を試した。
やけに自然な発音だと思ったら、実際に人が話した音声の断片をつないでいるようだ。

we record a human speaker to make a voice database. We re-use small chunks of the recordings to create new sentences containing words that were never recorded. Further, we do "unit selection" synthesis. This means that we use large voice databases and do clever searches on-the-fly to find chunks in the voice database that best match the requested sentences.

したがって、話される言葉は「機械が作った音」の連続ではなく、人の話した「音の断片の合成」のようだ。たとえば IBM がやっていて Opera で以前から利用出来る英語の読み上げや、Konqueror からも利用出来る KTTS - KDE Text-to-Speech System が前者であるのとアプローチが異なっていて比較すると面白い。

OSS でも実際の人間の発音を wav 形式で取っておいて、それらを利用する方式もあるが、何せファイルサイズが大きい割に収録されている語彙が少なく実用的ではなかった。その点、AT&T に分があるように思える。