微软AGENT简介
微软Agent API能够提供卡通角色的显示,另外,它还可以支持语音识别,因此应用软件可以对语音命令作出反应,而卡通角色可以通过合成的语音、录制好的音频信号或文字对命令作出反应。
使用微软AGENT的要求
要使用该技术,我们必须有下面的组件:
·微软Agent核心组件
·微软Agent中的卡通角色━━Genie、Merlin、Robby和Peedy
·微软Speech API 4.0a运行时间库
·微软语音识别引擎
·Lernout和Hauspie文字-语音引擎
上面的所有这些组件都可以从http://microsoft.com/products/msagent/downloads.htm下载。
语音技术简介 文字-语音转换指的是计算机将文字信息转换为合成语音进行输出,语音识别是指计算机能够识别出说话者所说的话,接受说话者的命令和输入的数据。
语音识别和文字-语音转换都需要用到相关的引擎,几乎所有的语音识别引擎都是将输入的语音数据转换为与特定引擎相关的音素,然后这些音素被转换为应用程序能够使用的文字。
文本-语音转换的二种方式:
1、合成文本-语音转换
2、连续文本-语音转换
合成文本-语音转换方式: 在合成的发音方式中,引擎处理每个单词,并产生该单词的发音音素,然后这些音素被转入一个复杂的算法中,模仿人类的发声方式,生成语音。
连续文本-语音转换方式: 在连续文本-语音转换方式中,引擎对文本信息进行处理,从一个预先录制好的语音库中找出句子、单词和短语,在这种方式中,生成的语音是连续的。
用户评论