本帖最后由 wh_support 于 2013-10-11 14:32 编辑
1、什么是capkey? 答:capkey就是我们所说的能力,每个能力代表一种不同的功能,每次调用灵云在初始化时候,都需要初始化能力,并且在启动会话时,调用能力。
2、什么是本地能力? 答:本地能力是指可以在用户终端就完成识别、合成等功能的能力,它相比云端能力增加了本地库资源文件 。 3、什么是云端能力? 答:云端能力是指需要在云端完成识别、合成等功能的能力。
4、什么是点数? 答:开发者社区中每一种云端能力都有对应的点数,每调用一次云端能力就会消耗一定点数。快速体验每日上限500点;开发调试每日上限2000点;免费商用每日上线25000点。
5、本地能力也需要联网么? 答:使用本地能力只需在第一次运行时联网下载授权,本地授权下载完成后后续使用就不需要联网了。
6、云端能力需要一直联网么? 答:需要。使用云端能力会将数据发送到云服务器上处理后,再传回本地,整个过程需要联网操作。
7、开发文档具体在SDK包什么位置? 答: C/C++ | C/doc/html/index.html (开发手册) | Android | Android/doc/API/Reference/html/index.html(API参考手册)
Android/doc/Dev/Guide/html/index.html(开发指南) | iOS | iOS/doc/html/index.html(开发手册) | Java | Java/doc/API/Reference/html/index.html(API参考手册)
Java/doc/Dev/Guide/html/index.html(开发指南) |
8、语音合成本地能力中N5和N6区别? 答:N5是低版本引擎,适用于armv7a以下下处理器;
N6是高版本引擎,它合成的音质、自然流畅度相比N5效果要优,因其算法复杂度较高,需要较强的CPU能 力, 一般适用于armv7a处理器,同时它的音库文件较N5大。
9、返回错误码8、 9、 12、14 、503 是什么问题? 答: 错误8 | 连接服务器失败,服务器无响应
解决方法:确认是否联网;确认帐号中的url地址是否填写正确。 | 错误9 | 服务器访问超时
解决方法:同错误8解决方法 | 错误12 | 没有找到指定的能力
解决方法:确定capkey赋值是否为所申请的能力列表内;确定授权文件是否过期。 | 错误14 | 本地能力引擎缺失必要的库资源
解决方法:确认库文件是否存在并名字是否正确(android与Java需改名lib****.so),确认fileflag是否设置正确;确认本地datapath是否为存在的路径 | 错误503 | android与java使用N6能力需确认是否将libhci_tts_n6.so改名为libhci_tts.so并替换;C平台使用n6能力需确认是否将hci_tts_n6.dll改名为hci_tts.dll并替换。 |
10、ASR_Example与ASR_Recorder_Example区别? 答:ASR_Example是通过输入已有录音,输出识别文本的示例代码;ASR_Recorder_Example是通过实时说话录入音频,输出识别文本的示例代码
11、TTS_Example 与TTS_Player_Example区别? 答:TTS_Example是导入txt文本文字,合成音频文件;TTS_Player_Example是实时输入文本,合成后实时播放音频。
12、本地ASR语法识别语法与语法文件的对应关系? 答:grammarType=jsgf ,对应语法文件为:stock_10001.gram; grammarType=jtg,对应语法文件为:goto_where_grammar_utf8.txt; grammarType=wordlist,对应语法文件为:wordlist_utf8.txt。
13、Android集成时,调用ASR_Recoder发现无法使用? 答:请确认是否有录音机权限:在AndroidManifest.xml添加<uses-permission android:name="android.permission.RECORD_AUDIO" />
14、VS2010调用C的ASR,运行demo出现崩溃? 答:将AccountInfo.cpp中的33行代码“if (strTmp[0] == '#' || strTmp.empty())”修改为“if (strTmp.empty() || strTmp[0] == '#' )”即可解决。
15、ASR识别支持的音频格式有哪些? 答:cloud.grammar引擎识别时可用:pcm8k16bit, ulaw8k8bit, alaw8k8bit local.grammar引擎识别时可用:pcm16k16bit
cloud.freetalk引擎识别时可用:pcm16k16bit, ulaw16k8bit, alaw16k8bit
16、语音数据格式与编码格式的对应关系是什么? 答:如下图: | encode | none | ulaw | alaw | speex | opus | audioFormat | pcm8k16bit | pcm8k16bit | ulaw8k8bit | alaw8k8bit | N/A | N/A | ulaw8k8bit | ulaw8k8bit | ulaw8k8bit | N/A | N/A | N/A | alaw8k8bit | alaw8k8bit | N/A | alaw8k8bit | N/A | N/A | pcm16k16bit | pcm16k16bit | ulaw16k8bit | alaw16k8bit | speex | opus | ulaw16k8bit | ulaw16k8bit | ulaw16k8bit | N/A | speex | opus | alaw16k8bit | alaw16k8bit | N/A | alaw16k8bit | speex | opus |
17、TTS支持的输出音频格式有哪些?
答:云端引擎支持的音频格式:auto, vox6k4bit, vox8k4bit,alaw8k8bit, ulaw8k8bit,pcm8k8bit, pcm8k16bit,pcm11k8bit, pcm11k16bit,pcm16k8bit, pcm16k16bit,mp3本地引擎支持的音频格式:
auto, pcm8k8bit, pcm8k16bit,pcm11k8bit, pcm11k16bit,pcm16k8bit, pcm16k16bit,alaw8k8bit, ulaw8k8bit
18、TTS如何设置“1”、“2”的读音? 答:在TTS合成函数增加配置串参数“specialOne=yi1”或"specialOne=yao1"(电报读法);"specialTwo=er4"或"specialTwo=liang3"(数目读法)
19、HWR如何设置行叠写模式?答:在HWR识别函数(多字识别)增加参数配置串参数"splitMode=line"(行识别)或"splitMode=overlap"(叠字识别)
20、OCR目前都支持哪些图片格式的识别?
答:目前支持bmp、jpg、png、tif、gif格式的图片
21、除论坛反馈外,还可以用哪些其他方式联系捷通? 答: 1)邮件反馈:您可以通过邮件方式将您的问题反馈给我们,我们的邮箱是:hcicloud_support@hcicloud.com 2)论坛反馈:您可以通过开发者社区论坛将您的问题反馈给我们。 3)Q Q反馈: 您可以通过QQ方式将您的问题反馈给我们,我们的QQ是:759092460、2656830781 4)电话反馈:您可以通过电话方式将您的问题反馈给我们,我们的电话是:010-82826886 5)商务沟通:如果您需要对灵云服务进行更进一步的定制和扩展,请联系我们,联系方式:010-82826886
|