{{ docItem.name }}
{{ listItem.name }}
{{ listItem.name }}
{{ item.name }}
{{ item }}
>
单词题型详细版
- 该文档是开发者在产品功能集成阶段 使用的单词跟读题型的语音评测技术文档
题型描述
- 对英文单词、词组进行打分,可精确到每个音素的得分。
- 支持自定义发音进行评分;支持音节重音检测;支持英美式发音区分;
- 反馈维度包含单词总分,重音判断,音素得分。
评测请求参数
字段 | 类型 | 可选 | 说明 |
---|---|---|---|
coreType | string | 必选 | en.word.score表示英文单词评测 |
refText | string | 必选 | 评分参考文本,支持单词、词组 自定义发音有两种方式: 1、directory(z:d ih r eh k tr ih) 音标按先声内部音标规范 2、directory(p:dəˈrektəri) 按原始音标指定发音(如果原始音标对应多种标准,处理优先级:IP88 > KK > IP66) 文本符号说明 |
attachAudioUrl | int | 可选 | 评测结果中是否返回音频url 0: 不返回 1: 返回 |
rank | int | 可选 | 评分分制,这个值可以任意设置,最终会根据与100的比例重新计算 |
symbol | int | 可选 | 是否显示标点符号。 可设置0或1。默认值为0,不开启此功能。 如果单词前有多个连续标点,只显示第一个标点;如果单词结尾有多个连续标点,只输出靠近结尾单词最近的三个标点。 |
precision | double | 可选 | 设置打分精度,只支持0.1、0.5或者1,默认值为1(如果设置的值不是0.1或0.5则按1处理) |
typeThres | int | 可选 | 打分松紧度(分数越高影响越小):1表示严格,2表示宽松,3表示非常严格,4非常宽松,0为默认值(不启用此功能) |
phdet | int | 可选 | 音素检错,1表示使用此功能,默认为0,不启动; 只能设置0和1 |
syldet | int | 可选 | 音节检错,1表示使用此功能,默认为0,不启动 只能设置0和1 |
feedback | int | 可选 | 1:表示开启实时反馈功能(实时反馈当前读的音频对应的文本位置信息) 0:默认值(不启用此功能) |
accent | string | 可选 | "accent":"en" 表示指定英式发音评测 "accent":"am" 表示指定美式发音评测 不设置该参数时引擎根据发音情况智能返回英/美式发音 |
参数示例
请求测评参数示例如下:
{
"coreType":"en.word.score",
"refText":"classical",
"attachAudioUrl": 1,
"rank":100,
"precision":0.5
}
返回结果示例
- 返回结果采用JSON结构,参考样例
返回结果说明
键 | 类型 | 说明 | 使用建议 |
---|---|---|---|
recordId | string | 音频文件的唯一标识 | 可供参考 |
tokenId | string | 用户请求的唯一标识 | 可供参考 |
audioUrl | string | 用户音频下载地址: 音频默认保留20天左右,如需长久保存,建议产品方下载至自己的服务器。 域名会因不同访问区域而不同,以实际返回为准。 |
可供参考 |
applicationId | string | 授权账号,先声提供的评测Appkey | 内部参数 |
dtLastResponse | string | 云端响应的时间点 | 内部参数 |
eof | int | 实时反馈标识:0表示返回未结束,后续还有其它的返回结果 1:表示本次评测所有的返回结果 |
内部参数 |
refText | string | 评测文本 | 可供参考 |
params | object | 回显客户端传入的评测请求参数 | |
- app | object | ||
- - applicationId | string | 授权账号,先声提供的评测Appkey | |
- - userId | string | 用户标识 | |
- - timestamp | string | start时间 | |
- - sig | string | 校验码 | |
- request | object | 请求评分的参数设置节点 | |
- audio | object | 请求评分的音频参数设置节点 | |
result | object | 评测结果 | |
- version | string | 引擎的版本,包含发布时间 | 内部参数 |
- rank | int | 评分分制 | 内部参数 |
- precision | float | 评分精度 | 内部参数 |
- res | string | 评测本题型时,使用的资源名称 | 内部参数 |
- forceout | int | 内部参数 | |
- pretime | int | 云端调用Start接口本身耗时,单位ms | 内部参数 |
- systime | int | 评测整个过程的总耗时,单位ms | 内部参数 |
- delaytime | int | 云端从feed音频结束到获取结果的耗时,单位ms | 内部参数 |
- wavetime | int | 音频时长,单位ms | 可供参考 |
- overall | float | 总分 | 建议字段 |
- pron | float | 发音分 | 内部参数 |
- details | array | ||
- - start | int | 单词在音频中的起始时间,单位ms | 可供参考 |
- - end | int | 单词在音频中的结束时间,单位ms | 可供参考 |
- - dur | int | 单词发音时间,单位ms | 可供参考 |
- - char | string | 单词文本 | 可供参考 |
- - score | int | 单词得分 | 可供参考 |
- - fake_pron | int | 单词不在先声词典(集外词),才会输出此字段。如果需要对集外词进行评测,可以通过refText传音标的方式进行评测。 | |
- - accent | string | 英、美式反馈,请求参数中配置accent时不返回此字段,否则返回此字段"accent":"ea" | |
- - dp_type | int | 单词正常朗读(不输出dp type字段)、漏读(1)、重复读(2) 正常:该字段不输出;单词漏读时, dp type:1;重读时,dp_ type:2。 |
|
- - syllable | array | 音节检错 | |
- - - char | string | 音节发音 | 可供参考 |
- - - score | int | 音节发音分(0-100) | 可供参考 |
- - - start | int | 音节在单词中的起始时间,单位ms | 可供参考 |
- - - end | int | 音节在单词中的结束时间,单位ms | 可供参考 |
- - stress | array | 重音发音 | |
- - - char | string | 音素 | 可供参考 |
- - - ref | int | 标识当前音节是否需要重读 1表示需要重读,0不需要重读 | |
- - - score | int | 重音得分(0、1) | |
- - phone | array | 音素级评分结果 详情请参考音素对照表 |
|
- - - char | string | 音素 (当请求参数中设置accent时此字段为标准的英美式音素,否则为内部映射音素) | 可供参考 |
- - - score | int | 音素得分(0-100) | 可供参考 |
- - - phid | int | 音素在单词音标中的位置 只有设置phdet才输出此字段 | |
- - - pherr | int | 检测音素是否有错(0、1) 只有设置phdet才输出此字段 |
|
- - - ph2alpha | string | 当前音素对应的单词中的字母(客户无须通过phid自己计算) 只有设置phdet才输出此字段 |
|
- realtime_details | object | 实时反馈信息 | |
-- char | string | 单词 | 可供参考 |
-- dp_type | int | 0:表示正常读 1:表示漏读或者未读 2:表示重读 |
可供参考 |
- info | object | ||
- - snr | float | 信噪比,值越高越清晰,范围(0~40dB) 此参数影响评分时,会设置相应的tipId值 |
可供参考 |
- - clip | float | 音频声音太高,出现截幅,范围(0~1)。 此参数影响评分时,会设置相应的tipId值 |
内部参数 |
- - volume | int | 录音音量,范围(0~180dB) | 可供参考 |
- - tipId | int | 音频质量 详情请参考tipId字段说明 |
建议字段 |
- 注:返回结果中其它未在上面展示的字段是内部参数,产品层面不需要关注
评测结果建议展现维度
维度 | 说明 | 详细 |
---|---|---|
overall | 单词总分 | 对单词的整体评价 |
score | 发音得分 | 单词准确度得分 |
details.stress.score | 单词重读得分 | 对单词中具体某个重读发音的评价。获取之前要进行非空判断 |
details.phone.score | 音素得分 | 对单词中具体某个音素发音的评价。获取之前要进行非空判断 |
details.dp_type | 单词的增漏读 | 表示单词是否重读/漏读(参考对应题型的返回说明) |
details.fake_pron | 伪造发音 | 表示单词是否在词典中,如果不在词典中,会为单词预测发音 |
评测失败时的返回结果
- 如果返回的评测结果中result结构为空,说明评测失败。
- 通过返回结果可以获取 errId 和 error,产品端可以根据相应错误码做续判断和处理。
错误码
- 错误码参考:语音评测错误码