{{ docItem.name }}
{{ listItem.name }}
{{ listItem.name }}
{{ item.name }}
{{ item }}
>
文本符号说明
支持单词内部符号
符号 | 例子 | 说明 |
---|---|---|
[a-z][A-Z] | good | 支持26个字母(大小写均支持)组成的常用英文单词 |
- | four-legged | 单词内连字符 |
' | don't | 单词内连字符 |
. | John.Smith | 单词内连字符 |
: | 18:16 | |
\@ | -- | 用于邮箱 |
_ | -- | 单词内连字符 |
支持的单词边界分隔符号
符号 | 例子 | 说明 |
---|---|---|
, | No, thank you. | 句内分隔符 |
. | Good morning. Nice to see you. | 句子分隔符 |
; | I not only like bread; but also like rice. | 句内分隔符 |
? | How old are you? | 句子分隔符 |
! | Have a nice day! | 句子分隔符 |
" | "May I speak to Tom", I said. | 引用符号 |
@ | My email is mike@sohu.com. | 邮箱地址分隔符,读作“at”,@后面按字母发音来读 |
. | My email is mike@sohu.com. | 邮箱地址分隔符,读作“dot” |
注:对于词尾的“.”,先根据缩写词列表判断是否是缩写词,不是缩写词,当做分句句号。
支持的数字发音
例子 | 对应读法 | 音标 |
---|---|---|
2 | two | tu |
56 | fifty six | fifti siks |
456 | four hundred fifty six | fɔr hɑndrəd fifti siks |
9871 | nine thousand eight hundred seventy one | naɪn θaʊzənd eɪt hɑndrəd sevənti wɑn |
1990 | nineteen ninety | naɪntin naɪnti |
16792 | sixteen thousand seven hundred ninety two | sɪkstin θaʊzənd sevən hɑndrəd naɪnti tu |
1876476 | one million eight hundred seventy-six thousand four hundred seventy-six | wɑn mɪljən eɪt hɑndrəd sevənti siks θaʊzənd four hundred sevənti siks |
87th | eighty seven th | eɪti sevənθ |
19:40 | nineteen fourty | naɪntin fɔrti |
19.21 | nineteen point twenty one | naɪntin pɔɪnt twenti wɑn |
1980-3-24 | -- | 建议转换成相应英语发音实词 |
注:数字发音会根据使用场景预测发音,但会有偏差;建议将数字转换成相应英文发音实词。
例如:13288956876 改为: one three two eight…
其他常见符号处理
符号 | 说明 | 例子 |
---|---|---|
非UTF-8编码 | 转换成UTF-8编码 | 常见主要是ASCII编码中前128个字符 |
其他与发音、停顿或者语速相关的符号 | 替换成上述支持单词边界分割字符,;?!" | |
其他与发音、停顿或者语速非相关的符号 | 除全角字母、数字、标点会转化为对应的半角格式,其它的则直接去除,因为不影响口语评分 |