{{ docItem.name }}
{{ listItem.name }}
{{ listItem.name }}
{{ item.name }}
{{ item }}
>
文本符号说明
支持单词内部符号
| 符号 | 例子 | 说明 |
|---|---|---|
| [a-z][A-Z] | good | 支持26个字母(大小写均支持)组成的常用英文单词 |
| - | four-legged | 单词内连字符 |
| ' | don't | 单词内连字符 |
| . | John.Smith | 单词内连字符 |
| : | 18:16 | |
| \@ | -- | 用于邮箱 |
| _ | -- | 单词内连字符 |
支持的单词边界分隔符号
| 符号 | 例子 | 说明 |
|---|---|---|
| , | No, thank you. | 句内分隔符 |
| . | Good morning. Nice to see you. | 句子分隔符 |
| ; | I not only like bread; but also like rice. | 句内分隔符 |
| ? | How old are you? | 句子分隔符 |
| ! | Have a nice day! | 句子分隔符 |
| " | "May I speak to Tom", I said. | 引用符号 |
| @ | My email is mike@sohu.com. | 邮箱地址分隔符,读作“at”,@后面按字母发音来读 |
| . | My email is mike@sohu.com. | 邮箱地址分隔符,读作“dot” |
注:对于词尾的“.”,先根据缩写词列表判断是否是缩写词,不是缩写词,当做分句句号。
支持的数字发音
| 例子 | 对应读法 | 音标 |
|---|---|---|
| 2 | two | tu |
| 56 | fifty six | fifti siks |
| 456 | four hundred fifty six | fɔr hɑndrəd fifti siks |
| 9871 | nine thousand eight hundred seventy one | naɪn θaʊzənd eɪt hɑndrəd sevənti wɑn |
| 1990 | nineteen ninety | naɪntin naɪnti |
| 16792 | sixteen thousand seven hundred ninety two | sɪkstin θaʊzənd sevən hɑndrəd naɪnti tu |
| 1876476 | one million eight hundred seventy-six thousand four hundred seventy-six | wɑn mɪljən eɪt hɑndrəd sevənti siks θaʊzənd four hundred sevənti siks |
| 87th | eighty seven th | eɪti sevənθ |
| 19:40 | nineteen fourty | naɪntin fɔrti |
| 19.21 | nineteen point twenty one | naɪntin pɔɪnt twenti wɑn |
| 1980-3-24 | -- | 建议转换成相应英语发音实词 |
注:数字发音会根据使用场景预测发音,但会有偏差;建议将数字转换成相应英文发音实词。
例如:13288956876 改为: one three two eight…
其他常见符号处理
| 符号 | 说明 | 例子 |
|---|---|---|
| 非UTF-8编码 | 转换成UTF-8编码 | 常见主要是ASCII编码中前128个字符 |
| 其他与发音、停顿或者语速相关的符号 | 替换成上述支持单词边界分割字符,;?!" | |
| 其他与发音、停顿或者语速非相关的符号 | 除全角字母、数字、标点会转化为对应的半角格式,其它的则直接去除,因为不影响口语评分 |
