微软Edge 微软是干什么用的( 二 )


安装 App 之后,首先点击系统 TTS 设置把首选引擎更改为大声朗读,下面也可以调节语速和音高,还可以点播放进行试听 。
图片


微软Edge 微软是干什么用的

文章插图


然后点击 SSML 语音合成标记语言,可以看到它默认的就是刚才那位女生 Xiaoxiao 的语音 。


微软Edge 微软是干什么用的

文章插图


那什么是 SSML 语音合成标记语言呢?
根据微软官方的解释:
语音合成标记语言 (SSML) 是一种基于 XML 的标记语言,可让开发人员指定如何使用文本转语音服务将输入文本转换为合成语音 。与纯文本相比,SSML 可让开发人员微调音节、发音、语速、音量以及文本转语音输出的其他属性 。SSML 可自动处理正常的停顿(例如,在句号后面暂停片刻),或者在以问号结尾的句子中使用正确的音调 。
图片


微软Edge 微软是干什么用的

文章插图


简单说,有了这个技术,Xiaoxiao 可以用更多的风格,或者说是情感来朗读了 。


微软Edge 微软是干什么用的

文章插图


微软Edge 微软是干什么用的

文章插图


那怎么用呢?比如说,下面的的代码就设置了 Xiaoxiao 生气风格的 AI 语音,把它复制粘贴到前面点开 SSML 语音合成标记语言之后的输入框内点击确定就可以更换风格了 。


微软Edge 微软是干什么用的

文章插图


更换其它风格时把angry换成其它单词就可以了,建议大家一定要试试(撒娇affectionate)这个效果,非常销魂 。
(不过我在实际测试过程中发现以上代码直接复制,有部分手机不生效,来回重复测试了 N 多遍,还是不能解决问题,怀疑问题出在微信对话框换行标记和编辑器的换行标记不一致 。
为了保证大家都能用上,最后找到的办法是把代码存成了 TXT 记事本,在后台回复口令获取,这个确保都能生效,为了搞定这个问题昨晚折腾到了一点钟 。。。)
不过这个只能在你使用 App 中朗读功能时才能用,它并不能改变手机自带的语音引擎,比如说小爱同学 。
比如说,用之前安利的阅读 App 听书时,先在大声阅读 App 中设置不同的朗读风格,然后在阅读 App 朗读时勾选跟随系统就可以了 。


微软Edge 微软是干什么用的

文章插图


至于用哪个就看你喜欢什么风格了,说到这里,我估计你们又会在评论里说「我有一个大胆的想法」,你懂的 。
如此以来,这个应用场景就大大拓宽了,相信有很多小伙伴喜欢听书,不过可不是所有小说都有真人朗读版本,用这个就可以想听啥就有啥 。
结语
本来说到这儿就算完事了,从新 Edge 的大声朗读功能来看,微软的人工语音合成效果已经足够出色了,但这还不算完 。
就拿一位小伙伴的话来说:不管是语调、尾音、口音,甚至说每句话的抑扬顿挫,和普通的人实在太像了 。
我也不多分析了,感受就只一句:俺也一样 。


微软Edge 微软是干什么用的

文章插图


微软Edge 微软是干什么用的

文章插图
【微软Edge 微软是干什么用的】

微软Edge 微软是干什么用的

文章插图


微软Edge 微软是干什么用的

文章插图


感兴趣的可以去看看视频
不过目前这个代号为 F201 的人声目前还没有开放使用,我相信,这其中并不存在技术上的难关,正是因为效果过于逼真,如果开放使用可能会带来意想不到的隐患 。
现在的问题是,球已经踢回给人类了,留给人类代表队的时间真的不多了 。


微软Edge 微软是干什么用的

文章插图