马黑黑 发表于 2022-6-27 07:40

TTS:选哪读哪

本帖最后由 马黑黑 于 2022-6-27 07:57 编辑 <br /><br /><style>
.mama { margin: auto; width: 720px; }
.mama p, .mama h2 { margin: 0; padding: 6px 0; }
#shutbtn { position: fixed; top: 50%; left: 20%; outline: none; color: red; }
#shutbtn:hover { color: blue; cursor: pointer; }
</style>

<div class="mama">
        <h2>TTS朗读被选中的文本</h2>
        <input id="shutbtn" type="button" value="关闭" />
        <p>鼠标或键盘选中本页任何地方的文本,如果Windows自带的TTS引擎正常,选中的文本会被系统默认的合成语音朗读。可以通过左边的按钮关闭。</p>
</div>

<script>

let synth = window.speechSynthesis,
        speech = new SpeechSynthesisUtterance();
let shut = document.querySelector('#shutbtn');

shutbtn.onclick = () => {
        synth.cancel(speech);
        window.getSelection().removeAllRanges();
}

document.addEventListener("mouseup", readSelected);

document.addEventListener("keyup", (e) => {
        if(e.ctrlKey && e.keyCode==65) readSelected();
});

//speech.addEventListener('end', () => window.getSelection().removeAllRanges());

//朗读被选中的文本
function readSelected() {
        speech.text = document.getSelection().toString();
        synth.speak(speech);
}
</script>

马黑黑 发表于 2022-6-27 07:48

如果动作太快,TTS还没有读完就选择了下一个文本段,TTS会将选择的内容加入到下一个朗读序列。记住,任何时候,左边都有一个关闭按钮跟着,需要中断朗读时,点击它便可。不过关闭按钮在论坛里有时候会失灵。

本测试支持对快速回复编辑框(含弹出框)的监测朗读,还支持 CTR+A 全选的朗读,可以在编辑回复时试一试

马黑黑 发表于 2022-6-27 07:52

吃葡萄不吐葡萄皮 TTS能准确朗读,但像下面这样的语句,TTS怎么读:{:5_117:}

一行行行行行不行也行
一行不行行行不行行也不行

马黑黑 发表于 2022-6-27 07:53

还有《施氏食狮史》:

石室诗士施氏,嗜狮,誓食十狮。施氏时时适市视狮。十时,适十狮适市。是时,适施氏适市。施氏视是十狮,恃矢势,使是十狮逝世。氏拾是十狮尸,适石室。石室湿,氏使侍拭石室。石室拭,施氏始试食是十狮尸。食时,始识是十狮尸,实十石狮尸。试释是事。

红影 发表于 2022-6-27 08:59

马黑黑 发表于 2022-6-27 07:52
吃葡萄不吐葡萄皮 TTS能准确朗读,但像下面这样的语句,TTS怎么读:

一行行行行行不行也行


哈哈,黑黑调皮了{:4_189:}

红影 发表于 2022-6-27 09:01

马黑黑 发表于 2022-6-27 07:53
还有《施氏食狮史》:

石室诗士施氏,嗜狮,誓食十狮。施氏时时适市视狮。十时,适十狮适市。是时,适施 ...

这个TTS倒是读得极好,特别准确呢。

红影 发表于 2022-6-27 09:01

试了一下,这个不管标点符号,只要选中,就会被朗读。

马黑黑 发表于 2022-6-27 12:23

红影 发表于 2022-6-27 08:59
哈哈,黑黑调皮了

TTS分两个步骤工作:

步骤一:分析文本;
步骤二:将分析结果变成语音。

现在的TTS,第一个步骤一直没办法弄的完美。

马黑黑 发表于 2022-6-27 12:25

红影 发表于 2022-6-27 09:01
这个TTS倒是读得极好,特别准确呢。

对。它对单音字的读音没问题,对多音字就不一定行,依据上下文判断读音还不够准确。

红影 发表于 2022-6-27 20:50

马黑黑 发表于 2022-6-27 12:23
TTS分两个步骤工作:

步骤一:分析文本;


我听着跟天书似的,完全不懂{:4_173:}

红影 发表于 2022-6-27 20:51

马黑黑 发表于 2022-6-27 12:25
对。它对单音字的读音没问题,对多音字就不一定行,依据上下文判断读音还不够准确。

能够读汉语,已经非常厉害了呢。

马黑黑 发表于 2022-6-27 21:45

红影 发表于 2022-6-27 20:51
能够读汉语,已经非常厉害了呢。

所有Windows支持的语言都能读

马黑黑 发表于 2022-6-27 21:46

红影 发表于 2022-6-27 20:50
我听着跟天书似的,完全不懂

没关系,你可能对人工语音合成有所了解,但不一定知道内在原理

红影 发表于 2022-6-28 16:57

马黑黑 发表于 2022-6-27 21:45
所有Windows支持的语言都能读

那可真不错,可以弄段外语,跟着学发音了{:4_173:}

红影 发表于 2022-6-28 16:58

马黑黑 发表于 2022-6-27 21:46
没关系,你可能对人工语音合成有所了解,但不一定知道内在原理

是啊,完全不懂的。

马黑黑 发表于 2022-6-28 18:18

红影 发表于 2022-6-28 16:58
是啊,完全不懂的。

好的人工合成语音,会录制母音,有时候会采集10多个钟头的录音,然后对母音进行分析,再合成。这样的TTS会比较像真人的说话声。

马黑黑 发表于 2022-6-28 18:18

红影 发表于 2022-6-28 16:57
那可真不错,可以弄段外语,跟着学发音了

完全可以,不过要当心今后口音像是机器人的

红影 发表于 2022-6-28 21:18

马黑黑 发表于 2022-6-28 18:18
好的人工合成语音,会录制母音,有时候会采集10多个钟头的录音,然后对母音进行分析,再合成。这样的TTS ...

还可以这样啊,太厉害了吧。

红影 发表于 2022-6-28 21:18

马黑黑 发表于 2022-6-28 18:18
完全可以,不过要当心今后口音像是机器人的

哈哈,黑黑说得太有趣了{:4_170:}

马黑黑 发表于 2022-6-28 21:19

红影 发表于 2022-6-28 21:18
还可以这样啊,太厉害了吧。

不断进步的。有的逼真都和真人一样,比如银行用的机器人的合成语音,很多人都怀疑背后有人控制(包括语音、反应能力等)
页: [1] 2 3 4
查看完整版本: TTS:选哪读哪