博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python制作属于自己的有声小说
阅读量:2070 次
发布时间:2019-04-29

本文共 4372 字,大约阅读时间需要 14 分钟。

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者:merlin&

PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取


操作环境

  • Python版本: anaconda3 python3.7.4
  • 操作系统: Ubuntu19.10
  • 编译器: pycharm社区版
  • 用到的模块: pyttsx3,requests

pysstx3模块介绍

pyttsx3(Text to Speech)是一个语音转换模块,它可以在离线的环境下工作,支持多个引擎,而且兼容于Python2和Python3.

  • 首先下载pyttsx3模块
pip install pyttsx3

(Windows系统)若你没有安装pywin32模块,则还需安装此模块作为pyttsx3模块的依赖

安装pywin32

pip install pywin32

这个模块很奇怪,下载的过程中经常会报错,试了几台电脑和不同操作系统的结果也是一样,在检查网络和其他因素无误后多试几次就可以成功安装此模块.

安装成功提示如下图

在这里插入图片描述
注意:这个模块运行必须在python3.7.4版本及以下才可以运行,否则会由于版本过高报错

如果不知道自己的Python版本是多少,可以再终端输入,输出的第一行就是目前使用的Python版本号

  • 测试pyttsx3库

根据官网给出的简单示范,我们可以测试一下是否可以使用本模块

测试代码:

import pyttsx3engine = pyttsx3.init()engine.say("I will speak this text")engine.runAndWait()

若可以听到一个男声快速的说了一遍我们引用的句子,则证明本模块安装已经成功

  • 自定义修改朗读的语调、音色等参数

也是参照官方文档,将这些参数调整成一个比较舒服的状态

import pyttsx3engine = pyttsx3.init() # 创建对象""" 语速 """rate = engine.getProperty('rate')   # 获取当前语速(默认值)print (rate)                        # 打印当前语速(默认值)engine.setProperty('rate', 175)     # 设置一个新的语速"""音量"""volume = engine.getProperty('volume')   # 获取当前的音量 (默认值)(min=0 and max=1)print (volume)                          # 打印当前音量(默认值)engine.setProperty('volume',1.0)    # 设置一个新的音量(0 < volume < 1)"""音色"""voices = engine.getProperty('voices')       # 获取当前的音色信息engine.setProperty('voice', voices[0].id)  # 改变中括号中的值,0为男性,1为女性engine.say("Hello World!")engine.runAndWait()engine.stop()

在Windows系统中,这一段代码已经可以通过pyttsx3模块说出中文了,但是在Linux操作系统中,还需要修改一个参数

engine.setProperty('voice','zh')             //将音色中修改音色的语句替换

开始制作有声小说

通过刚才对pyttsx模块的讲解,我们已经可以了解到该模块的基本原理以及各个参数所代表的含义,接下来我们就以pyttsx3模块为基础构建一个简单的有声小说.

  • 基本思路

使用爬虫requests模块将小说文本从从网上下载到本地,并将内容保存在一个文本文件中,然后打开文本文件,调用pyttsx3模块对文字进行识别,并朗读出来.

  • 操作步骤

首先找到一个小说网站(我选择的是新笔趣阁小说网 因为这个网站没有设置反爬机制 比较适合我们练手)

然后随便找到一个小说,进入它的目录页,借助谷歌浏览器的插件xpath helper利用xpath语法提取到每一章小说

在这里插入图片描述
点进小说的内容页,同样利用插件提取到内容
在这里插入图片描述
然后就可以开始构建爬取小说的代码了
为了节省时间,我先简单的爬取一个章节

import requestsfrom lxml import etreedef main():    #小说的详情页    url = 'http://www.xbiquge.la/10/10489/'    #请求内容    response = requests.get(url).text    #转化成xpath语法可以提取的形式    html = etree.HTML(response)    #提取小说内容页的网址    data = html.xpath("//div[@class='box_con'][2]/div[@id='list']/dl/dd/a/@href")    #为了节省时间,先只提取一个章节的内容    sound = data[1]    #构造小说内容页的网址    new_url = 'http://www.xbiquge.la' + str(sound)    #请求    response_1 = requests.get(new_url).content    html_1 = etree.HTML(response_1)    data_1 = html_1.xpath("//div[@id='content']/text()")    #用replace方法将提取到文本中的\xa0替换掉    noval = str(data_1).replace('\\xa0', '')    #替换掉\r    noval_1 = noval.replace("\\r',", '')    #将爬取到的小说内容存储到文本文件中    with open('xiaoshuo.txt','w') as f:        f.write(noval_1)if __name__ == '__main__':     main()

运行完成之后,就可以发现当前文件夹下多出了一个名为xiaoshuo.txt的文件,这就是我们爬取到的小说内容

  • 导入有声阅读模块
def say(filename='xiaoshuo.txt'):    with open(filename, 'r') as f:        line = f.read()        engine = pyttsx3.init()        engine.setProperty('volume',1.0)        engine.setProperty('rate', 175)        engine.setProperty('voice', 'zh')        engine.say(line)        engine.runAndWait()

最后再设置一个可以选择章节的接口传入主函数,运行程序即可听到有声小说的内容

完整代码

import requestsfrom lxml import etreeimport pyttsx3===========================||python学习群:695185429 ||===========================def main(a):    #小说的详情页    url = 'http://www.xbiquge.la/10/10489/'    #请求内容    response = requests.get(url).text    #转化成xpath语法可以提取的形式    html = etree.HTML(response)    #提取小说内容页的网址    data = html.xpath("//div[@class='box_con'][2]/div[@id='list']/dl/dd/a/@href")    #为了节省时间,先只提取一个章节的内容    sound = data[int(a)]    #构造小说内容页的网址    new_url = 'http://www.xbiquge.la' + str(sound)    #请求    response_1 = requests.get(new_url).content    html_1 = etree.HTML(response_1)    data_1 = html_1.xpath("//div[@id='content']/text()")    #用replace方法将提取到文本中的\xa0替换掉    noval = str(data_1).replace('\\xa0', '')    #替换掉\r    noval_0 = noval.replace("\\r',", '')    noval_1 = noval_0.replace('[', '')    #将爬取到的小说内容存储到文本文件中    with open('xiaoshuo.txt','w') as f:        f.write(noval_1)def say(filename='xiaoshuo.txt'):    with open(filename, 'r') as f:        line = f.read()        engine = pyttsx3.init()        engine.setProperty('volume',1.0)        engine.setProperty('rate', 175)        engine.setProperty('voice', 'zh')        engine.say(line)        engine.runAndWait()if __name__ == '__main__':    a = input('输入想要朗读的章节(数字):')    main(a)    say()

等你运行完这个程序,你就会发现机器人的声音实在是太难听了.如果想要做更加清晰的有声小说,可以调用百度人工智能的api接口来实现这个功能

转载地址:http://fwnmf.baihongyu.com/

你可能感兴趣的文章
一文了解强化学习
查看>>
CART 分类与回归树
查看>>
seq2seq 的 keras 实现
查看>>
seq2seq 入门
查看>>
什么是 Dropout
查看>>
用 LSTM 做时间序列预测的一个小例子
查看>>
用 LSTM 来做一个分类小问题
查看>>
详解 LSTM
查看>>
按时间轴简述九大卷积神经网络
查看>>
详解循环神经网络(Recurrent Neural Network)
查看>>
为什么要用交叉验证
查看>>
用学习曲线 learning curve 来判别过拟合问题
查看>>
用验证曲线 validation curve 选择超参数
查看>>
用 Grid Search 对 SVM 进行调参
查看>>
用 Pipeline 将训练集参数重复应用到测试集
查看>>
PCA 的数学原理和可视化效果
查看>>
机器学习中常用评估指标汇总
查看>>
什么是 ROC AUC
查看>>
Bagging 简述
查看>>
详解 Stacking 的 python 实现
查看>>