c语言编程笔录

您现在的位置是:首页 > 编程 > 编程经验

编程经验

Python语音合成库的介绍及使用

傅智翔 2023-09-10编程经验
Python语音合成库Python是一种高级编程语言,开发人员使用Python通过调用各种库开发各种应用程序。语音合成库是一种Python库,允许开发人员将文本合成为语音。在本文中,

Python语音合成库

Python是一种高级编程语言,开发人员使用Python通过调用各种库开发各种应用程序。语音合成库是一种Python库,允许开发人员将文本合成为语音。 在本文中,我们将探讨几个主要的Python语音合成库。

gTTS

gTTS是一种Python TTS(文本到语音)库。 其中gTTS支持的语言很多,基本上是全球的主流语言,使用步骤如下:

    !pip install gTTS
    from gtts import gTTS 
    import os 
    tts=gTTS(text='hello world', lang='en') 
    tts.save("hello.mp3") 
    os.system("mpg321 hello.mp3")

pyttsx3

pyttsx3是Python的文本到语音库。 其支持Python3 ,可观察EPub书籍等几十种语言,使用步骤如下:

 
    !pip install pyttsx3 
    import pyttsx3
    engine=pyttsx3.init()
    engine.say("hello world")
    engine.runAndWait() 
  

Google Cloud Text-to-Speech

Google Cloud Text-to-Speech如其名称,是一个云服务,可以将文本转换为可针对人类耳朵的自然音频。Google Text-to-Speech带有客户端库,识别40种语言,支持多种音频格式,使用如下:

 
    !pip install google-cloud-texttospeech 
    from google.oauth2 import service_account
    from google.cloud import texttospeech
    svc_acct=service_account.Credentials.from_service_account_file('your_gcp_service_account.json')
    client=texttospeech.TextToSpeechClient(credentials=svc_acct)
    synthesis_input=texttospeech.SynthesisInput(text="hello world")
    voice=texttospeech.VoiceSelectionParams(
        language_code="en-US", ssml_gender=texttospeech.SsmlVoiceGender.NEUTRAL
    )
    audio_config=texttospeech.AudioConfig(
        audio_encoding=texttospeech.AudioEncoding.MP3
    )
    response=client.synthesize_speech(
        input=synthesis_input, voice=voice, audio_config=audio_config
    )
    with open("output.mp3", "wb") as out:
        out.write(response.audio_content)

    os.system("mpg321 output.mp3")

Summary

在Python中,我们可以使用gTTS,pyttsx3以及Google Text-to-Speech等库来生成语音。在上面的示例中,这三种库都需要从库的名称为“text”的模块中引入Python库。gTTS是一种简单易用的Python库,不需要任何API密钥或其他身份验证。Ptytsx3是另一种出色的Python库,它通过多种语音引擎支持多种语言,允许程序员对其配置进行更多的控制。Google Text-to-Speech虽然需要注册并使用API密钥,但它提供更先进的TTS功能及支持的语音范围。

文章评论