我发现使用win32com调用TTS只有三四行代码就行了;
import win32com.client

s='hello'

speaker = win32com.client.Dispatch('SAPI.SpVoice')

speaker.Speak(s)