2019年6月30日日曜日

日本語で利用できる合成音声API

日本語で利用できる合成音声API(主に無料利用分)の一覧です。
アプリケーションから利用できる、テキストを音声に変換するサービス・音声読み上げAPIです。

オープンソース・ソフトウェアを使用するのと比較して、以下のメリットがあります。
  1. APIのほうが、開発・メンテナンス負荷は少ない。
  2. APIのほうが、性能は良い。


■ 無料利用可能な合成音声APIの一覧

Microsoft Azure - Speech Services (Text to Speech)
https://azure.microsoft.com/ja-jp/services/cognitive-services/speech-services/

IBM Watson - Text to Speech
https://www.ibm.com/watson/jp-ja/developercloud/text-to-speech.html

Amazon Polly
https://aws.amazon.com/jp/polly/

Google Cloud Text-to-Speech
https://cloud.google.com/text-to-speech/

docomo Developer support - 音声合成API
https://dev.smt.docomo.ne.jp/?p=docs.api.page&api_name=text_to_speech

合成音声APIの無料利用分について、上限一覧
Microsoft Azure1 か月あたり 5 百万文字まで無料
IBM Watson1 カ月あたり 10,000 文字
Amazon Polly1 か月あたり 500 万文字
Google Cloud1 か月あたり 0~400 万文字
docomo API月間2,000リクエスト(非商用)

これ以外にも、Google Home に接続して喋らせる方法もあり(費用は製品価格のみ)


■ 有料の合成音声API

HOYA VoiceText Web API(法人向け)、80,000円/月
https://voicetext.jp/
無料利用登録あり(有効期限は発行後90日)

株式会社エーアイ 音声合成システムAITalk(法人向け)
https://www.ai-j.jp/about/

Amazon Lex(対話型)
https://aws.amazon.com/jp/lex/