Sound of Text
英語、日本語、中国語はじめ、さまざまな言語の音声を入力したテキストから合成してMP3ファイルでダウンロードできるWebサイト。ちなみに音声合成はGoogle翻訳のAPIを利用しているようだ。
ffmpeg
ffmpegは、さまざまなフォーマットの動画や音声を変換できるフリーソフトウェア。Unix系OS発祥だが、Windowsでも動作する。CUIのためバッチ処理ができるので、大量の音声ファイルを変換するのに便利。
Windowsでの利用
- 本家サイトにアクセス
- [Download]→[Windowsらしきアイコン]→[Windows Builds]をクリック
- 配布ページに飛ばされるので、[Windows 64-bit]または[Windows 32-bit]の[Static]版を選んでダウンロード
- 解凍すればbinフォルダの下に実行ファイル ffmpeg.exe がある。(単体で動作可能)
使い方
例えば、hoge.mp3 というMP3形式の音声ファイルを、11.025kHz・16ビット・モノラルのWAV形式ファイル hoge.wav に変換するには下記のコマンドを実行する。
ffmpeg -i "hoge.mp3" -vn -ac 1 -ar 11025 -acodec pcm_s16le -f wav "hoge.wav"
オプションの意味は以下の通り。
- -i <ファイル名>
- 入力ファイル
- -vn
- 映像無しで出力
- -ac <チャンネル数>
- 音声のチャンネル数を指定
- -ar <レート>
- 音声のサンプリングレートを指定
- -acodec <コーデック>
- 音声コーデックを指定
- -f <フォーマット>
- 強制的に指定したフォーマットで出力