音声データに関するメモ

Sound of Text

英語、日本語、中国語はじめ、さまざまな言語の音声を入力したテキストから合成してMP3ファイルでダウンロードできるWebサイト。ちなみに音声合成Google翻訳APIを利用しているようだ。


ffmpeg

ffmpegは、さまざまなフォーマットの動画や音声を変換できるフリーソフトウェアUnix系OS発祥だが、Windowsでも動作する。CUIのためバッチ処理ができるので、大量の音声ファイルを変換するのに便利。

Windowsでの利用
  1. 本家サイトにアクセス
  2. [Download]→[Windowsらしきアイコン]→[Windows Builds]をクリック
  3. 配布ページに飛ばされるので、[Windows 64-bit]または[Windows 32-bit]の[Static]版を選んでダウンロード
  4. 解凍すればbinフォルダの下に実行ファイル ffmpeg.exe がある。(単体で動作可能)


使い方

例えば、hoge.mp3 というMP3形式の音声ファイルを、11.025kHz・16ビット・モノラルのWAV形式ファイル hoge.wav に変換するには下記のコマンドを実行する。

ffmpeg -i "hoge.mp3" -vn -ac 1 -ar 11025 -acodec pcm_s16le -f wav "hoge.wav"



オプションの意味は以下の通り。

-i <ファイル名>
入力ファイル
-vn
映像無しで出力
-ac <チャンネル数>
音声のチャンネル数を指定
-ar <レート>
音声のサンプリングレートを指定
-acodec <コーデック>
音声コーデックを指定
-f <フォーマット>
強制的に指定したフォーマットで出力