PodVoice Audio logo

PodVoice Audio

by No BaltoGitHubWebsiteUpdated Jun 23, 2026

日本語の音声をアップロードして会話で編集。文字起こし・話者分離・字幕(SRT/VTT)・切り抜き・整音・BGMまで一気通貫。日本語特化AmiVoice採用。日本語学習の教材づくりにも。 EN: Edit Japanese audio just by chatting — transcription, speaker diarization, subtitles (SRT/VTT), highlight clips, cleanup & BGM. Powered by AmiVoice (Japanese ASR). Also great for Japanese learners.

audio
transcription
editing
+3
|

How to pay

Subscribe

Monthly billing

$9/month

Predictable monthly cost with included usage. Best for steady, high-volume traffic.

  • Unlimited tools within plan limits
  • One API key, billed once a month
  • Cancel any time

PodVoice Audio は、日本語の音声編集を“まるごとAIに任せる”ためのMCPサーバーです。 ローカルの音声をアップロードして「ノイズを消して」「話者ごとに字幕にして」「盛り上がりを切り抜いて」と会話するだけで、文字起こし・話者分離・字幕(SRT/VTT)・切り抜き・ノイズ/無音除去・正規化・ボイスチェンジ・BGM追加までを一気通貫で行えます。

認識エンジンは日本語特化の AmiVoice を採用。固有名詞・話し言葉・カタカナ語に強く、対談やポッドキャスト、複数人収録の文字起こしでも崩れにくいのが特長です。各処理は結果URLを返し、AIが「現在の作業ファイル」を引き継いで次の処理へ——だから、クラウド処理なのに“手元のエディタで1ファイルをいじっている”ような感覚で編集が進みます。

日本語学習にも便利です。ネイティブ音声を文字起こしして一語ずつ追ったり、自分の発話を文字起こしして「どれだけ正しく認識されるか」を確認する——リスニング/スピーキングの気軽な学習ツールとしても使えます。

動画編集者・YouTuber・ポッドキャスターの「収録後の面倒な工程」をまとめて短縮します。 (長時間音声の保存・非破壊マルチトラック編集が必要な方は PodVoice Pro もご利用ください)


PodVoice Audio is an all-in-one MCP for editing Japanese audio — just by talking to it. Upload local audio and say "remove the noise", "subtitle it per speaker", or "clip the highlights", and it runs transcription, speaker diarization, subtitles (SRT/VTT), highlight clipping, noise/silence removal, loudness normalization, voice change and BGM — end to end.

It uses AmiVoice, a Japanese-specialized ASR strong on proper nouns, casual speech and katakana, so transcripts of interviews, podcasts and multi-speaker recordings hold up well. Each step returns a new audio URL and the AI carries the "current working file" forward — so even though it runs in the cloud, it feels like editing a single file on your desktop.

Great for Japanese learners, too: transcribe native audio to follow along word by word, or record yourself speaking Japanese and transcribe it to see how clearly you're recognized — a low-friction way to practice listening and speaking.

(For persistent libraries and non-destructive multi-track projects, see PodVoice Pro: https://www.podvoice.jp)