ElevenLabs は 2026 年 3 月 11 日に Scribe v2 を発表しました。公式リリースによると、新バージョンは 99 言語での文字起こし精度を向上させ、98% の話者ラベル精度を実現し、ターンレベルのタイムスタンプを改善、ライブ API を 57 言語に拡張し、価格を 40% 削減しています。
要約:Scribe v2 が重要な理由
Scribe v2 は小幅な更新ではなく、字幕やトランスクリプトに依存する映像・音声制作ワークフロー向けの実質的なアップデートです。
公式リリースの主な改善点:
- 多言語文字起こし精度の向上
- 話者ラベリングの強化
- ターンレベルタイムスタンプの改善
- ライブ API の拡張
- 価格の引き下げ
字幕、トランスクリプト、会議録、ポッドキャスト、音声検索ワークフローを構築するチームに関連します。
関連記事: AI ボイスジェネレーター を確認、AI ミュージックジェネレーター でオーディオワークフローを比較、または Suno Studio 1.2 ガイド 2026 を参照。
2026 年 3 月 11 日のリリース内容
公式 Scribe v2 リリースの内容:
- 99 言語でのより高い精度
- 98% の話者ラベル精度
- 改善されたターンレベルタイムスタンプ
- 40% の価格引き下げ
- ライブ API が 57 言語に対応
ElevenLabs は FLEURS や Common Voice などのベンチマークとの比較も示しており、マーケティングではなく測定可能な品質向上を目指していることが分かります。
Scribe v2 の最適なユースケース
長尺動画の字幕制作
インタビュー、ウェビナー、ポッドキャストの編集では、タイムスタンプと話者ラベルの精度が重要です。
マルチスピーカーのトランスクリプト
話者分離の改善により、編集、顧客調査、検索可能なアーカイブのために話者を明確に区分する必要がある場面で役立ちます。
ライブ音声・字幕ワークフロー
拡張されたライブ API は、より多くの言語でリアルタイムに近い文字起こしが必要なプロダクトに有用です。
Scribe v2 の使い方
- バッチかライブかを最初に決める - 録音済みメディアにはバッチ、リアルタイム字幕にはライブ API
- 最もクリアな音声から始める - 精度は向上したが、ソース品質は依然として重要
- 公開前に話者ターンを確認 - 話者ラベリングの改善は Scribe v2 を使う最大の理由
- トランスクリプトを編集ワークフローに組み込む - 字幕、クリッピング、検索、アーカイブに活用
実用的なユースケース
- ポッドキャスト・インタビュー編集: タイムスタンプと話者区分の改善で、生の会話から字幕やクリップへの加工時間を短縮
- 顧客通話分析: 話者分離の精度向上でサポート、営業、調査向けの検索可能なトランスクリプトを実現
- 多言語字幕パイプライン: ライブ API 拡張と多言語改善により、複数市場に対応
Scribe v2 で代替できないもの
Scribe v2 は音声生成、吹き替え翻訳レビュー、編集判断の代替にはなりません。より強力な文字起こし・話者分離レイヤーであり、すべての音声制作タスクの代替ではありません。
FAQ
Scribe v2 で何が変わりましたか?
99 言語での文字起こし精度向上、98% の話者ラベル精度、ターンレベルタイムスタンプの改善、ライブ API の 57 言語対応、40% の価格引き下げが含まれます。
Scribe v2 は話者分離を改善しましたか?
はい。公式リリースでは 98% の話者ラベル精度が強調されています。
ライブ API は何言語に対応していますか?
ElevenLabs によると、ライブ API は現在 57 言語に対応しています。
Scribe v2 は以前より安くなりましたか?
はい。ElevenLabs は Scribe v2 が以前のバージョンより 40% 安いとしています。
公式ソース
- ElevenLabs リリース: Scribe v2: fast, accurate and 40% more affordable
- ElevenLabs ドキュメント: Speech to Text
ワークフローで ElevenLabs を活用
- 音声ツールを比較: AI ボイスジェネレーター
- オーディオを広い制作に統合: AI ミュージックジェネレーター
- 関連ワークフロー更新: Suno Studio 1.2 ガイド 2026

