# 付録B　ベンダー比較マトリクス

各言語サービスAPIベンダーを評価軸ごとに比較します。情報は2026年4月時点のものです。価格・機能は変更される可能性があるため、最新情報は各ベンダーの公式ドキュメントで確認してください。

***

## B.1 テキスト翻訳ベンダー比較

### 主要5ベンダーの概要

| ベンダー                     | 提供元                     | 特徴                          |
| ------------------------ | ----------------------- | --------------------------- |
| DeepL                    | DeepL SE（ドイツ）           | 高品質な翻訳で定評。ヨーロッパ言語に特に強い      |
| Google Cloud Translation | Google（米国）              | 対応言語数が最多。Google翻訳APIの上位版    |
| AWS Translate            | Amazon Web Services（米国） | AWSエコシステムとの親和性が高い           |
| Azure Translator         | Microsoft（米国）           | Azureサービスとの統合が容易。Officeとの連携 |
| ModernMT                 | ModernMT（イタリア）          | 文脈適応型MT。翻訳メモリとのリアルタイム学習     |

***

### 詳細比較マトリクス

| 評価軸              | DeepL               | Google Cloud Translation   | AWS Translate   | Azure Translator           | ModernMT        |
| ---------------- | ------------------- | -------------------------- | --------------- | -------------------------- | --------------- |
| **対応言語数**        | 約30言語               | 約135言語                     | 約75言語           | 約130言語                     | 約200言語（パートナー含む） |
| **日本語品質**        | ◎ 非常に高い             | ○ 良好                       | △ 普通            | ○ 良好                       | ○ コンテキスト適応で向上   |
| **カスタム用語集**      | ○ あり（APIで管理）        | ○ あり（AutoML/Glossary）      | ○ あり（カスタム用語）    | ○ あり（Custom Translator）    | ◎ リアルタイムTMで自動適応 |
| **ドキュメント翻訳**     | ○ Pro以上（DOCX/PPTX等） | ○ あり（Document Translation） | ○ あり（非同期ジョブ）    | ○ あり（Document Translation） | △ API連携で対応      |
| **非同期対応**        | △ Pro以上で一部対応        | ○ バッチAPIあり                 | ◎ 非同期ジョブネイティブ対応 | ○ バッチドキュメントAPI             | ○ あり            |
| **無料枠**          | 500,000文字/月（Free）   | 500,000文字/月（90日間）          | 200万文字/月（12ヶ月）  | 200万文字/月（常時）               | 要確認             |
| **価格帯（/100万文字）** | $25（Pro）            | $20（Advanced）              | $15             | $10                        | $18〜            |
| **API仕様の充実度**    | ○ OpenAPI準拠、SDKあり   | ◎ 充実、多言語SDK                | ○ AWS SDK経由     | ○ OpenAPI提供                | ○ RESTful、SDK提供 |

> **注意:** 価格は参考値です。実際の価格は利用量・契約形態・地域によって異なります。

***

### 評価軸の補足説明

#### 日本語品質評価基準

| 記号 | 意味                |
| -- | ----------------- |
| ◎  | 非常に高い（人間翻訳に近い自然さ） |
| ○  | 良好（実用レベル）         |
| △  | 普通（改善の余地あり）       |
| ×  | 不十分（実用困難）         |

#### 用語集（Glossary）の重要性

専門用語を含む文書の翻訳では、用語集機能が品質に大きく影響します：

```
例: 「システムの初期化」
  用語集なし: "System initialization"（正確だが社内用語と違う）
  用語集あり: "System setup"（社内用語に統一）
```

***

### ベンダー選定の目安

| ユースケース         | 推奨ベンダー           | 理由                  |
| -------------- | ---------------- | ------------------- |
| 日本語⇔欧州言語の高品質翻訳 | DeepL            | 日欧言語ペアで最高品質         |
| 多言語展開（100言語以上） | Google または Azure | 対応言語数が最多            |
| AWSインフラ統合      | AWS Translate    | IAM認証・同一VPC等の利点     |
| Azureインフラ統合    | Azure Translator | Active Directory連携等 |
| TMとのリアルタイム適応   | ModernMT         | 翻訳メモリとの動的連携         |
| コスト最優先（大量バッチ）  | Azure Translator | 最安値水準               |

***

## B.2 STTベンダー比較

### STT（音声認識）とは

音声ファイルまたはリアルタイム音声入力をテキストに変換するサービスです。主な用途：字幕生成、議事録作成、音声検索、通話分析。

***

### 主要6ベンダーの概要

| ベンダー                  | 提供元                     | 特徴                          |
| --------------------- | ----------------------- | --------------------------- |
| OpenAI Whisper        | OpenAI（米国）              | 高精度・多言語。オープンソース版あり          |
| Google Speech-to-Text | Google（米国）              | リアルタイム精度が高い。Google Meet等に実績 |
| AWS Transcribe        | Amazon Web Services（米国） | AWSエコシステム統合。医療・コールセンター特化版あり |
| Azure Speech          | Microsoft（米国）           | カスタム音響モデル対応                 |
| AssemblyAI            | AssemblyAI（米国）          | 分析機能（感情・トピック等）が充実           |
| Deepgram              | Deepgram（米国）            | リアルタイム低レイテンシが強み             |

***

### 詳細比較マトリクス

| 評価軸                           | OpenAI Whisper     | Google STT              | AWS Transcribe  | Azure Speech   | AssemblyAI    | Deepgram   |
| ----------------------------- | ------------------ | ----------------------- | --------------- | -------------- | ------------- | ---------- |
| **リアルタイム対応**                  | △ APIは非推奨          | ◎                       | ◎               | ◎              | ○             | ◎ 低レイテンシ特化 |
| **話者分離（Speaker Diarization）** | × なし               | ○ あり                    | ○ あり            | ○ あり           | ◎ 精度高い        | ○ あり       |
| **日本語精度**                     | ○ 良好               | ○ 良好                    | △ 普通            | ○ 良好           | △ 普通          | △ 普通       |
| **カスタム語彙**                    | × なし（OSS版は可）       | ○ あり                    | ○ カスタム語彙        | ○ カスタムモデル      | ○ あり          | ○ あり       |
| **価格帯（/分）**                   | $0.006             | $0.016〜                 | $0.024          | $0.016〜        | $0.012〜       | $0.008〜    |
| **特記事項**                      | 多言語99言語対応、バッチ処理に最適 | Google Meet・Workspace連携 | 医療・コールセンター特化版あり | Office 365との統合 | 感情分析・要約等の高度分析 | エッジデプロイ対応  |

***

### STTベンダー選定の目安

| ユースケース         | 推奨ベンダー              | 理由              |
| -------------- | ------------------- | --------------- |
| 会議議事録（日本語）     | Google または Azure    | 日本語精度と話者分離のバランス |
| リアルタイム字幕       | Deepgram または Google | 低レイテンシ          |
| コールセンター分析      | AssemblyAI または AWS  | 話者分離＋感情分析       |
| 大量音声バッチ処理      | OpenAI Whisper      | コスト効率           |
| AWSインフラ内処理     | AWS Transcribe      | 同一VPC・IAM認証     |
| 音声オートメーション（英語） | Deepgram            | 低コスト・高速         |

***

### 話者分離（Speaker Diarization）について

会議録音など複数人が話す音声を処理する場合、「誰がいつ話したか」を識別する機能が重要です：

```
話者分離なし:
  "おはようございます。本日の議題ですが..."

話者分離あり:
  [Speaker A 00:00:00] おはようございます。
  [Speaker B 00:00:05] 本日の議題ですが...
```

***

## B.3 TTSベンダー比較

### TTS（音声合成）とは

テキストを音声に変換するサービスです。主な用途：音声ナレーション、ポッドキャスト自動生成、アクセシビリティ（読み上げ）、音声アシスタント。

***

### 主要5ベンダーの概要

| ベンダー                  | 提供元                     | 特徴                     |
| --------------------- | ----------------------- | ---------------------- |
| ElevenLabs            | ElevenLabs（米国）          | 自然さ・感情表現で業界最高水準        |
| Google Text-to-Speech | Google（米国）              | WaveNet/Neural2モデルで高品質 |
| AWS Polly             | Amazon Web Services（米国） | 多数の音声・言語対応、低価格         |
| Azure Text-to-Speech  | Microsoft（米国）           | SSML対応が充実、感情・スタイル設定可   |
| OpenAI TTS            | OpenAI（米国）              | シンプルなAPI設計、6種類の音声      |

***

### 詳細比較マトリクス

| 評価軸              | ElevenLabs      | Google TTS               | AWS Polly     | Azure TTS          | OpenAI TTS  |
| ---------------- | --------------- | ------------------------ | ------------- | ------------------ | ----------- |
| **音声の自然さ**       | ◎ 業界最高水準        | ○ 良好（Neural2）            | △〜○ 音声による     | ○ 良好               | ○ 良好        |
| **日本語対応**        | ○ 対応（英語比やや劣る）   | ○ 良好                     | ○ 良好          | ◎ 豊富な日本語音声         | ○ 対応        |
| **感情・スタイル制御**    | ◎ 詳細な感情・速度・音程制御 | △ 限定的                    | △ 音声スタイル限定    | ◎ SSML＋スタイル制御      | △ 速度のみ      |
| **音声クローン**       | ◎ カスタム音声作成（有料）  | × なし                     | × なし          | △ カスタムニューラル音声（要申請） | × なし        |
| **価格帯（/100万文字）** | $30〜（Starter以上） | $16（Neural2）             | $4〜$16        | $15（Neural）        | $15         |
| **特記事項**         | 最高音質、クリエイター向け   | WaveNet/Neural2/Chirp選択可 | ニュース・会話スタイルあり | SSMLによる細かい制御       | シンプルAPI、6声種 |

***

### TTSベンダー選定の目安

| ユースケース             | 推奨ベンダー               | 理由              |
| ------------------ | -------------------- | --------------- |
| ポッドキャスト・ナレーション（英語） | ElevenLabs           | 最高音質・感情表現       |
| 日本語ナレーション          | Azure TTS            | 豊富な日本語音声・SSML対応 |
| 大量テキスト読み上げ（コスト重視）  | AWS Polly            | 最安値水準           |
| アプリ内音声UI（多言語）      | Google TTS または Azure | 多言語・APIの安定性     |
| 独自音声を作りたい          | ElevenLabs           | 音声クローン機能        |
| シンプル実装（OpenAI統合）   | OpenAI TTS           | 同一API体系         |

***

### SSML（Speech Synthesis Markup Language）について

TTSの細かい制御には **SSML** を使います：

```xml
<!-- AzureのSSML例 -->
<speak version="1.0" xml:lang="ja-JP">
  <voice name="ja-JP-NanamiNeural">
    <prosody rate="0.9" pitch="+5%">
      本日は、お越しいただきありがとうございます。
    </prosody>
    <break time="500ms"/>
    <emphasis level="strong">重要なお知らせ</emphasis>があります。
  </voice>
</speak>
```

| SSML要素       | 制御内容           |
| ------------ | -------------- |
| `<prosody>`  | 速度・音程・音量の調整    |
| `<break>`    | 無音ポーズの挿入       |
| `<emphasis>` | 強調（強弱）         |
| `<say-as>`   | 日付・数字・略語の読み方指定 |

***

## B.4 サービス統合ベンダー（TMS・連携ツール）

翻訳APIを実際のワークフローに統合するためのTMS（翻訳管理システム）も参考として掲載します。

| ベンダー                   | 特徴                 | MTエンジン統合            | API        |
| ---------------------- | ------------------ | ------------------- | ---------- |
| **Phrase（旧Memsource）** | 業務向け高機能TMS         | DeepL, Google, AWS等 | ○ 充実       |
| **Smartling**          | グローバル企業向け、品質管理が充実  | 主要MTエンジン全対応         | ○ REST API |
| **Transifex**          | ソフトウェア・Web向けL10n   | MT連携対応              | ○ API充実    |
| **XTM**                | エンタープライズ向け、高度なTM管理 | 主要MT対応              | ○          |
| **memoQ**              | CATツール＋TMS一体型      | 主要MT対応              | ○          |

***

## マトリクスの更新について

このマトリクスは定期的に更新されます。各ベンダーの公式価格・機能は頻繁に変更されるため、導入判断の際は必ず公式ドキュメントを参照してください。

最終更新：2026年4月

***

## 関連ページ

* [付録A 用語集](/ja/solutions/appendix/glossary.md)
* [付録C 参考文献・仕様リンク集](/ja/solutions/appendix/references.md)
* [第13章 APIdogとグランドデザインの接点](/ja/solutions/part6-apidog/ch13-apidog-overview.md)


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://translationlab.gitbook.io/ja/solutions/appendix/vendor-matrix.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.