# 第7章　ベンダー地図

> **ナビゲーション**
>
> * 前の章: [第6章　共通スキーマ設計](/ja/solutions/part3-architecture/ch06-common-schema.md)
> * 次の章: [第8章　評価軸の設計](/ja/solutions/part4-procurement/ch08-evaluation-criteria.md)

***

![言語APIは「とりあえずGoogle翻訳」ではなく、用途・言語・品質・コスト要件による使い分けが最適解である](/files/veGMEdSO8e8mVmtspXT4)

言語APIの世界には、数十社以上のベンダーが乱立しています。「とりあえずGoogle翻訳でいいのでは？」と思う方もいるでしょうが、実際には用途・言語ペア・品質要件・コスト構造によって最適解は大きく異なります。この章では、主要ベンダーをカテゴリ別に整理し、それぞれの特徴と強みを把握することで、次章以降の評価軸・比較実践への橋渡しとします。

![言語APIエコシステムはテキスト翻訳・音声認識(STT)・音声合成(TTS)・通訳リアルタイム・翻訳管理(TMS)の5大領域に分類される](/files/vdUboa4ALI8UKSAq2C8H)

***

## 7.1 テキスト翻訳ベンダー

![テキスト翻訳領域は成熟しており、翻訳品質・エコシステム統合・セキュリティ要件でベンダーの強みが明確に分かれる——DeepL/Google/AWS/Azure/ModernMT/Systranの特徴比較](/files/duG6SmWybEZlqqyeycXi)

テキスト翻訳は言語APIの中でもっとも成熟した分野です。機械翻訳（MT: Machine Translation）エンジンをクラウドAPIとして提供するベンダーが複数存在します。

### DeepL API

ドイツ発のDeepLは、ニューラル機械翻訳の品質で高い評価を受けています。特にヨーロッパ言語間（独・仏・英・蘭など）の翻訳精度は業界トップクラスとされ、日本語対応も年々向上しています。APIはシンプルなREST形式で提供され、用語集（Glossary）機能を使うと固有名詞や専門用語を一貫して訳すことができます。Free/Proの2プランがあり、小規模利用から始めやすいのも特徴です。

### Google Cloud Translation

Googleが提供する翻訳APIは、対応言語ペア数が200以上と業界最多水準です。基本API（v2）と、カスタムモデルを作成できるAdvanced（v3）があります。Google Cloud全体のエコシステム（BigQuery・Vertex AIなど）との連携が容易で、大規模データパイプラインに組み込みやすい設計になっています。

### AWS Translate

Amazon Web Servicesの翻訳サービスです。S3・Lambdaとのネイティブ統合が強みで、大量ファイルの非同期バッチ処理が得意です。既にAWSインフラを利用している企業にとって、IAMによる権限管理も統一できるため導入摩擦が小さいという利点があります。

### Azure Translator

MicrosoftのAzure上で提供される翻訳サービス（旧称: Cognitive Services Translator）です。Microsoft 365・Teams・SharePointとの親和性が高く、Office連携や企業内ポータルへの組み込みに適しています。カスタムモデルを作成する「Custom Translator」機能を利用すると、特定ドメインの翻訳精度を大幅に向上させることができます。

### ModernMT

イタリア発のModernMTは「アダプティブMT（Adaptive Machine Translation）」を特徴とします。翻訳メモリや過去の翻訳履歴を参照してリアルタイムに文脈を学習するため、継続して使うほど精度が上がる仕組みです。翻訳会社（LSP）や翻訳管理システム（TMS）との統合実績も豊富です。

### Systran

1968年創業の老舗MT企業です。エンタープライズ向けのオンプレミス展開（自社サーバーへのインストール）が可能という点で、データをクラウドに送れないセキュリティ要件の厳しい組織（政府機関・軍・金融など）から支持されています。クラウドAPIも提供しています。

***

## 7.2 音声認識ベンダー（STT）

![STTベンダーの選定では多言語の認識精度に加えリアルタイム性や特定ドメイン（医療等）への特化が差別化要因となる——Whisper/Google/AWS/Azure/AssemblyAI/Deepgramの特徴](/files/Z0DMPQgZC4M8K2u0Sjhf)

STT（Speech-to-Text）とは、音声をテキストに変換する技術です。会議の文字起こし、音声コマンド、コールセンターの自動記録などに使われます。

### OpenAI Whisper API

OpenAIが公開したWhisperモデルをAPIとして利用できます。98言語以上の多言語認識に対応しており、精度が高いことで知られています。元のモデルはオープンソースとして公開されているため、自己ホスト（自社インフラで動かすこと）も可能です。APIとして使う場合は1分あたりの課金形式です。

### Google Speech-to-Text

リアルタイムストリーミング認識が安定しており、電話品質の音声（8kHz）にも対応しています。話者分離（Speaker Diarization）機能で「誰が話しているか」を識別できるため、会議録の作成に便利です。

### AWS Transcribe

AWSの音声認識サービスです。医療分野向けの専用モデル「Amazon Transcribe Medical」が用意されており、医療用語・診療記録の文字起こしに特化した高精度を発揮します。バッチ処理（録音済みファイルの一括変換）に強みがあります。

### Azure Speech Services

Microsoftの音声サービスです。独自の音響モデルをカスタマイズ（Custom Speech）できるため、特定の話者・環境・専門語彙に合わせた認識精度の向上が可能です。話者認識（Speaker Recognition）機能も提供しています。

### AssemblyAI

音声認識にとどまらず、話者分離・感情分析・要約・トピック検出など、音声コンテンツの付加価値分析を一括で提供するのが特徴です。ポッドキャストやインタビューの分析に活用する企業が増えています。

### Deepgram

低レイテンシ（応答の速さ）とストリーミング処理を重視した設計です。コールセンターやリアルタイム字幕など、即時性が求められるユースケースに適しています。独自のend-to-endモデルにより、精度と速度のバランスが優れています。

***

## 7.3 音声合成ベンダー（TTS）

![音声合成（TTS）は自然な発音の追求から感情制御や音声クローンなど「表現力の多様化」へと進化している——ElevenLabs/Google Cloud TTS/AWS Polly/Azure TTS/OpenAI TTSの特徴](/files/3lsCOMr1WFItuKv0vZYA)

TTS（Text-to-Speech）とは、テキストを音声に変換する技術です。読み上げ機能・音声ガイダンス・コンテンツのオーディオ化などに利用されます。

### ElevenLabs

音声クローン（特定人物の声を数分のサンプル音声から再現する技術）で一躍注目を集めたサービスです。感情表現や話し方のスタイルを細かく制御でき、ナレーション・有声本（オーディオブック）・キャラクターボイスなどで高い支持を得ています。品質は現状トップクラスとされます。

### Google Cloud TTS

WaveNetと呼ばれるディープラーニングモデルをベースにした自然な発音が特徴です。40以上の言語・200以上の音声バリエーションに対応しています。SSML（Speech Synthesis Markup Language）というタグ言語でポーズ・強調・発音を細かく制御できます。

### AWS Polly

AmazonのTTSサービスです。SSML対応のほか、ニューラル音声（Neural TTS）により自然な抑揚を実現しています。S3への音声ファイル保存・Lambdaとの連携など、AWSエコシステムとの統合がスムーズです。

### Azure TTS

感情（喜び・悲しみ・怒りなど）やスタイル（ニュースキャスター調・カスタマーサービス調など）を指定できる「感情・スタイル制御」が特徴です。Microsoft製品との統合に加え、多様な日本語音声も提供されています。

### OpenAI TTS

GPT系APIと同じOpenAI基盤で提供されるシンプルなTTSです。6種類の音声（Alloy・Echo・Fable・Onyx・Nova・Shimmer）から選択でき、品質は高水準です。シンプルなAPIデザインで素早く組み込めるため、プロトタイプや軽量用途に向いています。

***

## 7.4 通訳・リアルタイム系ベンダー

![リアルタイム通訳はAIによる完全自動化からプロ通訳者を介在させるハイブリッド型まで会議の品質要件に応じて形態が異なる——Wordly/Azure Live/Interprefy/KUDOの自動化度×品質マトリクス](/files/5vlz3bS4WuhOAkZeE3UY)

通訳APIはテキスト翻訳より複雑で、音声・低遅延・会議プラットフォームとの統合が求められます。

### Wordly

AI駆動のリアルタイム通訳サービスです。Zoom・Microsoft Teams・Webexなどの主要会議プラットフォームとのネイティブ統合が強みです。参加者はスマートフォンやブラウザから自分の言語で字幕・音声を受け取れます。

### KUDO

人間通訳者がリモートから通訳するためのプラットフォームです。完全AIではなく、プロの通訳者がクラウド上のブースから通訳するモデルです。高品質が求められる国際会議・国連系イベントでの実績があります。

### Interprefy

ハイブリッド通訳（AI通訳と人間通訳の組み合わせ）を提供するスイス発のプラットフォームです。イベント・カンファレンス向けに特化しており、現地・オンライン両対応のハイブリッドイベントで力を発揮します。

### Microsoft Azure Live（Azure AI Speech リアルタイム翻訳）

TeamsのライブキャプションやAzure Speech Servicesのリアルタイム音声翻訳機能がこれにあたります。Microsoftエコシステム内での統合が最も容易で、企業内コミュニケーションのバリアフリー化に活用されています。

***

## 7.5 翻訳管理・プロ品質系ベンダー（TMS/LSP API）

![翻訳管理システム（TMS）とLSPは高度なAPI連携により「人間を関与させたプロ品質の翻訳ワークフロー」を自動化する——Smartling/Phrase/Unbabel/Lionbridge/TransPerfectの役割](/files/xuygpEETJb6YOlxAQbmh)

TMS（Translation Management System：翻訳管理システム）とLSP（Language Service Provider：言語サービス提供会社）は、品質保証・人間翻訳者の関与を前提とした高品質な翻訳ワークフローを提供します。

### Smartling

クラウド型TMSの代表格です。翻訳ワークフロー（依頼→翻訳→レビュー→公開）を自動化するAPIが充実しており、コンテンツ管理システム（CMS）や開発パイプライン（CI/CD）との統合が得意です。

### Phrase（旧Memsource）

CAT（Computer-Assisted Translation：コンピュータ支援翻訳）ツールとTMSを統合したプラットフォームです。翻訳メモリ・用語集管理・品質チェックなど、翻訳者の生産性を高める機能が揃っています。APIが充実しており、自動化フローの構築に向いています。

### Unbabel

AI翻訳と人間翻訳者のレビューを組み合わせた「AI＋人間ハイブリッド」モデルを採用しています。カスタマーサポートメールへの対応を多言語化するユースケースで多くの実績を持ちます。品質保証（QA）が付随するため、単純なMT APIより単価は高いですが信頼性が高いです。

### Lionbridge

世界最大規模のLSPの一つです。350以上の言語に対応し、翻訳・通訳・コンテンツ制作・AIデータサービスを提供します。APIを通じた自動発注・進捗管理・成果物受け取りが可能です。

### TransPerfect

世界トップクラスのLSPです。法律・医療・金融など規制の厳しい分野を含む多分野で翻訳・ローカライゼーション・通訳サービスを展開しています。エンタープライズ向けの大規模契約での利用が中心です。

***

## ベンダー選択のポイント——カテゴリ別比較表

![ベンダー選択に唯一の正解はなく、対応言語数・カスタマイズ性・インフラ要件の横断的な比較が必須である——テキスト翻訳（MT）および音声認識（STT）のカテゴリ別比較表](/files/h8xU5KsNQh58nrhL2lt0)

### テキスト翻訳

| ベンダー                     | 得意言語ペア   | カスタマイズ            | オンプレ | 無料枠     | 特徴          |
| ------------------------ | -------- | ----------------- | ---- | ------- | ----------- |
| DeepL API                | 欧州語・日本語  | 用語集               | なし   | 50万字/月  | 品質重視        |
| Google Cloud Translation | 200以上の言語 | カスタムモデル(v3)       | なし   | 50万字/月  | 言語数最多       |
| AWS Translate            | 75以上の言語  | カスタム用語集           | なし   | 200万字/月 | AWSエコ統合     |
| Azure Translator         | 100以上の言語 | Custom Translator | なし   | 200万字/月 | Microsoft連携 |
| ModernMT                 | 主要言語     | アダプティブ学習          | なし   | 有料のみ    | 継続利用で精度向上   |
| Systran                  | 50以上の言語  | 業種別モデル            | 可能   | なし      | セキュリティ重視    |

### 音声認識（STT）

| ベンダー               | リアルタイム | 話者分離 | 特化モデル  | 自己ホスト | 特徴        |
| ------------------ | ------ | ---- | ------ | ----- | --------- |
| OpenAI Whisper API | 限定的    | なし   | なし     | 可能    | 多言語・高精度   |
| Google STT         | 対応     | 対応   | なし     | なし    | 安定・エコシステム |
| AWS Transcribe     | 対応     | 対応   | 医療     | なし    | 医療特化あり    |
| Azure Speech       | 対応     | 対応   | カスタム音響 | なし    | カスタマイズ性   |
| AssemblyAI         | 対応     | 対応   | なし     | なし    | 付加価値分析    |
| Deepgram           | 対応     | 対応   | なし     | なし    | 低レイテンシ    |

***

> **まとめ**：ベンダー選択に「唯一の正解」はありません。次の第8章では、これらのベンダーを比較するための評価軸を体系的に設計していきます。

![各カテゴリとベンダーの特性を把握した上で次章「評価軸の設計」に進み自社要件に基づく比較検証を開始する——次のアクション：ユースケース特定・セキュリティ要件確認・PoCの準備](/files/GGzaLkh2yuMVGZnsOeMX)

***

→ [第8章 評価軸の設計](/ja/solutions/part4-procurement/ch08-evaluation-criteria.md)


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://translationlab.gitbook.io/ja/solutions/part4-procurement/ch07-vendor-landscape.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
