使用 Amazon 服务配置 AI 通话转写
Yeastar P 系列云 PBX 支持由 Amazon Transcribe 服务驱动的 AI 通话转写功能,可将一对一视频/语音通话中通话双方的音频实时转写为可读文本。本文介绍如何在 PBX 上使用该第三方服务配置 AI 通话转写功能。

使用要求
Yeastar P 系列云 PBX 需满足以下要求:
| 项目 | 要求 |
|---|---|
| 固件 |
84.23.0.83 或更高版本。 |
| 订阅服务 |
订阅 企业版 或 旗舰版,确保 AI转写 功能可用。 |
前提条件
- PBX 网络访问
-
确保 Yeastar P 系列云 PBX 能够访问以下域名以使用对应服务:
服务 域名 Amazon Transcribe 服务 transcribestreaming.<region>.amazonaws.com注:- 选择支持 Amazon
批量转录的区域并将
<region>替换为该区域 (如transcribe.me-south-1.amazonaws.com)。建议选择与 PBX 部署位置最近的区域,以降低网络延迟并保障转写服务稳定运行。 - 你可以通过 SSH 远程登录 PBX 服务器,在服务器命令行内执行以下命令,检测 TCP
443
端口是否可访:
nc -vz {{domain}} 443
GPT/Gemini LLM 根据选择的 LLM,PBX 需能够访问以下对应的域名:
- GPT LLM:
api.openai.com - Gemini
LLM:
oauth2.googleapis.com和generativelanguage.googleapis.com
注: 你可以在 PBX 上验证域名是否可访 (路径: )。 - 选择支持 Amazon
批量转录的区域并将
- 第三方服务账号
-
你已准备好以下第三方服务账号和登录凭证:
服务 账号 Amazon Transcribe 服务 - 准备一个 Amazon 账号,确保账号具有充足的 Amazon Transcribe 服务的转写分钟数额度,并获取该账号的 ID。
- 创建一个有权自主管理密钥的 IAM 用户,并获取该用户的用户名和密码。
GPT/Gemini LLM 准备一个使用 GPT LLM 所需的 OpenAI 账号,或使用 Gemini LLM 所需的 Google 账号,确保账号具有充足的令牌额度,并获取该账号的用户名和密码。
操作步骤
步骤一、为 Amazon Transcribe 服务创建访问密钥
要从 PBX 安全接入 Amazon Transcribe 服务,需先在 Amazon 管理控制台创建访问密钥,用于该服务接口的请求鉴权。
- 使用 Amazon 账号 ID、IAM 用户名和密码登录 Amazon 管理控制台。
- 在右上角,点击你的账号并选择 安全凭证。

- 在 我的安全凭证 页面,下拉至 访问密钥 栏,然后点击 创建访问密钥。
- 创建访问密钥。

- 在 使用案例 列表中,选择 其他 并点击 下一步。
- 可选: 在 描述标签值 字段,输入描述信息以识别该访问密钥。
- 点击
创建访问密钥。
访问密钥已成功创建。
- 在 访问密钥 栏,点击
访问密钥 和 秘密访问密钥 旁的
复制访问密钥和秘密访问密钥,并保存以供后续使用。
步骤二、(可选) 为 GPT LLM 或 Gemini LLM 创建 API 密钥
Yeastar P 系列云 PBX 支持调用 GPT LLM 或 Gemini LLM 的接口,以便在通话结束后自动根据转写的文本生成通话总结。要实现此功能,你需要创建一个 API 密钥,用于接口的请求鉴权。
- 如果要使用 OpenAI 提供的 GPT LLM,为 OpenAI 接口创建 API 密钥。
- 如果要使用 Google 提供的 Gemini LLM,为 Gemini 接口创建 API 密钥。
- 在 OpenAI 平台创建 OpenAI API 密钥
-
- 使用 OpenAI 用户名和密码登录 OpenAI 平台,进入 API Keys。
- 在 API 密钥列表的右上角,点击 Create new secret key。
- 在弹出的窗口中,创建新的 API 密钥。

- 在 Name 字段,输入名称以识别该 API 密钥。
- 在 Project 下拉列表中,选择项目。
- 权限默认保持 All,并点击 Create secret
key。
窗口弹出并显示生成的 API 密钥。

-
在弹出的窗口中,点击 Copy 复制 API 密钥,并保存以供后续使用。
- 在 Google AI Studio 创建 Gemini API 密钥
- 使用 Google 用户名和密码登录 Google AI Studio,进入 。
- 在 API 密钥列表的右上角,点击 Create API key。
- 在弹出的窗口中,创建新的 API 密钥。

- 在 Name your key 字段,输入名称以识别该 API 密钥。
- 在 Choose an imported project
下拉列表中,选择项目。注: 在下拉列表中,你可以根据需要选择已有的项目、导入项目或创建新项目。
- 点击 Create key。
窗口弹出并显示生成的 API 密钥的详细信息。

- 在弹出的窗口中,点击 Copy key 复制 API 密钥,并保存以供后续使用。
步骤三、在 PBX 上配置 AI 通话转写功能
为 Amazon Transcribe 服务和 LLM 创建身份凭证后,需在 PBX 上完成对应设置,以与两项服务建立连接。
- 登录 PBX 管理网页,进入 。
- 打开 通话转写 开关。
- 配置 AI 通话转写服务。

- 在 服务类型 下拉列表中,选择 自定义服务。
- 在 转录服务商 下拉列表中,选择 AWS。
- 在 Access ID 字段,粘贴 从 Amazon 管理控制台获取的访问密钥。
- 在 Access Key 字段,粘贴 从 Amazon 管理控制台获取的秘密访问密钥。
- 在 地区下拉列表中,选择区域。
-
配置 LLM 服务。
选项 操作说明 禁用 如果无需 PBX 生成通话总结,在 大模型服务商 下拉列表中选择 禁用。 OpenAI 要使用 GPT LLM,完成以下设置:

- 在 大模型服务商 下拉列表中选择 OpenAI。
- 在 API 密钥 字段,粘贴 在 OpenAI 平台创建的 API 密钥。
- 在 GPT型号 字段,输入要使用的 GPT LLM 的模型 ID。
Google 要使用 Gemini LLM,完成以下设置:

- 在 大模型服务商 下拉列表中选择 Google。
- 在 API 密钥 字段,粘贴 在 Google AI Studio 创建的 API 密钥。
- 在
Gemini型号 字段,输入要使用的 Gemini
LLM 的模型代码。注: 你可以查看 Gemini 模型列表,并进入要使用的 Gemini LLM 的详情页面查看模型代码。例如,要使用 Gemini 3.1 Pro Preview,在此字段中输入其模型代码
gemini-3.1-pro-preview。
-
在 语言 下拉列表中,选择识别和转写通话所用的语言。
- 在
允许使用本功能的分机 栏,指定允许使用通话转写功能的分机/分机组/部门。
- 所有分机:所有分机都可以使用此功能。
- 特定分机:仅指定的分机可以使用此功能。
- 点击 保存。
执行结果
- 转录连接状态 显示 启用,表示由 Amazon Transcribe 服务驱动的 AI 通话转写已启用。通话音频会通过该
Amazon 服务被实时检测并转写为指定语言的可读文本。
注: 你可以根据不同分机的需求单独为其配置通话转写语言与转写模式 (自动或手动) (路径:)。更多信息,请参见 为分机配置 AI 通话转写。 -
大模型连接状态 显示 启用,表示 PBX 已成功连接到配置的 LLM。PBX 将在通话结束后自动通过该 LLM 根据转写的文本生成通话总结。
