使用 OpenAI 服务配置 AI 通话转写
Yeastar P 系列云 PBX 支持由 OpenAI Speech to Text 服务驱动的 AI 通话转写功能,可将一对一视频/语音通话中通话双方的音频实时转写为可读文本。本文介绍如何在 PBX 上使用该第三方服务配置 AI 通话转写功能。

使用要求
Yeastar P 系列云 PBX 需满足以下要求:
| 项目 | 要求 |
|---|---|
| 固件 |
84.23.0.83 或更高版本。 |
| 订阅服务 |
订阅 企业版 或 旗舰版,确保 AI转写 功能可用。 |
前提条件
- PBX 网络访问
-
确保 Yeastar P 系列云 PBX 能够访问以下域名以使用对应服务:注:
你可以在 PBX 上验证域名是否可访 (路径: )。
服务 域名 OpenAI Speech to Text 服务 api.openai.comGPT/Gemini LLM 根据选择的 LLM,PBX 需能够访问以下对应的域名:
- GPT LLM:
api.openai.com - Gemini
LLM:
oauth2.googleapis.com和generativelanguage.googleapis.com
- GPT LLM:
- 第三方服务账号
-
你已准备好以下第三方服务账号和登录凭证:
服务 账号 OpenAI Speech to Text 服务 准备一个 OpenAI 账号,确保账号具有充足的 OpenAI Speech to Text 服务的转写分钟数额度,并获取该账号的用户名和密码。 GPT/Gemini LLM 根据要使用的 LLM,账号需满足以下要求: - GPT LLM:确保 OpenAI 账号具有充足的令牌额度。
- Gemini LLM:准备一个 Google 账号,确保账号具有充足的令牌额度,并获取该账号的用户名和密码。
操作步骤
步骤一、为 OpenAI Speech to Text 服务创建 API 密钥
要从 PBX 安全接入 OpenAI Speech to Text 服务,需先在 OpenAI 平台创建 API 密钥,用于该服务接口的请求鉴权。
- 使用 OpenAI 用户名和密码登录 OpenAI 平台,进入 API Keys。
- 在 API 密钥列表的右上角,点击 Create new secret key。
- 在弹出的窗口中,创建新的 API 密钥。

- 在 Name 字段,输入名称以识别该 API 密钥。
- 在 Project 下拉列表中,选择项目。
- 权限默认保持 All,并点击 Create secret
key。
窗口弹出并显示生成的 API 密钥。

-
在弹出的窗口中,点击 Copy 复制 API 密钥,并保存以供后续使用。
步骤二、(可选) 为 Gemini LLM 创建 API 密钥
Yeastar P 系列云 PBX 支持在通话结束后自动调用 Google 提供的 Gemini LLM 根据转写的文本生成通话总结。要实现此功能,你需要使用 Google 账号创建一个 API 密钥,用于接口的请求鉴权。
- 使用 Google 用户名和密码登录 Google AI Studio,进入 。
- 在 API 密钥列表的右上角,点击 Create API key。
- 在弹出的窗口中,创建新的 API 密钥。

- 在 Name your key 字段,输入名称以识别该 API 密钥。
- 在 Choose an imported project
下拉列表中,选择项目。注: 在下拉列表中,你可以根据需要选择已有的项目、导入项目或创建新项目。
- 点击 Create key。
窗口弹出并显示生成的 API 密钥的详细信息。

- 在弹出的窗口中,点击 Copy key 复制 API 密钥,并保存以供后续使用。
步骤三、在 PBX 上配置 AI 通话转写功能
为 OpenAI Speech to Text 服务和 LLM 创建身份凭证后,需在 PBX 上完成对应设置,以与两项服务建立连接。
- 登录 PBX 管理网页,进入 。
- 打开 通话转写 开关。
- 配置 AI 通话转写服务。

- 在 服务类型 下拉列表中,选择 自定义服务。
- 在 转录服务商 下拉列表中,选择 OpenAI。
- 在 API 密钥 字段,粘贴 在 OpenAI 平台创建的 API 密钥。
- 在 转录模型 下拉列表中,选择 OpenAI Speech to Text 服务支持的转录模型。有关转录模型之间的区别,请参见 OpenAI Realtime & audio 模型列表。
-
配置 LLM 服务。
选项 操作说明 禁用 如果无需 PBX 生成通话总结,在 大模型服务商 下拉列表中选择 禁用。 OpenAI 要使用 GPT LLM,完成以下设置:

- 在 大模型服务商 下拉列表中选择 OpenAI。
- 在 API 密钥 字段,粘贴 在 OpenAI 平台创建的 API 密钥。
- 在 GPT型号 字段,输入要使用的 GPT LLM 的模型 ID。
Google 要使用 Gemini LLM,完成以下设置:

- 在 大模型服务商 下拉列表中选择 Google。
- 在 API 密钥 字段,粘贴 在 Google AI Studio 创建的 API 密钥。
- 在
Gemini型号 字段,输入要使用的 Gemini
LLM 的模型代码。注: 你可以查看 Gemini 模型列表,并进入要使用的 Gemini LLM 的详情页面查看模型代码。例如,要使用 Gemini 3.1 Pro Preview,在此字段中输入其模型代码
gemini-3.1-pro-preview。
-
在 语言 下拉列表中,选择识别和转写通话所用的语言。
- 在
允许使用本功能的分机 栏,指定允许使用通话转写功能的分机/分机组/部门。
- 所有分机:所有分机都可以使用此功能。
- 特定分机:仅指定的分机可以使用此功能。
- 点击 保存。
执行结果
- 转录连接状态 显示 启用,表示由 OpenAI Speech to Text 服务驱动的 AI 通话转写已启用。通话音频会通过该
OpenAI 服务被实时检测并转写为指定语言的可读文本。
注: 你可以根据不同分机的需求单独为其配置通话转写语言与转写模式 (自动或手动) (路径:)。更多信息,请参见 为分机配置 AI 通话转写。 -
大模型连接状态 显示 启用,表示 PBX 已成功连接到配置的 LLM。PBX 将在通话结束后自动通过该 LLM 根据转写的文本生成通话总结。
