实时翻译功能

无界音流内置了强大的翻译代理功能,支持调用大语言模型(如 OpenAI、Ollama 等)进行高质量的多语言互译。这使得它不仅是一个语音记录工具,更是一个跨语言沟通的得力助手。

实时翻译字幕效果
实时 STT + 翻译双语字幕显示效果

翻译功能介绍

开启翻译功能后,无界音流会将识别出的语音文本实时翻译为您指定的目标语言。翻译结果将直接显示在界面上,或通过“跟随光标注入”功能输入到您的文档中。

💡

提示: 翻译功能只影响“显示/复制/最终注入”的文本,不会改变语音识别(STT)的语言参数。

配置翻译服务

要使用翻译功能,您需要在设置中进行以下配置:

1

启用翻译输出

在设置中勾选“启用翻译输出”。

2

选择目标语言

选择您希望翻译成的语言(如英语、日语等)。

3

配置 API 信息

填写翻译服务的 API 地址。例如,OpenAI 兼容接口通常是 https://api.openai.com/v1

填写服务端要求的模型标识,如 gpt-4o-minideepseek-chat 等。

填写您的 API 密钥。该密钥仅保存在您的本机设置中,不会上传到任何服务器。

推荐翻译模型(Ollama)

如果您希望在本机离线/局域网环境使用翻译,推荐使用 Ollama 拉取翻译模型(参考 Ollama 文档;小白安装指南见 附录 B):

ollama pull ZimaBlueAI/HY-MT1.5-1.8

然后在无界音流设置中填写:

翻译策略选择

无界音流提供了两种翻译策略,以适应不同的使用场景:

⚠️

注意: 启用翻译功能后,“实时输出(持续追加,不回退)”模式会自动关闭,以避免翻译延迟导致输入错乱。