語音輸入(STT)

三引擎語音辨識系統,即時產生字幕——支援線上與離線模式,最多可辨識 99 種語言。

三大引擎,靈活切換

Sub!t 整合三種語音辨識引擎,各自針對不同使用情境最佳化。可根據需求即時切換——不論是需要雲端即時辨識、完全離線的隱私保護,或是輕量級的串流方案。

Deepgram Nova-3

線上即時串流辨識,延遲約 200ms。支援自訂詞彙(Keywords Boosting),適合有網路環境的現場活動。

Whisper large-v3-turbo

離線辨識,Metal GPU 加速。支援 99 種語言,適合預錄或需要最高準確度的情境。

Sherpa-onnx

離線串流模式(Zipformer 中英雙語)與非串流模式(SenseVoice 中英日韓粵 5 語言)。輕量化、隱私優先。

智慧語言處理

內建 OpenCC 引擎,離線辨識結果自動進行繁簡轉換,含台灣慣用詞彙對應。

使用情境

現場研討會:

使用 Deepgram 即時語音轉字幕,為多語言觀眾服務。Keywords Boosting 確保專有名詞和技術用語正確辨識。

宗教場所:

Sherpa-onnx 或 Whisper 離線辨識,完全不需要網路。適合網路不穩定的場地。

直播製作:

即時產生字幕並透過 NDI 輸出疊加至直播畫面。

準備好試用 Sub!t 了嗎?

下載免費試用 查看價格