三引擎語音辨識系統,即時產生字幕——支援線上與離線模式,最多可辨識 99 種語言。
Sub!t 整合三種語音辨識引擎,各自針對不同使用情境最佳化。可根據需求即時切換——不論是需要雲端即時辨識、完全離線的隱私保護,或是輕量級的串流方案。
線上即時串流辨識,延遲約 200ms。支援自訂詞彙(Keywords Boosting),適合有網路環境的現場活動。
離線辨識,Metal GPU 加速。支援 99 種語言,適合預錄或需要最高準確度的情境。
離線串流模式(Zipformer 中英雙語)與非串流模式(SenseVoice 中英日韓粵 5 語言)。輕量化、隱私優先。
內建 OpenCC 引擎,離線辨識結果自動進行繁簡轉換,含台灣慣用詞彙對應。
使用 Deepgram 即時語音轉字幕,為多語言觀眾服務。Keywords Boosting 確保專有名詞和技術用語正確辨識。
Sherpa-onnx 或 Whisper 離線辨識,完全不需要網路。適合網路不穩定的場地。
即時產生字幕並透過 NDI 輸出疊加至直播畫面。