全新 • 免費開發者方案

語者識別 : 通往企業級語者識別的最簡單途徑——免費開始

將聲音轉化為安全的識別碼。Story321 提供生產就緒的語者識別,具有精準的聲音匹配、快速的語音分段,以及以隱私為先的處理方式。只需註冊一次語者,即可在您的應用程式監聽的任何地方識別他們——通話、會議、語音助理和串流。透過 SDK、簡潔的 API 和分析功能,讓語者識別變得可衡量且可靠,幾分鐘即可開始使用。

什麼是語者識別?

語者識別是一種技術,可根據聲音判斷誰在說話。與將音訊轉換為文字的通用語音辨識不同,語者識別側重於身份——將傳入的聲音與已知的語者進行匹配,或發現存在哪些獨特的語者。在 Story321,我們結合了現代神經嵌入、穩健的語音分段和防欺騙技術,以在嘈雜的環境、口音、設備和語言中提供可靠的即時語者識別。透過正確的註冊,系統可以將語音片段歸因於特定的人,標記未知的語者,並隨著更多音訊的到來而不斷改進。

識別 vs. 驗證:從一組語者中識別出誰在說話;驗證聲稱的聲音是否匹配。

先進行語音分段:在多人音訊中分離語者,然後對每個片段執行語者識別。

神經語者嵌入:緊湊的向量捕捉獨特的聲音特徵,對噪音具有魯棒性。

開放集感知:檢測未知的語者,避免強制進行不良匹配。

防欺騙和活體檢測:減輕重放攻擊和合成語音的風險。

延遲優化的管道:用於互動體驗的串流語者識別。

語音分段語者嵌入開放集識別防欺騙裝置端邊緣 + 雲端

如何使用 Story321 的語者識別

只需幾個步驟,您就可以註冊語者、串流音訊,並接收即時標籤和信心分數。我們的 SDK 和 API 使語者識別對於原型和生產都非常簡單。

1

建立專案並選擇模式

註冊、建立專案,然後選擇雲端、邊緣或混合。對於敏感音訊,請選擇具有可選雲端分析的裝置端語者識別。

2

註冊語者

收集每人 30–60 秒的自然語音。上傳檔案或串流註冊。該服務會為語者識別建立語者嵌入。

3

串流或上傳音訊

傳送即時音訊幀或批次檔案。內建的語音分段會分割輪流,然後語者識別會分配帶有信心分數的標籤。

4

調整閾值並查看分析

使用分數分佈來設定誤接受/誤拒絕的權衡。校準每個管道(通話、麥克風、工作室)的語者識別閾值。

5

將結果整合到您的應用程式中

接收 Webhook 或訂閱事件。將語者識別標籤附加到文字記錄、CRM 記錄或安全工作流程。

精準語者識別的提示

  • 從使用者的典型設備和環境中捕獲乾淨的註冊音訊。
  • 使用多個跨天的註冊樣本來穩定語者識別。
  • 針對任何與安全相關的語者識別用例啟用防欺騙。
  • 校準每個管道的閾值;通話音訊需要與工作室不同的設定。
  • 監控漂移,如果聲音發生顯著變化,請刷新註冊。

我們建議至少 30 秒的多樣化語音用於初始註冊。更長的註冊可以提高語者識別在噪音和編解碼器變化下的魯棒性。

FAQ

語者識別常見問題解答

關於語者識別的準確性、隱私、部署和最佳實踐的常見問題解答。

在幾分鐘內開始語者識別

建立一個免費帳戶,註冊一個聲音,並在您的儀表板中查看即時語者識別。無需信用卡——準備好後再擴展。

免費方案包括慷慨的每月分鐘數,用於開發和測試。升級以獲得更高的限制、專用的 SLA 和企業控制。