當前位置:首頁 > 業界動態 > ElevenLabs 推出新的語音轉文本模型 Scribe,Hume AI 也與新產品競爭

ElevenLabs 推出新的語音轉文本模型 Scribe,Hume AI 也與新產品競爭

2025-03-03業界動態409

ElevenLabs 發佈了一種新的語音轉文本模型 Scribe v1。

該模型在多種語言中具有最高的準確性,您可以在 ElevenLabs 網站上親自嘗試。

根據該公司的基準測試,Scribe 將語音轉換為文本的準確性高於 Google 的 Gemini 2.0 Flash、OpenAI 的 Whisper v3 和 Deepgram Nova-3。

它以總共99種語言提供最先進的轉錄準確性,包括以前服務不足的語言,如塞爾維亞文、粵語和馬拉雅拉姆語。


ElevenLabs 的一位高級研究員解釋說,Scribe 超越了簡單的轉錄來理解音訊。

該模型可檢測非語言元素,如笑聲、音效、音樂和背景噪音,即使在複雜環境中也能執行準確的揚聲器分離。

揚聲器分離是在錄音中分離多個揚聲器的過程,Scribe 可以在音訊檔中識別多達 32 個不同的揚聲器。


主要功能包括多說話人錄音中的說話人區分、單詞級時間戳、非語音事件檢測以及通過 API 進行結構化轉錄輸出。


Scribe 目前可在 ElevenLabs 網站上或通過 API 獲得,輸入音訊每小時 0.40 USD。

在接下來的六周內,它將享受 50% 的折扣,並且正在為即時應用程式開發低延遲版本。


對於企業來說,Scribe 對於需要自動化文檔、會議轉錄和內容可訪問性的行業來說是一個有價值的工具。

跨國公司、媒體公司和客戶支援也可以使用它。


競爭對手 Hume AI 也在同一天推出了 Octave。

Octave 是一種基於 LLM 的模型,允許使用者通過 AI 生成的聲音控制情緒,專為內容創建而設計,包括有聲讀物、播客和遊戲語音。


目前,Octave 支援英語和西班牙文,並計劃在未來擴展到更多語言。

用戶可以通過 Hume 的網站或 API 存取此服務。

API 每分鐘最多可以發出 50 個請求,文本最多可以包含 5000 個字元。


免費計劃每月提供 10,000 個字元(約 10 分鐘)的文本轉語音和無限的自定義語音。

付費計劃起價為 3 美元,價格根據使用方式和功能而有所不同。
Hume 強調,其 Octave TTS 的價格大約是其競爭對手 ElevenLabs 的一半。


“ElevenLabs 推出新的語音轉文本模型 Scribe,Hume AI 也與新產品競爭” 的相關文章

律師 PPC:如何通過付費廣告吸引更多客戶

律師 PPC:如何通過付費廣告吸引更多客戶

您是一名旨在擴大客戶群的律師?為律師使用 PPC 可以快速、戰略性地將您的公司展示在潛在客戶面前。通過使用有針對性、靈活且以當地為重點的廣告活動,您可以與尋求法律説明的人建立聯繫,確保您的服務高度可見。讓我們開始吧!為什麼 PPC 對律師很重要PPC 廣告是律師事務所的寶貴工具,可以幫助他們快速有效...

iPhone 17 Pro 系列將配備 12GB RAM 以增強 AI 支援重新點燃的謠言

iPhone 17 Pro 系列將配備 12GB RAM 以增強 AI 支援重新點燃的謠言

iPhone 17 Pro 預計將配備 12GB 記憶體有傳言稱今年推出的一些iPhone機型將配備12GB RAM並不新鮮。繼 Apple Intelligence 在 WWDC 2024 上宣佈後,分析師郭明錤預測 iPhone 17 Pro 系列將配備更多 RAM。這一傳言...

 Apple 研究智能眼鏡

Apple 研究智能眼鏡

蘋果可能會進入一個新的產品類別:智慧眼鏡。週四浮出水面的一份報告表明,蘋果正在開發一種晶元,為內置人工智慧和攝像頭的眼鏡提供動力,該晶元可能在未來幾年內推出。借助該公司的Visual Intelligence AI工具,一副智慧眼鏡可以為佩戴者識別物體,獲取有關企業的資訊,並向使用者解釋他們正在看什...

iOS 19 可能會將您的 iPhone 變成迷你 Mac

iOS 19 可能會將您的 iPhone 變成迷你 Mac

根據一位著名提示者週四的報告,運行 iOS 19 的 iPhone 將能夠在外部螢幕上顯示 Windows 中運行的應用程式。如果為 true,它將使 iOS 比以往任何時候都更像 Mac。如果 Apple 繼續朝著這個方向發展,iPhone 最終可能會成為某人唯一的電腦。得益於 iOS 19 的...

Vision 'Air' 耳機可以採用鈦合金部件和深藍色飾面

Vision 'Air' 耳機可以採用鈦合金部件和深藍色飾面

根據週三和週四來自半可靠來源的多次洩密事件,蘋果可能很快就會發佈更輕、更薄的 Vision Pro 耳機版本,其名稱可能為“ Vision Air”新設備將代表一次重大的重新設計,重點是減輕重量,同時可能提供比 3,500 美元的 Vision Pro 更實惠的替代品。它可能是藍黑色,而不是 Vis...

Apple 選擇三星用於可摺疊 iPhone OLED 顯示幕

Apple 選擇三星用於可摺疊 iPhone OLED 顯示幕

根據一份新報告,蘋果選擇三星顯示作為其首款可摺疊 iPhone 的 OLED 面板獨家供應商,該手機預計將於 2026 年推出。這一決定標誌著Apple與典型的多供應商戰略背道而馳。它有助於確保高品質並重振可摺疊OLED市場。摺疊 iPhone 概念Apple 選擇三星用於可摺疊 iPhone OL...