當前位置:首頁 > 業界動態 > ElevenLabs 推出新的語音轉文本模型 Scribe,Hume AI 也與新產品競爭

ElevenLabs 推出新的語音轉文本模型 Scribe,Hume AI 也與新產品競爭

2025-03-03業界動態458

ElevenLabs 發佈了一種新的語音轉文本模型 Scribe v1。

該模型在多種語言中具有最高的準確性,您可以在 ElevenLabs 網站上親自嘗試。

根據該公司的基準測試,Scribe 將語音轉換為文本的準確性高於 Google 的 Gemini 2.0 Flash、OpenAI 的 Whisper v3 和 Deepgram Nova-3。

它以總共99種語言提供最先進的轉錄準確性,包括以前服務不足的語言,如塞爾維亞文、粵語和馬拉雅拉姆語。


ElevenLabs 的一位高級研究員解釋說,Scribe 超越了簡單的轉錄來理解音訊。

該模型可檢測非語言元素,如笑聲、音效、音樂和背景噪音,即使在複雜環境中也能執行準確的揚聲器分離。

揚聲器分離是在錄音中分離多個揚聲器的過程,Scribe 可以在音訊檔中識別多達 32 個不同的揚聲器。


主要功能包括多說話人錄音中的說話人區分、單詞級時間戳、非語音事件檢測以及通過 API 進行結構化轉錄輸出。


Scribe 目前可在 ElevenLabs 網站上或通過 API 獲得,輸入音訊每小時 0.40 USD。

在接下來的六周內,它將享受 50% 的折扣,並且正在為即時應用程式開發低延遲版本。


對於企業來說,Scribe 對於需要自動化文檔、會議轉錄和內容可訪問性的行業來說是一個有價值的工具。

跨國公司、媒體公司和客戶支援也可以使用它。


競爭對手 Hume AI 也在同一天推出了 Octave。

Octave 是一種基於 LLM 的模型,允許使用者通過 AI 生成的聲音控制情緒,專為內容創建而設計,包括有聲讀物、播客和遊戲語音。


目前,Octave 支援英語和西班牙文,並計劃在未來擴展到更多語言。

用戶可以通過 Hume 的網站或 API 存取此服務。

API 每分鐘最多可以發出 50 個請求,文本最多可以包含 5000 個字元。


免費計劃每月提供 10,000 個字元(約 10 分鐘)的文本轉語音和無限的自定義語音。

付費計劃起價為 3 美元,價格根據使用方式和功能而有所不同。
Hume 強調,其 Octave TTS 的價格大約是其競爭對手 ElevenLabs 的一半。


“ElevenLabs 推出新的語音轉文本模型 Scribe,Hume AI 也與新產品競爭” 的相關文章

什麼是插頁式廣告?初學者綜合指南

什麼是插頁式廣告?初學者綜合指南

您一定遇到過一些全屏廣告,這些廣告會在應用程式載入下一頁之前彈出。這些是有助於吸引注意力併產生轉化的插頁式廣告。在這篇文章中,我們將向您解釋這種類型的廣告及其功能,並向您展示一些在不中斷用戶體驗的情況下有效使用它們的技巧。什麼是插頁式廣告?插頁式廣告是一種覆蓋應用整個螢幕的廣告。它們出現在應用程式流...

律師 PPC:如何通過付費廣告吸引更多客戶

律師 PPC:如何通過付費廣告吸引更多客戶

您是一名旨在擴大客戶群的律師?為律師使用 PPC 可以快速、戰略性地將您的公司展示在潛在客戶面前。通過使用有針對性、靈活且以當地為重點的廣告活動,您可以與尋求法律説明的人建立聯繫,確保您的服務高度可見。讓我們開始吧!為什麼 PPC 對律師很重要PPC 廣告是律師事務所的寶貴工具,可以幫助他們快速有效...

付費搜索驗證 自然社交媒體與付費社交媒體:哪種方法能帶來更好的結果?

付費搜索驗證 自然社交媒體與付費社交媒體:哪種方法能帶來更好的結果?

您是否發現很難在自然和付費社交媒體策略之間做出選擇?儘管兩者都可以加強您的品牌,但如果您了解它們的主要區別,您可以做出更好的選擇。讓我們檢查每種策略,發現其優勢,然後選擇最適合您的目標和財務預算的策略。什麼是有機社交媒體?有機社交媒體包括您在企業資料上發佈的所有內容,而無需付費進行推廣。這包括直接與...

三星宣佈推出採用PCIe 5.0的9100 PRO高性能SSD:將於3月上市,最高可達8TB

三星宣佈推出採用PCIe 5.0的9100 PRO高性能SSD:將於3月上市,最高可達8TB

由於它是來自國外的文章 (GPT-4o mini) 的翻譯,因此可能存在誤譯。 9100 PRO 是三星消費類 SSD 產品系列的最新成員,具有 PCIe® 5.0 介面,可顯著提高性能。 它採用先進的架構,速度高達 14,800 MB/s 和 13,400 MB/s,性能比其前...

Micron 提供“第 6 代 10nm”DRAM 樣品...三星·它比 SK 快

Micron 提供“第 6 代 10nm”DRAM 樣品...三星·它比 SK 快

美光宣佈已向 Intel 和 AMD 等潛在客戶交付基於 1γ (gamma) 工藝的 DDR5 樣品。1γ 與上一代 DRAM 性能對比表(照片=微米)1γ 是第 6 代 10 奈米級 DRAM,將於今年開始量產。線寬在 11~12nm 水準。在韓國半導體行業,如三星電子和SK海力士,這被稱為1c...

iPhone 16 使用者報告豐田 RAV4 的藍牙問題

iPhone 16 使用者報告豐田 RAV4 的藍牙問題

您是否一直在考慮升級到iPhone 16?最近,由於擔心關稅的極端上漲迫使蘋果提高價格,Tonya 和為 TidBITS 提供支援的 Lauri Reinhardt 在 4 月份購買了 iPhone 16。Tonya 的體驗幾乎完全是積極的——她很快就從之前的 iPhone SE 的 Touch I...