當前位置:首頁 > 業界動態 > ElevenLabs 推出新的語音轉文本模型 Scribe,Hume AI 也與新產品競爭

ElevenLabs 推出新的語音轉文本模型 Scribe,Hume AI 也與新產品競爭

2025-03-03業界動態493

ElevenLabs 發佈了一種新的語音轉文本模型 Scribe v1。

該模型在多種語言中具有最高的準確性,您可以在 ElevenLabs 網站上親自嘗試。

根據該公司的基準測試,Scribe 將語音轉換為文本的準確性高於 Google 的 Gemini 2.0 Flash、OpenAI 的 Whisper v3 和 Deepgram Nova-3。

它以總共99種語言提供最先進的轉錄準確性,包括以前服務不足的語言,如塞爾維亞文、粵語和馬拉雅拉姆語。


ElevenLabs 的一位高級研究員解釋說,Scribe 超越了簡單的轉錄來理解音訊。

該模型可檢測非語言元素,如笑聲、音效、音樂和背景噪音,即使在複雜環境中也能執行準確的揚聲器分離。

揚聲器分離是在錄音中分離多個揚聲器的過程,Scribe 可以在音訊檔中識別多達 32 個不同的揚聲器。


主要功能包括多說話人錄音中的說話人區分、單詞級時間戳、非語音事件檢測以及通過 API 進行結構化轉錄輸出。


Scribe 目前可在 ElevenLabs 網站上或通過 API 獲得,輸入音訊每小時 0.40 USD。

在接下來的六周內,它將享受 50% 的折扣,並且正在為即時應用程式開發低延遲版本。


對於企業來說,Scribe 對於需要自動化文檔、會議轉錄和內容可訪問性的行業來說是一個有價值的工具。

跨國公司、媒體公司和客戶支援也可以使用它。


競爭對手 Hume AI 也在同一天推出了 Octave。

Octave 是一種基於 LLM 的模型,允許使用者通過 AI 生成的聲音控制情緒,專為內容創建而設計,包括有聲讀物、播客和遊戲語音。


目前,Octave 支援英語和西班牙文,並計劃在未來擴展到更多語言。

用戶可以通過 Hume 的網站或 API 存取此服務。

API 每分鐘最多可以發出 50 個請求,文本最多可以包含 5000 個字元。


免費計劃每月提供 10,000 個字元(約 10 分鐘)的文本轉語音和無限的自定義語音。

付費計劃起價為 3 美元,價格根據使用方式和功能而有所不同。
Hume 強調,其 Octave TTS 的價格大約是其競爭對手 ElevenLabs 的一半。


“ElevenLabs 推出新的語音轉文本模型 Scribe,Hume AI 也與新產品競爭” 的相關文章

飛利浦 Hue 應用程式開始支援 LG 智慧電視:價格揭曉

飛利浦 Hue 應用程式開始支援 LG 智慧電視:價格揭曉

由於它是來自國外的文章 的翻譯,因此可能存在誤譯。Philips Hue Sync TV 應用程式現已在 LG 電視上推出。昕諾飛推出了適用於 LG 電視的飛利浦 Hue Sync TV 應用程式。該應用程式可在當前相容的 LG 型號上在全球範圍內使用,允許使用者將他們的飛利浦 Hue 智慧燈與螢幕...

Micron 提供“第 6 代 10nm”DRAM 樣品...三星·它比 SK 快

Micron 提供“第 6 代 10nm”DRAM 樣品...三星·它比 SK 快

美光宣佈已向 Intel 和 AMD 等潛在客戶交付基於 1γ (gamma) 工藝的 DDR5 樣品。1γ 與上一代 DRAM 性能對比表(照片=微米)1γ 是第 6 代 10 奈米級 DRAM,將於今年開始量產。線寬在 11~12nm 水準。在韓國半導體行業,如三星電子和SK海力士,這被稱為1c...

谷歌推出具有高使用限制的免費 AI 編碼助手

谷歌推出具有高使用限制的免費 AI 編碼助手

谷歌週二推出了其 AI 代碼完成和輔助工具的免費消費者版本,名為「個人使用的 Gemini Code Assist」。我們還推出了適用於 GitHub 的 Gemini Code Assist,這是一個自動檢測代碼錯誤的代理。Personal Code Assist 允許開發人員訪問和編輯代碼庫,同...

羅技推出 Powerplay 2 滑鼠墊:更便宜

羅技推出 Powerplay 2 滑鼠墊:更便宜

PowerPlay 2:羅技讓這款神奇的滑鼠墊更實惠,而不是更好。PowerPlay 2 比原版便宜 20 美元,但感覺比這更實惠。 我從未對完美的產品進行過評論,但羅技的 PowerPlay 無線充電系統幾乎是完美的。三年多來,我什至從未想過為無線滑鼠充電。它是如此簡單,以至於感覺很神奇...

LG 發佈 45 英寸 5K2K OLED 顯示器 45GX950A、45GX990A 並查看價格

LG 發佈 45 英寸 5K2K OLED 顯示器 45GX950A、45GX990A 並查看價格

更新了 LG 45GX950A 和 45GX990A 45 英寸 5K2K OLED 顯示器的價格和供貨情況最新視頻「5K2K 超寬 OLED 來了!正如我們所討論的,第一波具有新的高解析度和圖元密度的45英寸OLED顯示器將在未來幾個月內發佈。這些螢幕將是第一款提供 45 x 5120 解析度的...

iPhone 17 Pro 系列將配備 12GB RAM 以增強 AI 支援重新點燃的謠言

iPhone 17 Pro 系列將配備 12GB RAM 以增強 AI 支援重新點燃的謠言

iPhone 17 Pro 預計將配備 12GB 記憶體有傳言稱今年推出的一些iPhone機型將配備12GB RAM並不新鮮。繼 Apple Intelligence 在 WWDC 2024 上宣佈後,分析師郭明錤預測 iPhone 17 Pro 系列將配備更多 RAM。這一傳言...