人工智慧 (AI) 能否幫助您過濾嬰兒哭聲或警報器的噪音,同時保留鳥兒的歌聲?
華盛頓大學的一個團隊相信他們已經找到瞭如何能夠在背景噪音中隨意分心。
他們開發了使用深度學習技術的演算法,允許用戶選擇戴上耳機時可以聽到的聲音。他們稱這個系統為「語意聽覺」。
“在高水平上,我們使用降噪耳機來抑制環境中的所有聲音。但我們在智慧型手機上運行神經網路來提取感興趣的聲音,並通過耳機實時將其播放回耳朵中”,計算機科學與工程教授Shyam Gollakota 告訴Euronews Next。
那麼,它是如何運作的呢?耳機將錄製的聲音傳送到連接的智慧型手機,從而阻擋其他噪音。使用者可以使用語音命令或應用程式從 20 個類別中選擇聲音(例如鳥鳴聲),並且僅播放所選的聲音。
「我們透過揚聲器播放的目標聲音必須與佩戴者在環境中看到的聲音一致。因此,我們只有 20 毫秒的時間來處理輸入聲音、提取目標聲音並在耳機上播放它們,」電腦科學博士生Bandhav Veluri 解釋說,他們必須創建「一個非常高效的深度學習模型」。
這個時間限制解釋了為什麼系統依賴智慧型手機而不是雲端伺服器。
“進入消費市場的時機已經成熟”
「有趣的是,當人們現在通常談論神經網路和人工智慧時,他們熟悉像 ChatGPT 這樣的大型語言模型,」Gollakota 說。
「這需要在巨大的資料中心中運行的非常大的模型,這對於我們的應用程式來說確實是不可能的。我們設計了一個可以在智慧型手機上運行的特殊神經網路」。
該系統在辦公室、街道和公園等地方進行了測試,可以識別警報器、鳥聲、警報和特定噪音,同時消除所有其他背景聲音。
當22人對系統的聲音輸出進行回饋時,他們普遍表示聽起來比原始錄音更好,根據研究結果。
然而,在某些情況下,系統發現很難區分非常相似的聲音,例如唱歌和說話。研究人員建議,使用更多真實數據來訓練模型可能有助於改善這些結果。
Veluri 表示,該系統「進入消費市場的時機已經成熟」。
Gollakota 表示:“這兩種趨勢(降噪技術和深度學習)為創造智慧型穿戴裝置的未來提供了機會,這些設備具有迄今為止只存在於科幻小說領域的現實功能。”
他補充說:“我很高興現在是創建這些智慧耳機的最佳時機,而且我們將在未來五年內開始在我們的耳機中看到智慧。”