谷歌邁出了下一步人工智慧(人工智慧)週三推出了雙子座項目,這是一種經過訓練可以以類似人類的方式行事的人工智慧模型,這可能會加劇有關該技術的潛在前景和危險的爭論。
此次推出將分階段進行,名為「Nano」和「Pro」的 Gemini 不太複雜的版本將立即整合到Google人工智慧驅動的聊天機器人 Bard 及其 Pixel 8 Pro 智慧型手機中。
在 Gemini 的幫助下,Google 承諾 Bard 將變得更加直觀,並且能夠更好地完成涉及規劃的任務。
據谷歌稱,在 Pixel 8 Pro 上,Gemini 將能夠快速總結設備上的錄音,並在訊息服務上提供自動回复,從 WhatsApp 開始。
Gemini 最大的進步要到明年初才會實現,屆時其 Ultra 模型將用於推出“Bard Advanced”,這是聊天機器人的精簡版本,最初僅向測試受眾提供。
人工智慧起初,該技術只能在全球範圍內以英語運行,儘管谷歌高層在新聞發布會上向記者保證,該技術最終不會出現任何其他語言的問題。
根據 Gemini 向一組記者的演示,谷歌的「Bard Advanced」可能能夠透過同時識別和理解涉及文字、照片和影片的演示來實現前所未有的人工智慧多工處理。
Gemini 最終也將被納入Google占主導地位的搜尋引擎,儘管這一轉變的時間尚未明確。
谷歌的“新時代”
「這是人工智慧發展的一個重要里程碑,也是我們谷歌新時代的開始,」Gemini 背後的人工智慧部門 Google DeepMind 執行長 Demis Hassabis 表示。
近十年前,Google擊敗了包括 Facebook 母公司 Meta 在內的其他競購者,收購了總部位於倫敦的 DeepMind,並自此將其與其「大腦」部門合併,專注於 Gemini 的開發。
谷歌宣稱該技術解決問題的能力特別擅長數學和物理,這讓人工智慧樂觀主義者燃起了希望,認為它可能帶來科學突破,改善人類的生活。
但人工智慧辯論的反對方擔心該技術最終會超越人類智能,導致數以百萬計的工作流失,甚至可能產生更具破壞性的行為,例如放大錯誤訊息或觸發核武的部署。
谷歌執行長桑達爾·皮查伊(Sundar Pichai)在部落格文章中寫道:“我們正在大膽且負責任地開展這項工作。”
「這意味著我們的研究雄心勃勃,追求為人類和社會帶來巨大利益的能力,同時建立保障措施並與政府和專家合作,應對隨著人工智慧變得更加強大而帶來的風險」。
雙子座的到來可能會加大賭注人工智慧競賽去年,隨著舊金山新創公司 OpenAI 和長期產業競爭對手微軟的加入,這種情況不斷升級。
憑藉微軟的財務實力和運算能力,OpenAI 在去年底發布免費的 ChatGPT 工具時,已經深入開發其最先進的人工智慧模型 GPT-4。
這個以人工智慧為動力的聊天機器人迅速享譽全球,為生成式人工智慧的商業前景帶來了熱議,並迫使Google推出巴德作為回應。
乘著生成式人工智慧的浪潮
就在巴德到來之際,OpenAI 在 3 月發布了 GPT-4,此後一直在構建針對消費者和企業客戶的新功能,其中包括 11 月推出的一項使聊天機器人能夠分析圖像的功能。
它一直在與 Anthropic 等其他人工智慧新創公司甚至其合作夥伴微軟爭奪業務,微軟擁有 OpenAI 技術的獨家權利,以換取它向這家新創公司投入的數十億美元。
到目前為止,這項聯盟對微軟來說是一個福音,今年迄今為止,微軟的市值已上漲了 50% 以上,這主要是因為投資者相信人工智慧將成為科技業的金礦。
谷歌的母公司 Alphabet 也順應了這一趨勢,今年迄今為止,其市值已增長超過 5,000 億美元(4,600 億歐元),即成長約 45%。儘管近幾個月來人們對 Gemini 充滿期待,但 Alphabet 的股價在周三的交易中小幅下跌。
微軟在過去一年中加深了對OpenAI 的參與,再加上OpenAI 更積極地嘗試將其產品商業化,這引發了人們的擔憂,即隨著技術的進步,這個非營利組織已經偏離了保護人類的初衷。
上個月,OpenAI 董事會在一場圍繞未公開的信任問題的糾紛中突然解雇了執行長薩姆·奧爾特曼,這些擔憂被放大了。在一場威脅要摧毀該公司並導致人工智慧工程人才大量外流到微軟的強烈反對之後,OpenAI 讓 Altman 重新擔任首席執行官,並重新洗牌了董事會。
隨著 Gemini 的出現,OpenAI 可能會發現自己試圖證明其技術仍然比Google的技術更聰明。
「我對它的能力感到敬畏,」Google DeepMind 產品副總裁 Eli Collins 談到 Gemini 時說道。
在虛擬新聞發布會上,Google拒絕透露 Gemini 的參數數量——這是衡量模型複雜性的指標,但不是唯一的指標。
週三發布的一份白皮書概述了Gemini 在多項選擇考試、小學數學和其他基準測試中表現優於GPT-4 的最強大版本,但承認在讓AI 模型實現更高水平的推理技能方面持續存在困難。
一些電腦科學家認為大型語言模型的作用有限,這種模型透過重複預測句子中的下一個單字來運作,並且很容易出現被稱為幻覺的錯誤。
柯林斯說:“我們在 Gemini 的事實性方面取得了很大進展。因此 Gemini 是我們在這方面的最佳模型。但我想說,這仍然是一個尚未解決的研究問題。”