相關推薦
IBM 和聯合國推出免費使用的先進 AI 能源預測工具
IBM與聯合國開發計劃署(UNDP)近日宣佈推出兩個突破性的免費AI交互模型,旨在預測全球能源獲取情況並模擬能源公平性。這一合作標誌着人工智能技術在應對全球能源挑戰方面邁出了重要一步。新推出的電力接入預測模型利用AI技術分析人口、城市化、基礎設施和衛星數據,爲102個國家提供至2030年的電力接入預測。與此同時,清潔能源公平指數作爲同類指數中的首創,使用AI統計地理空間模型,基於環境、社會和經濟因素爲53個非洲國家生成能源公平性評分。圖源備註:圖片由AI生成,圖
YouTube引入DeepMind Veo模型 爲創作者想象插上翅膀
YouTube正式宣佈將Google DeepMind的Veo模型整合到其短視頻平臺YouTube Shorts中,這一舉措標誌着短視頻創作進入了一個全新的AI驅動時代。此次技術升級不僅爲創作者提供了前所未有的創意工具,更將徹底改變用戶與平臺的互動方式。核心的技術創新集中體現在名爲"Dream Screen"的全新功能上。這項功能巧妙結合了Imagen3和Veo兩大先進AI模型,爲創作者打造了一個高度智能化的創作環境。具體而言,Dream Screen首先通過Imagen3生成四種風格各異的圖像,供創作者根據個人偏好選擇。隨後,Veo模型接棒,將
AI生成媒體平臺Fal.ai獲2300萬美元融資 a16z等知名投資方加持
專注於AI生成音頻、視頻和圖像開發的平臺Fal.ai近日宣佈完成總額2300萬美元的融資。這筆資金來自兩輪融資:由Kindred Ventures領投的1400萬美元A輪融資,以及此前未公開的由Andreessen Horowitz (a16z)領投的900萬美元種子輪融資。其他投資者還包括Black Forest Labs聯合創始人Robin Rombach和Perplexity CEO Aravind Srinivas。Fal.ai由前亞馬遜軟件開發人員Gorkem Yurtseven和前Coinbase機器學習開發負責人Burkay Gur於2021年共同創立。兩位創始人在疫情期間合作開發業餘項目時,意識到對AI雲基礎設施,尤其是運行生成式AI模
騰訊出品!AI音頻模型 EzAudio AI,讓文本秒變逼真聲音
近日,約翰霍普金斯大學與騰訊 AI 實驗室聯合推出了一款名爲 EzAudio 的新型文本到音頻生成模型。這項技術承諾以空前的效率和高品質文本轉換爲聲音,標誌着人工智能和音頻技術的重大飛躍。EzAudio 的工作原理是利用音頻波形的潛在空間,而不是傳統的聲譜圖,這一創新讓它能夠在高時間分辨率下工作,且無需額外的神經聲碼器。EzAudio 的架構被稱爲 EzAudio-DiT(擴散變換器),採用了多項技術創新來提高性能和效率。其中包括一種新的自適應層歸一化技術 AdaLN-SOLA、長跳連接,以及先進的
ChatGPT 高級語音模式或將於9月24日全面上線
據科技媒體 testingcatalog 最新消息,ChatGPT 的高級語音模式可能將於9月24日正式發佈,這一功能的全面推出無疑將爲用戶帶來前所未有的交互體驗。早在今年7月,OpenAI 已向部分 ChatGPT Plus 用戶開放了高級語音模式的測試權限。據悉,該功能能夠生成極爲逼真的音頻響應,使用戶彷彿與真人對話,大大提升了人機交互的自然度和沉浸感。此次更新信息的可靠性得到了進一步佐證。有開發者在高級語音模式的常見問題頁面中發現了一段頗具玄機的代碼:"hasSeenAdvancedVoice/2024-09-24"。這一字符串似乎
