8月21日,2024火山引擎 AI 創新巡展在上海舉辦,帶來豆包大模型的一系列產品升級。豆包語音模型和視覺模型再升級,對話式 AI 實時交互解決方案進一步強化 AI 交互體驗。此外,火山引擎攜手多點 DMALL 成立了零售大模型生態聯盟,同時介紹了汽車大模型生態聯盟最新進展,宣佈 AI 創造者大賽開賽。來自沐瞳、浙江大學等單位的嘉賓就與火山引擎合作、落地大模型的實踐進行了分享。
火山引擎總裁譚待表示,豆包大模型獲得眾多行業客户青睞,模型能力也在持續提升。最新版豆包大語言模型的綜合能力相比三個月前首次發佈時提升了20.3%,豆包·文生圖模型、豆包·語音識別模型等模型也有大幅升級,對話式 AI 實時交互解決方案整合了豆包大模型和實時音視頻(RTC)技術,為用户提供更順暢、自然的交互體驗。
01.
豆包大模型使用量爆發
綜合能力提升20.3%
「大的使用量,才能打磨好模型,好的模型又會吸引更多人使用」。據譚待介紹,自5月15日正式對外發布以來,豆包大模型的日均 tokens 使用量已經超過5,000億,平均企業客户使用量增長了22倍。期待越來越多的 AI 原生企業、越來越多的 AI 轉型企業在豆包大模型上快速發展。
基於內外客户廣泛、真實的業務需求,豆包大模型在關鍵能力上不斷迭代優化。公開及內部測評集顯示,最新版豆包大語言模型相比發佈初期綜合能力提升了20.3%。其中,角色扮演能力提升了38.3%,具備了更強的上下文感知,讓對話情境更連貫、角色更擬人化。語言理解能力提升了33.3%,讓豆包大模型在信息分類、抽取、摘要、理解和問答等 NLP 方面都有了顯著提升,能夠在更多生產力場景中得到應用。此外,模型在長文任務、數學、專業知識、代碼能力上也有不同程度的增強。
會上還公佈了多個豆包垂類模型的最新升級。其中,豆包·文生圖模型對長文本有更精準的圖文匹配能力,多主體、多位置、手部結構等複雜場景的生圖能力更強,更善於理解中國特色元素,創造更具美感的中國風圖片。豆包·語音識別模型基於大語言模型豐富的知識和推理能力,通過上下文感知,提升語音識別準確性,在多個公開測試集中,與國內公開發布的語音識別大模型相比,錯誤率最高降低40%;支持一個模型識別普通話和粵語、上海話、四川話、西安話、閩南語等方言。豆包·語音合成模型升級了流式語音合成能力,能夠實時響應、精準斷句,支持「邊想邊説」。
此外,火山引擎發佈對話式 AI 實時交互解決方案,該方案整合了豆包大模型和實時音視頻(RTC)技術,提供端到端的大模型實時對話方案。企業可以輕松地在自己 AI 應用中嵌入該實時語音功能,用户不僅能用語音與 AI 進行交談,還能像平時説話一樣,在對話過程中適時打斷或插話,經過升級后的 AI 聲音具備較好表現力和感情色彩,對話更自然、更真實、更流暢,讓大模型交互體驗更強。
除了模型效果,針對企業生產環境對 AI 高併發需求出發,豆包通用模型pro 提供了國內最高標準的 800k 初始 TPM(每分鍾處理 tokens 數量),保障了企業不僅用得便宜,還用得放心。例如,在客户高併發的對話場景要求下,火山引擎幫助客户完成多輪提示詞優化,並且提供高併發保障,幫助客户應對高峰場景。
02.
零售大模型生態聯盟成立
汽車大模型生態聯盟持續壯大
大模型應用落地不僅需要技術成熟度,還要有適配的商業組織和商業生態。為此,火山引擎攜手多點 DMALL 成立零售大模型生態聯盟,通過融合豆包大模型與 AI 能力,讓零售企業能夠以極低的試錯成本將大模型技術應用到業務場景中,推動零售行業的智能化升級,提升行業的整體效能和創新能力,以適應不斷變化的市場需求和消費者行為,加速零售行業的創新步伐。
譚待表示,火山引擎致力於與行業夥伴共同建立一個零售大模型生態聯盟,探索更多場景的 AI 重構,將大模型應用推廣到零售產業鏈各環節中,加速零售業的運營和周轉效率,全面提升消費者的購物體驗。
物美集團、抖音電商、抖音生活服務、百勝、麥當勞、中國飛鶴、海底撈、居然之家、南7-11、重慶百貨、百果園、波司登、天虹、三得利、絕味、名創優品、NielsenIQ、電通共18家零售聯盟首批成員單位出席了當天的聯盟啟動儀式。
多點 DMALL 創始人、物美集團創始人張文中博士指出,零售大模型生態聯盟對於零售企業來説是抱團取暖,共享聯盟內的技術成果和最佳實踐,降低企業成本,是當下零售企業擁抱 AI 的最好選擇。「我們必須全面擁抱 AI,不僅是爲了更好的未來,而且是爲了生存」,張文中博士説。
除零售大模型生態聯盟外,汽車大模型生態聯盟也迎來了領克汽車、吉利銀河、幾何汽車、上汽榮威、上汽名爵、雄獅科技、大聖科技等多位新成員。火山引擎汽車行業總經理楊立偉介紹,當前,火山引擎正與聯盟成員就新一代 AI 汽車行業定義、行業評測標準發佈以及跨終端行業交流和共創等方向進行密切協作。
此外,火山引擎還宣佈首次舉辦 AI 智能體商業賽事「火山引擎 AI 創造者大賽」,本次大賽由火山引擎攜手領克汽車與英特爾聯合主辦、吉利研究院協辦,鼓勵開發者及技術愛好者利用豆包大模型和釦子專業版,針對領克汽車的真實業務場景,開發出具有實際應用價值的智能體解決方案。
吉利汽車集團營銷數字中心負責人沈穩傑介紹,在豆包大模型幫助下,領克汽車實現了智慧邀約坐席、AI 對練&內訓、AI 銷售助手、智慧經營報表以及 AI 用車説明書等多項基於模型能力的功能,以大模型為銷售顧問提供諸如實時數據分析、客户行為預測、客户對練和評價總結以及個性化銷售策略建議等服務,通過模擬銷售場景中客户對話,幫助銷售顧問提升問題應對能力,全面提升了銷售能力。
03.
全棧AI服務升級
大模型落地再提速
爲了幫助企業將大模型能力與業務場景需求進行適配,火山引擎公佈一系列產品升級,幫助企業更便捷地落地大模型。
火山引擎智能算法負責人、火山方舟負責人吳迪介紹,一站式大模型服務平臺火山方舟最新推出全周期安全可信方案,支持身份認證、數據保密、環境隔離等,構建大模型安全「堡壘」。聯網、內容插件能力再升級,提升搜索能力、可獲取更多優質內容,RAG 知識庫插件進一步強化,更強知識庫文檔解析與檢索能力,支持豐富場景,令企業應用更為靈活自如。
智能體將是企業未來應用的關鍵載體,大模型時代,只有讓不同類型的企業快速、靈活的構建企業級智能體,模型才能真實在業務中落地。釦子專業版讓企業實現一句話「捏個 Bot」的對話型智能體,也能實現通過低代碼編排構建複雜的專家型 Bot。同時,釦子專業版還為企業用户提供專業級 SLA、接入更多模型、以及更高配額。釦子專業版發佈1個月時間,共計新增1萬多用户開通服務,日均調用量達到50萬次。
沐瞳智能服務負責人張文文提到,沐瞳與火山引擎攜手探索 AI+智能應用服務化方向,將豆包大模型能力應用於旗下游戲的 AI 實時判罰場景,基於遊戲內聊天文本對辱罵/攻擊性發言進行識別。在此過程中,豆包大模型表現出效果好、成本省、收益正、服務優等明顯優勢。沐瞳將會繼續與火山引擎合作,以大模型能力優化遊戲開發、提升遊戲品質,為玩家創造更多激動人心的體驗。
火山引擎副總裁張鑫介紹了企業專屬 AI 應用創新平臺 HiAgent 的最新能力。HiAgent 支持通過混合部署方案讓知識庫留在本地,企業可以根據業務需求選擇調用雲上或本地的模型,還能通過其內置的大模型防火牆和數據防泄密機制確保數據安全;HiAgent 還為客户提供了企業專屬的定製擴展能力,支持將開發出來的 Agent 與原有的業務系統進行靈活集成。
浙江大學求是特聘教授、信息技術中心主任陳文智表示,在自研 OpenBuddy 模型,以及豆包大模型等極具性價比的商業模型及智能體的共同賦能下,浙大創建了「浙大先生」智能體應用開發平臺,並搭建了 AI 科學家、慧學外語、AI 百事通、數字教師等多個大模型校園應用場景。后續浙大將繼續攜手火山引擎,共同打造每個人的 AI 專屬智能體,為校園帶來交互模式、知識複用、數據連接以及決策創新等更多方面變革。
大模型從探索走向應用,雲基礎設施的支撐不可或缺。火山引擎雲基礎產品負責人羅浩表示,火山引擎 AI 全棧雲依託與字節跳動的海量資源共池,從誕生起所有 IaaS、PaaS 層資源,以及推薦算法、數智平臺等中臺體系產品,都生長於同一朵雲上。數據中心、軟硬件基礎架構的統一,避免了「算力孤島」和「數據孤島」問題,結合火山引擎自研服務器、自研 DPU 卡、調度算法等技術能力,火山引擎 AI 全棧雲在性能、穩定性和成本上具備了更大的優勢。在模型推理場景中,可針對不同體量模型,提供類型豐富、靈活供應的海量 GPU 推理資源;支持超低延時調用豆包大模型,訪問質量穩定可控。
通過強化豆包大模型「更強模型、更低價格、更易落地」的優勢、成立行業聯盟、推動生態共建,火山引擎將持續幫助企業加速落地 AI 能力,驅動商業模式變革,為行業的未來發展注入新的動力。下一站,2024火山引擎 AI 創新巡展將來到天津,帶來更多 AI 創新升級,攜手企業客户推進 AI 轉型。