午夜日韩久久影院,亚洲欧美在线观看首页,国产情侣真实露脸在线最新,一级毛片在线观看免费

資訊在沃

烏鎮(zhèn)“智”新時(shí)刻丨大模型面臨高質(zhì)量數(shù)據(jù)短缺 國(guó)產(chǎn) AI 數(shù)據(jù)合成與生產(chǎn)平臺(tái)烏鎮(zhèn)“首發(fā)”

   發(fā)布時(shí)間:2024-11-19 18:12 作者:陳陽(yáng)

記者 張?jiān)轿?/p>

11月 19 日下午,行業(yè)大模型、具身智能、算力、芯片、數(shù)據(jù)合成等10 項(xiàng)首發(fā)成果在烏鎮(zhèn)峰會(huì)登臺(tái)路演, 其中 AI 數(shù)據(jù)合成與生產(chǎn)平臺(tái)AIGD(AI Generated Data)因聚焦“數(shù)據(jù)合成”獲廣泛關(guān)注。“未來(lái)的AI應(yīng)用需要大量稀缺且難以獲取的長(zhǎng)尾數(shù)據(jù),如自動(dòng)駕駛中的極端天氣與極端路況數(shù)據(jù),具身智能訓(xùn)練所需要的復(fù)雜場(chǎng)景數(shù)據(jù)。在此背景下,數(shù)據(jù)合成成為關(guān)鍵。”螞蟻數(shù)科AI科技技術(shù)負(fù)責(zé)人、螞蟻天璣實(shí)驗(yàn)室主任李哲現(xiàn)場(chǎng)向記者介紹。

記者在2024年世界互聯(lián)網(wǎng)大會(huì)烏鎮(zhèn)峰會(huì)了解到,AIGD平臺(tái)是由螞蟻數(shù)科申報(bào)的首發(fā)成果,平臺(tái)可通過大規(guī)模合成互聯(lián)網(wǎng)所不覆蓋的高質(zhì)量、高價(jià)值垂直語(yǔ)料數(shù)據(jù),幫助科技廠商進(jìn)行 AI 模型訓(xùn)練。記者了解到,AIGD具備 PB 級(jí)數(shù)據(jù)生產(chǎn)能力,支持?jǐn)?shù)據(jù)從生成到訓(xùn)練全流程自動(dòng)化處理,自動(dòng)化率達(dá)到 80%,這極大提高了數(shù)據(jù)處理的效率和質(zhì)量。平臺(tái)自研15 余種數(shù)據(jù)合成工具,目前可以合成圖片、視頻、3D模型、多模態(tài)圖文視頻對(duì)、多輪對(duì)話、語(yǔ)音信號(hào)、心率腦電信號(hào)、結(jié)構(gòu)化交易數(shù)據(jù)等多模態(tài)數(shù)據(jù),以滿足多種應(yīng)用場(chǎng)景下的 AI 模型訓(xùn)練需求。

業(yè)內(nèi)人士普遍認(rèn)為,“高質(zhì)量數(shù)據(jù)”是 AI 大模型深入到產(chǎn)業(yè)的重要基礎(chǔ),沒有好的數(shù)據(jù)做支撐,一切 AI 應(yīng)用都是空中樓閣。近日,OpenAI員工爆料說,“新模型‘沒有那么大飛躍’”,主要原因之一便是高質(zhì)量數(shù)據(jù)不足所導(dǎo)致的。今年 9 月份, OpenAI 發(fā)布推理模型o1,帶來(lái)了強(qiáng)化學(xué)習(xí)訓(xùn)練新范式,通過自博弈強(qiáng)化學(xué)習(xí),將合成數(shù)據(jù)的形式訓(xùn)練給大模型,從而大幅增加大模型邏輯推理能力。

“數(shù)據(jù)合成”是螞蟻數(shù)科 AIGD 平臺(tái)的主要功能之一,此外還包括數(shù)據(jù)標(biāo)注、質(zhì)檢等能力。在數(shù)據(jù)標(biāo)注方面,通過人機(jī)協(xié)同進(jìn)行標(biāo)注,人工智能算法能夠自動(dòng)識(shí)別和預(yù)處理大部分基礎(chǔ)信息,預(yù)標(biāo)注模型依賴人工標(biāo)注量降低了 70%以上。在數(shù)據(jù)質(zhì)檢方面,平臺(tái)會(huì)根據(jù)元信息支持不同粒度的數(shù)據(jù)質(zhì)量統(tǒng)計(jì),最大程度理解數(shù)據(jù),保證合成及標(biāo)注后的數(shù)據(jù)符合預(yù)期質(zhì)量要求。李哲在烏鎮(zhèn)峰會(huì)上表示:“我們即將迎來(lái) AI 服務(wù)產(chǎn)業(yè)的黃金年代,螞蟻數(shù)科將會(huì)堅(jiān)定在 AI ToB 領(lǐng)域投入,讓 AI 深入千行百業(yè)。”

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新