上海2025年4月10日 /美通社/ -- 4月1日-2日,2025中國生成式AI大會在北京圓滿舉行,匯聚超過50位產學研界重量級嘉賓,深度解構DeepSeek引發的變革狂潮,全面展示深度推理模型、多模態模型、智能體及具身智能等前沿領域的最新進展。大會以"大拐點 新征程"為主題,吸引了1500余名現場觀眾,線上觀看人次更是突破百萬,成為國內AI領域最具影響力的產業峰會之一。澳鵬Appen作為AI數據服務行業的領軍企業重磅亮相,分享了大模型時代數據服務的前沿洞察與實踐經驗。
澳鵬重磅亮相 展示數據硬實力
2025中國生成式AI大會由智猩猩、智東西共同發起。澳鵬Appen攜全面的大模型數據解決方案亮相大會,展示了如何以專業、精準、安全的高質量訓練數據賦能大模型開發,特別是在垂直領域的深度應用。澳鵬展位吸引了眾多參會者駐足交流,尤其是來自金融、醫療、法律等垂直行業的專業人士。
澳鵬展位吸引眾多參會者駐足交流
澳鵬Appen 2024年年報顯示:中國業務營收突破4.2億,年增長達到71%,其中大模型/AIGC業務增長了526%,幾乎所有行業龍頭,特別是大模型AI企業都成為了澳鵬的客戶。展會期間,澳鵬團隊與與會者共同探討高質量訓練數據如何賦能大模型在垂直領域的精準應用,為金融風控、醫療診斷、法律檢索等專業場景提供更智能、更可靠的解決方案。
澳鵬副總裁董成發表精彩演講
在大模型峰會上,澳鵬Appen中國及韓國區副總裁董成發表了題為《大模型時代的AI數據服務》的主題演講,通過澳鵬在各領域大模型部署中的數據訓練最佳實踐,分享了對大模型應用趨勢的深刻觀察。
董成指出,以AI Agent為代表,未來大模型必定會深度應用到金融、醫療、代碼、音樂、文學等具體垂直領域中。這一趨勢對數據的高質量、專業度和多垂類覆蓋提出了越來越高的要求。面對這一挑戰,澳鵬提供了多種AI輔助的前沿數據采標工具和方案,包括文本對話、多模態交互、思維鏈推理工具等,以滿足不同垂直領域的專業化需求。
澳鵬副總裁董成發表精彩演講
"大模型愈往垂類應用端發力,對數據質量要求愈高,"董成強調,"在通用語言任務上,第一梯隊模型的性能已經趨于一致,開源模型如Llama和DeepSeek的性能已經趕上甚至超過部分閉源模型。但在更復雜的垂直領域任務中,高質量的專業數據將成為決定模型性能的關鍵因素。"
澳鵬全面大模型數據解決方案
在演講中,董成系統介紹了澳鵬全面的大模型數據解決方案,覆蓋從通用能力到垂直領域的全鏈條數據需求,包括:
全面的大模型數據生產工具鏈:澳鵬開發了覆蓋文本對話、圖像/視頻描述、多模態融合、思維鏈和工具調用等場景的專業數據生產工具,滿足大模型訓練對多樣化數據類型的需求。
智能體訓練數據生產:針對快速發展的AI智能體領域,澳鵬專門開發了針對GUI Agent的數據解決方案,支持智能體在多步驟任務中的數據訓練需求。
澳鵬GUI Tracker采集工具
自動化數據標注回環:澳鵬采用"以AI賦能AI"的開發策略,通過自研的預標注大模型與不同領域項目實踐相結合,構建了自動化數據標注回環系統,大幅提升數據生產效率。
高質量成品數據集:澳鵬提供大規模、高質量、多模態的成品數據集,包括多模態多步驟思維鏈數據集、千萬級多語種平行語料數據集、千萬級知識百科和垂類問答數據集、千萬級代碼數據集、億級高質量學科題目數據集以及百萬級圖像文本多模態數據集等。這些數據集為大模型的快速迭代提供了豐富的數據養料。
澳鵬Appen中國及韓國區副總裁董成表示:"澳鵬已在金融、醫療、法律、代碼、音樂等9大垂直領域建立了專業團隊,確保我們能夠為各垂直領域的大模型訓練提供高度專業化的數據支持,幫助客戶在特定領域實現模型性能的突破。"
2025中國生成式AI大會的成功舉辦,彰顯了高質量數據作為大模型發展核心引擎的重要價值。作為AI數據服務領域的領軍者,澳鵬Appen始終以專業、精準、安全的高質量訓練數據為全球AI部署提供強勁動力。站在大模型技術爆發與垂類應用落地的關鍵節點,澳鵬Appen將持續致力于為AI應用開發和落地打造堅實的數據基石,助力中國大模型產業在通用與垂直領域實現協同突破。