新華社北京11月12日電(王濤、朱嘉林、于澤洋)數字經濟的快速發展正在催生數據量的爆炸式增長。作為承載數據存算的關鍵基礎軟件,數據庫已成為各行各業數字化轉型和開展數字業務的核心生產要素之一。
奧星貝斯(以下簡稱“OceanBase”)CEO楊冰表示,以往構建一個復雜的AI應用,需要依賴多個不同的數據庫、管理非常復雜的技術棧,同時還需要一個經驗豐富且規模較大的團隊。“一體化能力可以通過一個數據庫高效處理所有查詢,并通過極簡架構就可以完成數據管理和AI應用開發。”OceanBase是螞蟻集團自主研發的原生分布式數據庫。
越來越多的AI應用不再局限于純文本生成式回答,涉及的數據類型日益復雜,并且常存儲于IT架構的不同數據庫中,這對數據庫提出了新的要求。全球最大的信息管理軟件及服務供應商甲骨文公司(Oracle)以及國內的OceanBase、阿里云等多家公司,都在探索數據庫一體化的發展方向。
據了解,一體化數據庫是一種能夠處理多種工作負載、數據類型及場景的數據庫系統。這種數據庫通常具備事務處理和分析處理能力,支持多模數據處理,并兼容多種主流數據庫協議,讓用戶能夠在一個數據庫上滿足多樣化的數據處理需求。
楊冰指出,目前全球數據存儲中的80%以上是非結構化數據。過去,由于技術限制,許多數據只能轉化為結構化或半結構化格式,而視頻和音頻數據則依賴人工識別。隨著AI的理解能力不斷增強,對于這類最原始、可以記錄物理世界的數據處理變得更為迫切,從而對數據庫技術提出了新的挑戰。
阿里云也在推動數據庫向一體化轉型。PolarDB是阿里云自研的云原生數據庫產品。“PolarDB分布式版早期一直聚焦分布式形態,我們在2023年10月新增了集中式形態。”阿里云PolarDB分布式產品部負責人黃貴表示。
除了向一體化方向探索,人工智能的快速發展也在深刻影響著數據庫技術的變革與演進。
中國信息通信研究院云計算與大數據研究所大數據與智能化部主任姜春宇表示,未來人工智能將更多地賦能數據庫發展,AI化趨勢將日益顯著。AI將對傳統的IT架構、數據架構和業務架構產生深遠影響。
IDC中國副總裁兼首席分析師武連峰表示,未來數據庫的發展將主要體現在兩個層面。一方面,AI將被應用于數據庫,數據庫管理人員、開發人員甚至普通用戶能夠通過自然語言進行對話,簡化數據的查詢;另一方面,數據庫也將服務于AI,支持向量等檢索生成,從而提升數據庫在反饋業務結果時的精準度。
根據第一新聲研究院編制的《2024年中國數據庫市場研究報告》,未來3到5年,大模型賦能的國產數據庫將在實現自動運維、智能安全防護和支持向量檢索等三大能力上迎來突破性進展,顯著降低數據庫的運維成本和管理復雜度,加快推動各行業數字化轉型。