智譜公司近期推出了一款名為GLM-4-Voice的多模態語音模型,該模型在情感理解方面表現出色,能夠模擬高興、悲傷等多種情緒和語調,實現與用戶間的情感共鳴。
GLM-4-Voice在對話中展現出高度的靈活性,用戶可以隨時打斷并調整語音輸出的內容和風格。同時,該模型還支持調整語速,以適應不同場景的交流需求。
除了支持中英文語音外,GLM-4-Voice還能識別和表達粵語、重慶話和北京話等中國各地方言。未來,該模型還將結合視頻通話功能,為用戶提供全方位的交互體驗。
目前,GLM-4-Voice已作為智譜公司首個開源的端到端多模態模型,部署在“智譜清言”App上,供用戶即時體驗。