在近日舉辦的第二十八屆中國北京國際科技產業博覽會上,一款能夠“聽懂”藏語並以藏語思維進行創作的大模型成爲了全場關注的焦點。這款名爲“DeepZang”的大模型由西藏大學研發團隊深度參與開發,不僅展示了AI在多語言處理上的突破,更標誌着少數民族語言正加速融入全球數字化浪潮。
長期以來,主流通用大模型多以中、英文爲核心進行訓練,在處理藏語等少數民族語言時,往往存在翻譯腔重、語感生硬等“水土不服”的現象。爲了打破這一僵局,研發團隊收集了近 7000 萬條藏漢平行語料,並採集了超過 30500 小時的語音數據,全面覆蓋了衛藏、康巴、安多三大藏語方言區。
這款大模型的獨特之處在於其“原語思維”能力。在科博會現場,它展現了極高的實用性:從起草犛牛買賣合同,到創作讚美父母的詩歌,再到提供專業的營養建議,AI的回答既精準又富有藏語獨特的文化韻味。更值得一提的是,通過聲紋識別與方言分類技術的結合,它有效解決了藏語口語方言差異大的溝通難題,即使文字水平不高的用戶,也能通過語音輕鬆互動。
科技的進步直接轉化爲生產力的提升。在西藏山南從事翻譯工作的洛桑頓玉表示,AI輔助翻譯讓原本需要三個人分工、耗時 40 分鐘的稿件,現在單人僅需 20 多分鐘即可完成。目前,“DeepZang”的用戶量已突破 30 萬,其中 18 至 40 歲的青年羣體佔比超七成,覆蓋範圍深入西藏、青海、四川、甘肅等偏遠地區。
儘管表現亮眼,藏語AI的商業化之路仍面臨算力成本高昂、資金壓力大等挑戰。對此,相關負責人表示,首次參加科博會正是希望尋找志同道合的合作伙伴,共同攻克算力與商業閉環難題。隨着西藏全區5G網絡和電力基礎設施的完善,藏語AI有望在未來成爲連接藏語使用者與現代數字世界的堅實橋樑。
