文/陳術
過去幾年,大家都對不同的大型語言模型耳熟能詳,DeepSeek、豆包、ChatGPT等等,其實香港一樣有借助國家力量,建立屬於香港的大型語言模型,昨日(3日),香港生成式人工智能研發中心(HKGAI)就發布最新版本本地大模型HKGAI V3,新一代模型追求「更高效、更睿智、更本地」,與此同時,HKGAI亦同步推出全港首個生產力級超級智能體「Agent Workshop」。開發出適用於香港人的新一代大模型,必定能造福本港廣大市民,往後的日子,社會各界要善用香港的大型語言模型外,亦要思考如何做好數字教育等工作,令研發者、教師以至學生,都能夠受惠於創新科技的進步。
在發布會上,創新科技及工業局局長孫東就提到,V3是以本地數據訓練為基礎的大模型,能處理兩文三語,掌握香港獨有語境與文化,期望升級後的模型提供更貼地的垂直應用,優化「港文通」、「港話通」等,讓市民獲得更優質的智能體體驗。他透露,政府將成立「AI+與產業發展策略委員會」,香港人工智能研發院亦將投入運作,加速成果轉化。而HKGAI主任、香港科技大學首席副校長郭毅可則指出,新一代模型追求「更高效、更睿智、更本地」,目標是成為「最懂香港政企業務的『數字香港人』 」。
集中討論HKGAI V3,HKGAI V3是基於內地大模型而再開發出來,但與其他大型語言模型比較HKGAI V3是獨特的。作為港人,深刻明白到廣東話、香港人慣用語言的習慣,與內地不盡相同,如果使用純內地的大型語言模型,尤其是用廣東話去問、去分析,可能會因為兩地語言有所不同而出現歧義,繼而導出不準確的問題以及結論。但就如孫東所指,HKGAI V3能處理兩文三語,而且所掌握的,乃是香港獨有語境與文化,更為貼地,更能應用。換句話說,HKGAI V3能專為港人服務,而且港人在語言使用上,能夠按照本身的語言使用習慣,極為方便。
從實際應用的角度看,以旗下的「港話通」、「港會通」及「港文通」為例,「港話通」能做到語音查詢,「港會通」可以自動生成會議紀錄;以至於「港文通」能實現政府公文撰寫等功能,並生成文字、表格、數據圖、插圖等。現時,「港文通」已經服務了接近5萬名公務員,並且在深度學習香港公文格式與語言習慣。從政府部門工作而言,「港文通」等工具能夠提升公務員的生產力與效率;從社會大眾而言,善用香港自身的大型語言模型,則能夠應用在工作、學習以至娛樂等層面。
香港要成為國際創新科技中心,本應有屬於自己的大型語言模型,但單單是「有工具」並不足夠,亦要配合適當的數字教育,日前在立法會,就在討論有關「推動香港中小學數字教育,培育未來數字人才」議員議案,教育局局長蔡若蓮指出,局方正就數字教育訂立四大策略方向,分別為:提升學生數字素養、加強教師專業培訓、優化數字教育基建配套,以及深化本地、內地及國際層面在數字教育方面的協作。相關政策目標,是為了讓人工智能融入教育的全要素、全過程、全場景,使人工智能賦能學與教,推動教育高質量發展。
對於香港而言,在應用、教學範疇,使用大型語言模型,在學習中使用、應用人工智能工具,都是相對新鮮的事物。從工具論看,香港已經開始有屬於自己的各種人工智能工具;而從教學看,社會要教育下一代「懂得用AI」而又「不完全依賴AI」,成為駕馭AI而不是被AI駕馭的新生代。在這方面,其實國家的一系列政策,包括《「人工智慧 +教育」行動計劃》等,都非常值得參考,香港要成為國際創科中心,AI工具以至教育,都需要走在世界前沿,讓我們的下一代,成為能順應科技潮流,帶領科技潮流的創科新生代。