
近年香港特區政府以及香港數碼港除了致力吸引科技巨企在港落地生根,也積極培育和鼓勵初創企業發展新技術,將研發技術應用於日常生活不同方面,讓大眾更廣泛地接觸生成式人工智能(GenAI),生成式AI的應用和普及化勢必推進新質生產力發展。近年生成式人工智能發展迅速,為多個領域帶來顯著突破。首間自主研發的廣東話大語言模型、生成式人工智能Votee AI誕生,有望為在香港市民提供更「接地氣」的選擇,尤其可以引入廣東話使用,讓廣東話、客家話、上海話等語言得以應用,有望成為語言學習和文化傳承的新載體。
自動語音識別高效轉換為文字
Votee AI行政總裁丁柏生接受香港文匯報訪問時介紹,Votee AI是一間在香港成立的人工智能(AI)公司,運用AI和機器學習技術,專門為企業提供度身訂做的人工智能諮詢、培訓和解決方案。解決方案套件包括運用生成式人工智能生成各種內容,以及運用自動語音識別技術高效轉換語音為文字。
丁柏生指出,Votee AI於2023年得到數碼港創意微型基金的支持,入選2024世界人工智能大會「未來之星100強」,公司專注於運用人工智能和機器學習技術進行市場調查,並剛於今年6月推出自主研發的廣東話大型語言模型,協助機構將生成式人工智能科技結合廣東話功能,應用於顧客服務等業務場景。公司其他解決方案包括度身訂做的企業對消費者(B2C)市場調查、企業的軟件開發套件(plug-in SDK)、輿情監察(social listening)等。
丁柏生提到,作為廣東話大型語言模型,Votee AI參考了不同網站和討論區,整合超過10年的廣東話相關數據,並於今年6月推出自主研發的廣東話大型語言模型(LLM)。其中收錄廣東話例子包括條條Fing/吊吊揈、呢咁hea/捩咁棄,名詞有燈膽、風筒、雪糕等。
開發琉球爪哇等小眾方言模型
Votee AI技術總監陳豪傑稱,Votee AI專門為不同地區的小眾和冷門語言研發大型語言模型,使較貧困、缺乏資源的當地人民也能使用人工智能。Votee AI目前亦有在東南亞和非洲發展,計劃為當地方言開發大型語言模型,例如日本的琉球語和印尼的爪哇語等。Votee AI已應用於不同企業,如各大銀行及生產力促進局,並為政府部門提供AI聊天機器人服務,把收集查詢及意見的過程自動化。
Votee AI於7月參加了在上海世博中心舉辦的「2024世界人工智能大會」,在大會期間,不少內地公司接觸過 Votee AI,了解大型語言模型並商討為其公司開發當地方言如上海話、客家話和藏語語言模型的可能性。至於與其他廣東話大型語言模型比較的優勢,陳豪傑指出,模型經過廣東話各種語境的訓練,能夠理解更口語化、更地道的用詞,從而減少客戶在使用Votee AI的生成式AI科技生成內容時的錯誤和誤解。再者,該語言模型還能快速學習廣東話最新的流行用語,展現其適應能力。
陳豪傑補充,可應用層面遠不止於此,還可作為生成式AI應用程式(Generative AI Apps),以母語級別的語言能力增強創意內容生成。亦可以用作AI接待員(AI Receptionists),為廣東話使用者提供無縫、自然的互動。同時亦可作為教育工具(Educational Tools),為外籍學生在學習廣東話時提供個人化學習支援。
(來源:香港文匯報)


