聊天機械人和光學字符
識別技術

機器學習:
它們懂得交流、閱讀和瞭解客戶, 提供更好服務。

Story #1

在香港,一個不諳粵語的人會發本地人的一般對話中原來夾雜了不少英文詞彙,但在不久將來,他也能聽懂本地人的對話了。

這就是港式英語(Kongish),是在香港才會出現的一種混合式語言 (請不要把韓語和英語混合的韓式英語Konglish混淆)。對於具備雙語能力的香港人而言,他們能毫無困難地識別出這種自然發展而來的混合語言;但是,對於自動化機器而言,這是一個很大的挑戰。

為了解究這獨特難題,應科院專門建構了一個能將語音轉換為文字的人工智能聊天機械人,並成功實現了商業化。這個研發項目的智能對話系統可以分辨夾雜英語的粵語 (包括術語和俚語)、普通話以至英語,並獲配置及應用在 ─ 2019年標普全球市場財智報告 ─ 全球資產規模位居榜首的中國工商銀行分行當中。

「中國工商銀行每天接收到數以千計的查詢,因而需要一種更加快捷的處理方式。」專門研究語言學、人工智能和大數據分析的應科院工程師馮顥筠女士解釋:「我們的聊天機械人能處理一般銀行業務查詢,例如如何申請信用卡或開設賬戶,這讓中國工商銀行得以騰出人手來處理客戶的投訴或較複雜的需要。」

研發項目的首階段是整理中國工商銀行通常給予新入職者的培訓手冊,以及其他內部文件的所有問題,應科院團隊於是創建了一個樹狀式的試算表,讓每個問題構成初始的主幹,然後視乎可能的答案而分支開去。馮顥筠女士指出,雖然這項工作從零開始用了18個月的時間,但由於團隊現在了解架構和擁有相關的經驗,因此在製作新模型時只需要三分之一的時間。這對團隊很有幫助,因為這可幫助其他銀行在探索這項技術的發展潛力。

應科院的人工智能對話系統的原文檔也能快速更新,以滿足銀行業和混合語言中迅速發展的用語,而這正是該項目別具意義之處。

「教導聊天機械人學習港式英語是最困難的部分。」馮顥筠女士説:「由於我們手上的能被使用做訓練機械人的數據非常有限,所以團隊成員須根據不同的銀行情境進行角色扮演和錄音,然後再轉錄和尋找出其模式。」

目前,這項技術已經掌握港式英語的知識,下一步是開發文本到語音的轉換功能,讓系統能檢測回答用戶的自然方式,並同時教導它如何處理客戶情緒。

為進一步提高客戶服務水平,應科院團隊開發了一個情緒分析儀,它能夠檢測出客戶是否滿意還是已開始失去耐性。如果聊天機械人感覺到客戶越來越惱怒,就會受訓成以更緩慢和平靜的語氣回答。分析儀將因應客戶的説話內容和説話方式來評估,從而作出反應。

這包括侮辱性的話語嗎?馮顥筠女士回答:「這也我們正在研發中。」

聊天機械人是應科院用以快速理解香港獨特語境複雜性的人工智能技術之一。

應科院還研發了手寫中文光學字符識別技術,能識別8,000多個繁體和簡體的手寫漢字、英文鍵入的字母和數字,而且每頁的平均閲讀時間為三秒,準確率達97.12%,比人類高出一個百分點。

光學字符識別技術還配備理解上下文的智能分析,能自動更正本地地址。早前,這項技術配置於金融服務供應商,以盡量減低涉及人手輸入數據的營運成本;目前,這項技術將為不同的政府部門度身定制,包括為創新科技署處理中小型企業科技券計劃的申請,協助紀律部隊例如消防、警隊處理日常文件,及為稅務局處理報稅表等。

應科院多媒體系統及分析副總監鄧羽真博士某天於求職網站進行搜索時,發現數據輸入員有超過2,000份的職位空缺。根據預期薪酬和調整後的營業額作進一步計算,得出的結論是香港每年用於數據輸入的費用超過40億港元。這個痛點很快被確認出來。

「我們的技術可以幫助香港提高效率和節省金錢。」鄧羽真博士説。

這項技術的關鍵賣點是讀取漢字的高準確率。它能讀取4,000個簡體字,準確率為97%;它亦能讀取6,000個繁體字,準確率為98%


鄧羽真博士解釋:「繁體字中的額外筆劃使其更為複雜,而實際上,這正讓機器更容易區分單詞,令結果更為準確更有效率。」

中國漢字數量繁多,而且有許多相似字,因此教導機器學習是一個十分費時的過程。至於中國的許多古老漢字,雖然在其他華語世界中已經過時或不再流行,但是仍然在香港使用。 正如馮顥筠女士和聊天機械人團隊需要研究大量的語言差異一樣,鄧羽真博士的團隊在手寫文字方面也遇到類似的挑戰。

「我們為每個漢字收集許多不同的手寫樣式,並訓練機器採納及學習這些樣式之間的巨大差異。」鄧羽真博士説。

隨着讀取漢字具備更高準確率,研發光學字符識別技術的下一章將朝着穩健可靠的方向發展,因為準確率會隨文檔質素轉差而下降。在未來,我們的最終目標是

讓所有香港人能擺脫繁重和乏味的數據輸入工作,利民便商