立場新聞 Stand News

為何港產 chatbot 都「九唔搭八 」?

2019/2/20 — 17:12

資料圖片,來源:mohamed_hassan @Pixabay

資料圖片,來源:mohamed_hassan @Pixabay

【文:Tech 界打工女】

昨晚收到短訊提示,提醒我有一張久未使用的信用卡要繳年費了。本來只需致電有關銀行的音頻電話,輸入幾項個人資料便可以豁免,但對我這個能用打字絕對不撥電話的自閉青年來說仍是覺得麻煩。忽然想起這間銀行在去年年中推出了 chatbot,當時試用,十個問題,八個答案都是:「對不起,我不明白。」經過半年的學習,不知有否好轉?

我問 chatbot:「信用卡唔用洗唔洗收年費」

廣告

它答:「取消或終止信用卡並沒有額外收費……」

答非所問,不過對曾經為公司建立 chatbot 的我而言,深深明白起一個 chatbot 簡直比穿過十八層地獄更難,主要原因有三:

廣告

第一:廣東話是一種千變萬法的語言

Chatbot 其實就是一個龐大的圖書館,而你要找任何書籍,必須告訴門口的圖書館管理員 — 但他不一定明白你要的是甚麼 。建立 chatbot 最難的部份是令他理解客戶的回應或問題,相比起用英文,廣東話博大精深令 chatbot 更摸不著頭腦,例如簡單的「你是否要繼續查詢?」客戶可以用以確認的英文字句有「YES」、「YA」、「YUP」,或者否定的「NO」、「NOPE」、「NAH」,而他們都有共通點,就是大部份確認的答案都是以英文字母「Y」開始 ,而否定的由「N」開始。加入這條規則便可以大大提高 chatbot 的準確性。而廣東話來說,單是確認的答案可以是「好」、「係」、「要」,若果要 chatbot 學懂,需要逐個教它,還不能與否定的字攪混,像是「唔係」、「唔好」,明明都出現了之前確認的字眼,也沒有空格,卻要要強行告訴 chatbot 這是否定。因此,廣東話 chatbot 需要的字庫比英文廣很多,而且很多時候需要 exact match。

第二:香港普遍使用的語言很多,而且打字都很「求其」

除了廣東話外,香港人最常用的語言是「Chinglish」,也很喜歡中英夾雜,還很多錯字和同音字。當年起 chatbot 時,見過有一句客人打「gum loi?」你和我都明白這是「咁耐?」的意思,但作為三歲小孩的 chatbot 不知道,媽媽我也只能強行教授,或是放棄處理一些不甚普遍的答法。「可否去 branch 攪 ?」別看這句簡單問題,裏面包含了書面語、英文、廣東話;「便 D 得唔得?」我沒打漏字,這是千真萬確客人想要「便宜點」但又打漏字,令 chatbot 摸不著頭腦的另一例子。

第三:以廣東話為基礎的人工智能資源很少

Chatbot 的基本其實是一個自然語言處理器(Natural Language Processing,縮寫 NLP)。NLP 就好比一個上過幼兒園的小孩,明白基本的字與句的關係,還有一些問題的問法,當技術人員再加入一些與公司相關資料和相應答案,他便會真正理解客戶真正意思。例如「客戶服務熱線是甚麼?」Chatbot  在 NLP 幼兒園已經學會「是甚麼?」代表句子一個問題而沒有實際作用,因此就會主力尋找「客戶服務熱線」有關的資料。以英文為基礎的 NLP 不少,但廣東話為基礎的寥寥可數;公司自行研發一個吧,不願意投入金錢時間。當大公司仍然覺得 IT 狗只是修理影印機而成為裁員的第一個部門,其實已經犧性了節省人力又滿足客戶 24 小時要求的機會。

 

作者自我簡介:你驚被電腦取代?首先你要了解他,然後成為控制他的主人。

發表意見