自然语言处理

自然语言处理

  • 自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。应科院已经建立了NLP的核心竞争力和技术,并将其应用于各种应用。

     

    技术亮点

    1. 中文自然语言处理器

    香港人独特的书写习惯--在书面语夹杂一些英语词汇、表情符号、地方俚语、口语词汇、行业术语,以及有意或无意的错别字等等,进一步塑造具特色的语言系统。这种前所未有的「混合」表达方法,令分析语言以及相关情绪和情感的过程变得复杂。因此应科院研发了一套中文自然语言处理器(NLP)技术,以便分析这些书面段落内所蕴藏的真正含意。系统除配备内置的广东话口语词库及「混淆词汇集」,来辨别及更改常见的错别字,以便诠释个中的语意。此技术可应用于社交媒体的大数据分析,包括情绪/情感分析、主题分析和语境分析,并可应用于协助教师评估小学生的书写中文,并纠正常见的错误。

    若把自然语言处理器连接到语音识别引擎和对话系统时,即可化身成聊天机械人的应用程式或其他语音互动工具。

     

    1. 智能手机上的多种语言地址识别

    应科院团队成功在智能电话上建构了能够识别多种语言(英、法、德、意、西、葡)短消息中地址信息的正则表达式。团队对每种语言均作了数十万条句子测试,表达式的准确率和召回率均超过85%。有了此项技术,用户可简易地点击智能电话上藏于短讯中的地址资料,并于地图中搜寻。