由于传统智能家居系统在控制、交互方式等方面尚不能达到自然的人机交互,因此本章针对智能家居应用领域设计智能家居问答系统,分别从智能家居系统概述、问答知识图谱、问题理解三方面介绍智能家居的问答系统技术实现构成。
2.1 智能家居系统概述
智能家居是与普通民众生活关系最密切的领域之一,通过方便、灵活、自然的控制方式使智能家居系统更好的为人们提供服务,是实现智能家居自然、友好交互的重点研究任务。
2.1.1 智能家居系统
智能家居技术是采用计算机技术、物联网技术等,实现对家电系统、照明系统、开关等家居设备的联合控制。本文对智能家居系统应用情况进行总结,得出如图2-1所示的智能家居系统构成。首先,通过无线传感器将各种智能家电数据进行汇总并传入数据管理中心;用户可通过移动APP对家居设备远程控制。目前,智能家居以普遍满足人们对智能生活的一般性需求,然而“以用户为中心”、能满足用户个性化需求的智能家居研究相对较少。
图2-1 智能家居系统
Fig 2-1 Smart home system
随着智能家居应用的逐渐普及和推广,对于其控制方式的研究也日益增多。其中,在有线和无线控制、近程、远程和手动控制及先进智能控制等各方面均有研究。以ZigBee为代表的无线组网技术,能最大程度减少智能家居的繁琐布线;远程控制方面,运用手机APP平台,通过短消息或者即时通讯对家庭及家电运行情况进行远程监控;在智能控制方面,将人工智能技术应用到智能家居,有效提高了对智能家居中危险物品状态的监控,从而使智能家居系统更加安全有效的运行。
2.1.2 智能家居控制方式
从智能家居的发展情况来看,其控制方式的演变、提升促进了智能家居技术的应用,其先后经历了传统智能家居、无线通信智能家居、人工智能智能家居三个阶段。在不同的控制阶段,智能家居也使用不同的控制方式:传统智能家居阶段大多采用液晶屏、按键、遥控器、触摸屏等方式;在无线通信控制阶段大多采用以Zig Bee、蓝牙、RF433等方式;在人工智能阶段以虚拟人像、机器视觉、语音交互等新的方式正在逐步得到深入应用。智能家居控制方式如表2-1所示。
表2-1 智能家居控制方式
Tab2-1 The smart home control mode
发展阶段 |
控制方式 |
典型应用 |
应用分析 |
传统智能家居 |
触摸屏、遥控器、液晶显示屏、触摸面板等 |
AMX系统、 C-Bus系统、 Crestron系统 |
操控范围小; 实现成本低; 可以控制电脑、电话、音视频设备、安全监控设备、照明设备等 |
电线控制方式 |
X-10 |
不用额外布线; 施工困难、费用高; 系统扩展性差,可复用性低 |
中央控制方式 |
EIB |
可靠性较高; 施工难度大、技术要求较高; 实施工期长 |
集中控制方式 |
8X |
可扩展性强; 成本低且技术成熟; 具有远程监控的优点; 系统灵活性较差; 实施较为复杂 |
无线通信 智能家居 |
无线与有线相结合 |
U.home |
功能较多; 操控简单; 系统稳定性高; 工程实施难度大; 费用昂贵 |
无线射频方式 |
GBK系统 |
系统不用布线; 实施简单; 功能简单,操作灵活; 产品技术高端; 价格昂贵,实施工期长 |
人工智能 智能家居 |
虚拟人像交互、 |
微软虚拟人像交互系统 |
技术先进; 操控简单; 使用灵活; 设备匹配度较低 |
智能手表方式 |
Apple Watch |
手机APP |
HomeKit |
2.2 智能家居问答系统知识图谱
2.2.1 知识图谱
知识图谱(Knowledge Graph)是将知识表示成结构化的形式,运用概念、实体、关系表示知识。知识图谱的建立为互联网信息的表达提供了更好的组织、管理和理解的方法,进而促进了当下互联网语义搜索的发展。同时,知识图谱建立了新的知识存储方式。
语义网络是知识图谱的理论来源之一,其基本结构是<实体,关系,实体>,由三元组相互关联构成语义网络。其中,以实体为节点,关系为边,两两结合相互关联。例如:山东的省会是济南,其中的三元组为<山东,省会,济南>,青岛位于山东,其中的三元组为<青岛,位于,山东>,那么以上三元组相互关联,可得出济南和青岛在同一省——山东的事实。
知识图谱技术是知识图谱建立和应用的方法。知识图谱技术融合当下热门技术点,包括:NLP、数据挖掘、机器学习、认知计算、知识表示与推理、信息检索和抽取,是一门交叉研究技术。知识图谱的应用价值主要体现在:知识融合、语义搜索和推荐、问答和对话系统、大数据分析与决策。
2.2.2 知识图谱技术
知识图谱技术包括图谱构建技术、图谱查询和推理,其技术架构如图2-2所示。
1、知识图谱构建
知识图谱构建包括知识表示、实体识别、实体关系抽取等。其中,知识表示与建模是指将客观世界中的知识表示成结构化的形式,通过构建概念、实体及其对应关系来更好的表示知识。对知识进行有效、准确的表示从而使知识更接近人类的认知形式,为互联网时代大规模信息的有效应用提供必要前提。
图2-2 知识图谱技术
Fig2-2 Knowledge graph technology
2、知识图谱查询和推理计算
(1)知识存储和查询
知识存储一般采用RDF存储或图数据库(Graph Database)进行存储。其中,RDF格式存储就是以三元组的形式存储数据,但是该存储方式会导致三元组检索效率低下。为了有效提高检索效率,查询快速便捷,结果可视化,大多数研究者采用图数据库进行存储。
(2)知识推理
知识推理包括:在现有知识图谱的基础上推导实体跟实体间的新关系,推理给定关系的另一实体。知识推理方法有符号的推理和统计的推理两种。目前,知识推理在工业应用种多采用基于规则的知识推理,知识推理功能仍有较大提升空间。
2.2.3 基于知识图谱的问答系统
问答系统(Question Answering,QA)是指让机器自动回答用户所提出的问题。Siri、 Google Now、Cortana、小冰等、智能音箱(Home Pod、Alexa、叮咚音箱、公子小白等)等是新一代问答系统的代表应用。其中,以IBM Watson自动问答机器人为首的百科对话机器人,以强大的知识库为支撑,在业内引起巨大反响。
尽管,现有问答系统已经能够满足人们大部分的需要,但是其核心技术仍然局限在传统的基于“检索+抽取”的问答模式,并未对文本语义进行深层次的处理和分析,无法模仿人类实现深层逻辑推理。因此,距离自然的问答交互系统仍有较大差距。
随着知识图谱的广泛应用,知识图谱问答引起广泛关注。知识库问答技术主要分为两类:基于语义解析(Semantic Parsing)的知识库问答方法;基于检索排序的知识库问答方法。
知识图谱问答的算法框架:
(1)获取用户的自然语言问句,如:
l 小明家的空调是什么牌子?
l 人们经常购买的电视品牌有哪些?
(2)对问题的自然语言分析
l 对问题的自然语言分析是常见的自然语言分析处理场景,主要包括对问题的分词处理,将问句的长文本序列切分为以词语为单元的词语文本序列。以“小明家的空调是什么牌子?”为例,其分词结果为“小明家 / 的 / 空调 / 是 / 什么 / 牌子 / ?”;
l 然后将词语序列中的无关词汇剔除,如“的”,得到“小明家 / 空调 / 是 / 什么 / 牌子 / ?”;再者,对词语进行核心词汇提取,获取序列中的实体“小明家”、“空调”“牌子”,考虑到自然语言表达的多样性,对问句中的口语词汇进行去口语化处理,即“牌子”为“品牌”;
l 最后,得到问题三元组<空调,品牌,小明家>;
(3)答案检索匹配
根据第二步得到的问题三元组,在知识图谱中匹配对应答案<空调,品牌,小明家>,<空调,品牌,海尔>,得到小明家的空调品牌为“海尔空调”,最后将“海尔空调”返回给用户。
2.3 智能家居问答系统问题理解
问题理解是针对用户问句采用NLP语义分析技术进行深入分析,是问答系统能否对用户问题给予准确应答的关键。
2.3.1 词法和句法分析
在自然语言处理中,句子语义分析是对文本理解的第一步。词法分析、句法分析和语义分析是分析的主要方法。中文词法分析(lexical analysis)是指分词、词性标注两部分。句法分析(syntactic parsing)是句法结构分析,最常见的三种方法是:短语结构句法分析(phrase-structure syntactic parsing)、依存句法分析(dependency syntactic parsing)、深层文法句法分析。以图2-3中的例句为例进行词法、句法分析[62]。
图2-3 词法和句法分析
Fig 2-3 Lexical and syntactic analysis
例句:“请帮我把空调打开。”的中文分词结果为“请 / 帮 / 我 / 把 / 空调 / 打开 / 。”由句法分析图可知:“请”和“帮”为VOB动宾关系,“帮”和“打开”是VOB动宾关系,“打开”是“帮”的直接宾语。常用句法结构关系如表2-2所示。
表2-2 句法解析
Tab 2-2 syntactic analysis
标记 |
关系 |
标记 |
关系 |
SBV |
主谓关系 |
DBL |
兼词 |
VOB |
动宾关系 |
ATT |
定中关系 |
CMP |
动补关系 |
HED |
核心关系 |
2.3.2 语义理解
语义分析借助语义分析模型,对句子和篇章等内容进行自动语义分析。
1、词汇层面上的语义分析
词义消歧是一个多义词通过上下文来确定词的意义。
词义表示和学习可以通过词语之间的路径信息或者另一种是词的向量化表示。
2、句子级语义分析
语义分析包括浅层和深层语义分析两种。浅层语义分析即语义角色标注(Semantic Role Labeling,简称SRL)。深层语义分析是将整个句子转化为依存语义表达式。如图2-4所示为句子语义分析示意图。
图2-4 句子级语义分析
Fig 2-4 Sentence-level semantic analysis
表2-3 语义依存关系
Tab 2-3 semantic analysis
标记 |
关系 |
标记 |
关系 |
Agt |
施事关系 |
Pat |
受事关系 |
Exp |
当事关系 |
Cont |
客事关系 |
Aft |
感事关系 |
Datv |
涉事关系 |
Comp |
比较关系 |
Accd |
依据关系 |
Loc |
空间关系 |
Proc |
历程关系 |
2.3.3 问题分类
问题分类作为文本分类的一种特殊应用,在自然语言交互系统中具有重要意义。问题分类是问答系统做出准确应答的关键步骤,针对智能家居问答系统应用场景设计智能家居问答系统分类器。问题分类方法主要有:基于规则的分类、基于机器学习的分类、基于神经网络的分类。
1、基于规则的分类方法
基于规则的分类模型包括Random Forest算法、Decision Tree算法等。以决策树为代表的基于规则的文本分类算法,是将分类器设计为一种组合分类器,决策树组合在一起,投票得出最终分类结果。首先,构造决策树训练数据集l针对棵决策树分别构建与之对应的训练数据集;重复决策树生成随机森林。将每棵树的结果进行汇总,得票数最多的类为输出结果。
2、基于机器学习的分类方法
机器学习分类方法包括Naive Bayes、逻辑回归、Support Vector Machine, SVM、最大熵分类器等。机器学习处理问题分类的方法:通过分析问句的词语特征、词性特征,并利用SVM对问题分类,设计层次分类器。为了提高分词的准确性,利用句子各个部分的关系,研究人员利用句法分析对问题进行分类。
3、基于神经网络的方法
同语音信号、图片信号一样,文本序列也可借助神经网络进行处理,并取得了显著效果。在传统文本处理的基础上,基于深度学习的分类方式,经过对文本的预处理、文本表示、特征选择,利用神经网络构建RNN、CNN网络,构建RNN循环神经网络分类模型或者CNN卷积神经网络分类模型,实现文本的特征学习和分类,是问题分类的前沿技术。
2.4 小结
本章介绍智能家居问答系统的主要技术。分别从智能家居系统概述、问答知识图谱、问题理解三方面介绍智能家居问答系统技术实现构成。其中,通过对智能家居控制方式的研究,确定本文采用问答方式实现对家居设备的控制;通过对知识图谱、知识图谱技术、基于知识图谱的问答系统三个方面逐一阐述直接家居问答系统知识图谱的主要技术要点;最后通过对问答系统问句的词法和句法分析、语义理解、问题分类阐述智能家居问答系统的问题理解的算法实现研究点。