中国自然语言处理白皮书
可以设计形如I am ? You are的规则,当检测到用户输入为 I am John时,用规则进行替换,生成输出You are John。这种系统一般不能用于完成特定的信息获取任务。
研究人员迄今已经探索不少对话管理技术,包括基于有限状态自动机的方法、基于语义框架的方法、基于代理的方法和基于统计的方法等。
基于有限状态自动机的方法适用于结构化较好的任务。其对话进程是预先设定好的,用户只能按预定的顺序回答系统的提问,以提供任务信息。这种对话管理技术不能处理语言理解的不确定性,灵活性较差,用户体验不好。
基于语义框架的方法允许用户以较为灵活的方式进行对话。系统能根据当前语义框架的状态来提出下一个问题,也可以处理一些语言理解部分的不确定性输入,但是系统的控制算法通常较复杂。
基于代理的方法将对话建模成两个代理通过协作来完成任务。代理具有推理能力,可以进行错误检测和纠正,可以实现混合主导型对话。但是这种系统需要大量专家知识来构建逻辑推理系统,构建成本高。
基于统计的方法,主要指的是基于马尔可夫决策过程MDP(Markov Decision Process)的方法。MDP需要状态完全可观测,而在状态不完全可观测时,可以采用部分可观测马尔可夫决策过程POMDP(Partially observable Markov decision process)。POMDP模型将人机对话建模成一个在不确定状态序列下取得最大长期回报的决策问题。因此,它具有建模语音识别和语义理解中存在的不确定性的能力,也可以建模系统产生的对话语言给对话带来的长期影响。POMDP模型从数据中学习模型参数,进行策略求解,其求解算法的复杂性较高。目前,简单的应用系统多采用基于有限状态自动机的方法,而基于POMDP的方法得到更多的研究关注。
10
中国自然语言处理白皮书
虽然有上述多种对话管理技术,但是由于对话系统的复杂性,对话管理不仅要通过对话获取任务信息,还要有效地引导整个对话过程,为用户带来好的用户体验。同时,考虑到对话还处于语音识别和语言理解技术目前仍不完美的条件下,因此,对话管理需要处理的难点问题还比较多,以下仅列出其中几个。
轮次交替问题:对话的一个典型特点是存在对话双方或多方的交替发言,交替形式也多种多样。比如,双发对话时可能一方轮流说一句,也可能出现某方连续说几句的情况。因此,在口语对话时,很重要的一个问题就是要决定机器在何时开始说话。简单的基于物理信号,如设置静默等待时间等方式,在很多预订信息服务中是不可行的。因为,在这些服务中,用户经常需要进行现场考虑。如果设置的等待时间过短,用户可能还正在考虑,并没有完成表述;而等待时间过长,用户会觉得对话不流畅,用户体验不好。而基于内容的轮次交替还依赖语音识别和语言理解的性能。
主题转换问题:即使在面向特定任务的对话中,一次完整的对话也很可能需要涉及多个不同的主题。例如,在预订会议室的对话中,双方至少需要涉及到会议召开的时间、地点、人数、预算等若干不同主题的内容。对话管理需要能随着对话的进行完成各个主题中相应信息的获取任务。在对话时,无论不同主题间是否存在依赖关系,对话都需要在不同的主题间跨越。因此,在对话时,决定何时从一个主题转换到另一个的主题,是用户管理需要完成的一个重要任务。进而,友好的人机交互在允许机器主导主题转换的同时,也应该允许用户自主进行主题转换,而此时,对话管理需要依据其状态决定是否跟随进行主题的转换。
任务变化问题:目前的任务型对话管理大多是针对特定(类型)任务的,构建对话管理模型时需要对任务需求进行明确的定义,以使任务中可能涉及的主题在规定的范围中变化。但是,现实世界的任务有
11
中国自然语言处理白皮书
无穷多种(类型),如何使一个对话管理模型能快速适应新的任务(类型),是一个需要进一步探索的问题,这个问题与汉语切分中语料领域和风格发生变化时如何保持系统性能稳定类似。
3.3 小结
从上面的介绍可以看到,面向特定任务的人机对话系统在任务明确定义时可以较好地完成获取信息的任务。但是,对话过程的管理还有很多需要提高的,尤其在语音识别和语义理解还存在不确定性的条件下。因此,目前情况下,希望得到在大范围内具有人-人对话体验的人-机对话系统还是不太现实的。
12
中国自然语言处理白皮书
第4章 总结
前面两章分别介绍了汉语切分技术和人机对话系统的现状,并进行了一些分析,本书不打算也不可能逐一对各种技术和应用都进行单独的分析。总体而言,自然语言处理的研究和应用在各个方面都处于持续发展中,这种发展的趋势在近几年尤为有力。因为自然语言处理领域在近几年出现了一个非常好的发展时期。具体表现在如下几个方面。
由于来自互联网产业和传统产业信息化的各种应用需求的推动,更多的研究人员和更多的经费支持进入了该领域,有力地促进了自然语言处理技术和应用的发展。
语言数据的不断增长、可用的语言资源的持续增加、语言资源加工能力的稳步提高,为研究人员提供了发展更多语言处理技术、开发更多应用、进行更丰富评测的平台。
机器学习技术,尤其是近年来深度学习技术的飞速发展,刺激了对新的自然语言处理技术的探索。同时,来自其他相近学科背景、来自工业界的人员的不断加入,也为自然语言处理技术的发展带来了一些新思路。
计算和存储设备的飞速发展,提供了越来越强大的计算和存储能力,使得研究人员有可能构建更为复杂精巧的计算模型,处理更为大规模的真实语言数据。
在这些有利条件的支持下,我们相信自然语言处理技术在未来会继续取得更多地成果,相信自然语言处理技术是值得大家期待的技术、能产生不断满足大家期待的新应用。
但是,另一方面,我们也希望大家在看到自然语言处理技术的进展时有一个清醒的认识。以下以语义分析为例阐述这点。
语义分析是当前自然语言处理研究的一个核心。研究人员在词
13

