在对话交互系统中推断搜索输入中的用户意图的方法和系统
2019-11-22

在对话交互系统中推断搜索输入中的用户意图的方法和系统

本发明公开涉及在对话交互系统中推断搜索输入中的用户意图的方法和系统。公开了在对话交互系统中推断搜索输入中的用户意图的方法。推断搜索输入中的用户意图的方法包括提供描述用户偏好的用户偏好签名、从用户接收要被用户用于识别至少一个期望的项的搜索输入,并且确定搜索输入的一部分包含歧义标识符。该歧义标识符要被用户用于至少部分地识别期望的项。该方法还包括基于搜索输入的部分与由用户偏好签名描述的用户偏好匹配而推断歧义标识符的含义并且基于将搜索输入及所推断的歧义标识符的含义与和内容项相关联的元数据的比较而从一组内容项中选择项。

关系或连接引擎1010是起理解用户输入以提供针对性响应作用的模块之一。该关系引擎可以以多种方式实现,图形数据结构是其中一个例子,使得我们可以通过名称图形引擎来调用关系引擎。图形引擎在已知实体之间加权连接的背景下评估用户输入。

3.由于实体识别是成功的(例如,根据早期的交互),我们考虑以下情况:

人的发现渠道的节目。

3.由于实体识别是成功的(例如,根据早期的交互),我们考虑以下情况:

用户:货币市场如何?

其核心本质上是请求响应系统的当前系统试图提供诸如响应用户问题的对话方式的界面,如下:

Q5:她的近期电影有哪些?

根据本发明的某些实施例访问信息库的说明性例子

在对话交互系统中推断搜索输入中的用户意图的方法和系统

本发明公开涉及在对话交互系统中推断搜索输入中的用户意图的方法和系统。公开了在对话交互系统中推断搜索输入中的用户意图的方法。推断搜索输入中的用户意图的方法包括提供描述用户偏好的用户偏好签名、从用户接收要被用户用于识别至少一个期望的项的搜索输入,并且确定搜索输入的一部分包含歧义标识符。该歧义标识符要被用户用于至少部分地识别期望的项。该方法还包括基于搜索输入的部分与由用户偏好签名描述的用户偏好匹配而推断歧义标识符的含义并且基于将搜索输入及所推断的歧义标识符的含义与和内容项相关联的元数据的比较而从一组内容项中选择项。

在这个例子中,尽管用户从来没有使用单词“等级”,但是系统基于以下更详细描述的一组规则和/或朴素贝叶斯分类器(naiveBayesclassifier)根据单词“能…看”推断出用户正在寻找等级。同时,“我的女儿”可以被识别为属性。为了女儿看节目,必须满足若干个标准:节目时间、节目的可获得性以及“可看性”或等级。这种条件也可以被其它属性触发,诸如“儿子”,“女孩”,“男孩”等。在这种情况下,这些可以是用来查找等级或节目时间的基于规则的特定于领域的意图或者基于特定于领域的训练集合的朴素贝叶斯分类器评分。也可以存在用于由正在被观看的实体驱动的这些条件的可满足性的权重因子。

本发明的优选实施例包括用于推断用户的意图并在对话交流中满足该意图的方法和系统。某些实现能够解决用户输入中的歧义、维护与对话交流相关联的意图、实体和/或属性的状态、修改响应以匹配用户的偏好、推断开始新话题的对话边界(即,推断对话会话的变化)和/或进行最少的对话来理解用户意图。随后的概念用于描述本发明的实施例。信息库

技术领域

实体识别器10〇7利用以上提到的输入来识别用户输入中的实体。实体的例子是我能看TomCruise的电影吗”中的“TomCruise”,或“WhereEaglesDare是什么时候发行的”中的“WhereEaglesDare”。在某些实现中,实体识别器1007可以是规则驱动的和/或贝叶斯分类器。例如,诸如名词和动名词的语言元素可以被指定为一组规则中的实体,或者关联可以在对贝叶斯分类器的监督训练过程期间产生。实体识别可以可选地包括对用户输入中的错误(诸如在语音文字转换识别中的错误)进行错误纠正或补偿。当输入在语音上与两个实体,例如newman和neuman,匹配时,则两者都被挑出作为可能的候选者。在一些实施例中,这两者之间的解析来自从用户输入的其余部分收集到的信息,其中实体之间的关系可以剔除其中一个可能性。将用户输入的子集归类为实体只是加权。可能存在如下情形,其中输入可以作为实体和作为属性这两者被评分。在许多情况下,由于随着用户输入的后续处理句子语义变得更加清晰,因此这些歧义得以解决。在某些实施例中,用于解析的组件是实体关系图。在某些实现中,实体识别器1007的输出是要成为实体的输入子集的概率评分。特定于应用的属性搜索引擎1011识别诸如“最近的”、“近期的”,“像..•一样”等的属性。这里,又一次,可能存在与实体的冲突。例如,“TomorrowNeverDies”是实体(电影),并且,当在句子中使用时,可能存在歧义将“tomorrow”解释为属性。如通过实体关系图所确定的(这可能取决于输入的其它元素,例如,单词“电影”、“节目”、“演员”等),tomorrow作为属性的评分可能比“tomorrow”作为“TomorrowNeverDies”的一部分的评分低。属性搜索引擎1011的输出是输入单词的概率评分,类似于实体识别器10〇7输出的概率评分。

本文所列出的实体、关系和属性只是说明性的,并不是要成为穷尽的列表。

另一方面,人类通过语句最基本的属性自然地认识到这种大幅的领域切换,并相应地做出响应(例如,“我们要订比萨吗?”)。即使在到新领域的过渡不是那么明显的偏远场景中,人类参与者会犹豫,但是很快就从第一说话者的反馈中恢复(“哦,不,我的意思是我饿了-我想吃东西!”)。对话中人类认为理所当然的这些细微但重要的对话元素是人与人对话的丰富性和与自动化系统对话的丰富性的区别所在。

以上列出的任何方面都可以与以上列出的任何其它方面和/或与本文所公开的技术结合。

于2013年5月1日提交的标题为“MethodofandSystemforInferringUserIntentinSearchInputinaConversationalInteractionSystem的美国专利申请No.13/874,523;

A2:这里是一些DustinHoffman的电影…。

在还有的例子中,假设用户想知道由指定的演员实体ScarlettJohansson和在指定的电影实体StarWars中扮演指定角色〇bi-WanKenobi的未指定的演员实体主演的电影(意图)。在这个例子中,隐含实体是演员实体“EwanMcGreg〇r”并且得到的结果实体是由“ScarlettJohansson”和“EwanMcGregor”主演的电影“TheIsland”。图8说明利用本文所公开的技术分析来得到期望结果的实体和关系的图形800。具体而言,隐含的演员实体EwanMcGregor805经与至少一个电影实体StarWars815的“在其中扮演”关系810和经到人物实体Obi-WanKenobi825的人物关系820得出,其中人物实体〇bi-WanKenobi8¾又经人物关系830关联到电影实体StarWars815。同时,结果实体TheIsland835经演员/名人实体ScarlettJohansson845与电影实体TheIsland835之间的“在其中扮演”关系840以及隐含的演员实体EwanMcGregor8〇5与电影实体TheIsland之间的“在其中扮演”关系850得出。