在人工智能电话机器人中,最为重要的技术当然是人机交互,什么是人机交互技术呢?
人机交互技术(Human-Computer Interaction Techniques)是指通过计算机输入、输出设备,以有效的方式实现人与计算机对话的技术。
人机交互系统的主要组成
1、多模态输入/输出:多模态输入包括键盘、鼠标、文字、语音、手势、表情、注视等多种输入方式;多模态输出包括文字、图形、语音、手势、表情等多种交互信息。
2、视觉合成:使人机交互能够在一个仿真或虚拟的环境中进行,仿佛现实世界中人与人之间的交互。
3、 对话系统:主要由两种研究趋势,一种以语音为主,另一种从某一特定任务域入手,引入对话管理概念,建立类似于人人对话的人机对话。可通过该系统,轻松把握状态信息。
4、知识处理:自动地提取有组织的,可为人们利用的知识。
5、智能接口代理:智能接口代理为实现人与计算机交互的媒介。
主要特点
多媒体系统的交互特点
基于语音的智能人机交互是当前人机交互技术的主要表现形式,语音人机交互过程包括信息输入和输出的交互、语音处理、语义分析、智能逻辑处理以及知识和内容的整合。
与传统用户界面相比,引入了视频和音频之后的多媒体用户界面,最重要的变化就是界面不再是一个静态界面,而是一个与时间有关的时变媒体界面。
人类使用语言和其它时变媒体(如姿势)的方式完全不同于其它媒体。从向用户呈现的信息来讲,时变媒体主要是顺序呈现的,而我们通常熟悉的视觉媒体(文本和图形)通常是同时呈现的。在传统的静止界面中,用户或是从一系列选项中进行选择(明确的界面通信成分),或是用可再认的方式进行交互(隐含的界面通信成分)。
在时变媒体的用户界面中,所有选项和文件必须顺序呈现。由于媒体带宽和人的注意力的限制,在时变媒体中,用户不仅要控制呈现信息的内容,也必须控制何时呈现和如何呈现。
结合语音人机交互过程,可以看出智能语音人机交互关键技术主要如下:
1.自然语音处理技术
包括中文分词、词性标注、实体识别、句法分析、自动文本分类等技术。
2.语义分析和理解
包括知识表示、本体理论、分领域的语义网络、机器推理等。
3.知识构建和学习体系
包括搜索技术、网络爬虫、数据挖掘、知识获取、机器学习等技术。
4.语音技术
包括语音识别、语音合成和声纹识别等。
5.整合通信技术
包括跨平台即时通讯整合技术、超大负载消息集群处理技术、移动客户端开发技术。
6.云计算技术
包括海量数据分布式存储、统计和分析技术。
智能语音人机交互技术在典型行业的应用
语音交互方式替代文本交互方式,可以增强信息输入方式,能和更多的设备进行整合,市场前景广阔。目前,智能语音人机交互技术已经广泛应用到电话销售、智能客服、智能终端等领域,切实深入到人们的生活。
VR系统中人机交互的特点
人机交互可以说是VR系统的核心,因而,VR系统中人机交互的特点是所有软硬件设计的基础。
其特点如下:
观察点(Viewpoint) 是用户做观察的起点。
导航(Navigation) 是指用户改变观察点的能力。
操作(Manipulation)是指用户对其周围对象起作用的能力。
临境(Immersion) 是指用户身临其境的感觉,这在VR系统中越来越重要。
VR系统中人机交互若要具备这些特点,就需要发展新的交互装置,其中包括三维空间定位装置、语言理解、视觉跟踪、头部跟踪和姿势识别等。
多媒体与VR系统的人机交互有着某些共同特点。首先,它们都是使用多个感觉通道,如视觉和听觉;其次,它们都是时变媒体。
-
2024-06-12
-
2024-06-03
-
2024-05-22
-
2024-05-22
-
2024-05-09