1
人机交互发展史
1、概念
人机交互(Human-Computer Interaction, HCI),作为一个术语,首次使用是在由 Stuart K. Card,Allen Newell 和 Thomas P. Moran 撰写的著作“The Psychology of Human-Computer Interaction”里,它是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分,用户通过人机交互界面与系统交流,并进行操作。人机交互技术是计算机用户界面设计中的重要内容之一,它与认知学、人机工程学、心理学等学科领域有密切的联系。人机交互技术的发展与国民经济发展有着直接的联系,它是使信息技术融入社会、深入群体,达到广泛应用的技术门槛。任何一种新交互技术的诞生,都会带来其新的应用人群、新的应用领域,带来巨大的社会经济效益。从企业的角度, 改善人机交互能够提高员工的生产效率,学习人机交互能够降低产品的后续支持成本。在个人的角度,可以帮助用户有效地降低错误发生的概率,避免由于错误引发的损失。在现代和未来的社会里,只要有人利用通信、计算机等信息处理技术进行社会活动,人机交互都是永恒的主题,鉴于它对科技发展的重要性,人机交互是现代信息技术、人工智能技术研究的热门方向。2、发展历程
过去的几十年间,人机界面经历了从命令行界面到图形用户界面两个主要发展阶段的演变;近年来,人机界面的发展越来越强调交互的自然性,即用户的交互行为与其生理和认知的习惯相吻合,随之出现的主要的交互界面形式为触摸交互界面和三维交互界面。2
技术发展方向
目前,人机交互技术主要发展方向包括以下几个类别:触控交互、声控交互、动作交互、眼动交互、虚拟现实输入、多模式交互以及智能交互等。1、触控交互
显示器从仅向用户输出可视信息到成为一种交互界面装置主要是归因于触控功能与显示器的一体化模式,尤其是在移动装置上的使用。目前有四种技术方式能实现触控交互。
电阻式触控技术电阻触摸屏通过压力感应原理来实现对屏幕进行操作和控制。当手指触摸屏幕时,薄膜下层的 ITO 会和玻璃上层的 ITO 有一个接触点,在 X 轴方向就其中 一面导电层导通了 5V 均匀电压场,此时采样得到的电压由零变为一个正电压值, 感应器检测到电压导通,传出相应的电信号,进行模/数转换,最终将转换后的 电压值与 5V 相比,即可计算出触摸点的 X 轴坐标值。同理可以计算出 Y 轴的 坐标值,这样就完成了点选的动作,并呈现在屏幕上。2、声控交互
语音识别语音识别是将音频数据转化为文本或其他计算机可以处理的信息的技术。主要由 4 个部分组成:特征提取、 声学模型、语言模型和解码器搜索。3、动作交互
目标直接的动作选取要求用户通过接触目标位置的方式对其进行选取,例如在增强现实应用中,用户通过以手部接触的方式完成虚拟物体的选取。间接的目标选取方式则需要用户通过身体部分的位置和姿态来控制和移动光标,再借助光标指示目标的位置进行选取。其中,一个广泛应用的光标控制方法是光线投射。手势识别手势可定义为人手或者手和手臂相结合所产生的各种姿态和动作,它分为静态手势(指姿态,单个手形)和动态手势(指动作,由一系列姿态组成),前者对应模型空间里的一个点,后者对应一条轨迹。相应地,可以将手势识别分为静态手势识别和动态手势识别。姿势识别姿势识别常用的算法有三类:(1)基于模板匹配的身体姿势识别方法;(2)基于状态空间的身体姿势识别方法;(3)基于语义描述的身体姿势识别方法。4、眼动交互
利用人工智能技术提高眼动计算的精度和效率,对人的感知和认知状态进行深入理解,构建“人在回路”的智能人机交互框架,实现用户主导的自动化系统、基于人机共生的 AI 系统。5、虚拟现实输入
文本输入作为应用中重要的交互技术,为应用提供了重要的交互体验。目前已经开发 了多种适用于虚拟现实的文本输入技术,现有的 VR 文本输入技术主要有实体键盘技术、虚拟键盘技术、新型输入技术(手部输入技术、圆形键盘输入技术、立体输入技术)。6、多模态交互
不同形式的输入组合(例如,语音、手势、触摸、凝 视等)被称为多模态交互模式,其目标是向用户提供与计算机进行交互的多种选择方式,以支持自然的用户选择。相比于传统的单一界面,多模态界面可以被定义为多个输入模态的组合,这些组合可以分为 6 种基本类型:互补型:当两个或多个输入模态联合发布一个命令时,它们便会相得益彰。 重复型:当两个或多个输入模态同时向某个应用程序发送信息时,它们的输入模态是冗余的。通过让每个模态发出相同的命令,多重的信息可以帮助解决识别错误的问题,并加强系统需要执行的操作。等价型:当用户具有使用多个模态的选择时,两个或多个输入模态是等价的。例如,用户可以通过发出一个语音命令,或从一个虚拟的调色板中选择对象来创建一个虚拟对象。这两种模态呈现的是等效的交互,且最终的结果是相同的。专业型:当某一个模态总是用于一个特定的任务时它就成了专业的模态,因为它是比较合适该任务的,或者说对于该任务来说它是当仁不让的。并发型:当两个或多个以上的输入模态在同一时间发出不同的命令时,它们是并发的。例如,用户在虚拟环境用手势来导航,与此同时,使用语音命令在该 环境中询问关于对象的问题。并发型让用户可以发出命令并执行命令,其体现为在做晚餐的同时也可也以打电话的真实世界的任务。最佳例子之一是在一键通话界面里,语音模态从一个手势动作获得信息,告诉它应激活通话。7、信息无障碍中的智能交互技术
信息无障碍(information accessibility)是一个学科交叉的技术和应用领域, 旨在用信息技术弥补残障人士生理和认知能力的不足,让他们可以顺畅地与他 人、物理世界和信息设备进行交互。从研究和应用水平上看,信息无障碍总体还处于比较初步的状态。在应用上,针对信息访问和设备使用,具有基本功能的技术可以被应用,但效果和效率等可用性指标都不高;在现实生活中,针对听障人士与他人交流、盲人独立出行等,能支撑的新技术还处于原型和概念阶 段。3
未来趋势分析
1、技术趋势
技术趋势分析描述了技术的出现、变迁和消亡的全过程,可以帮助研究人员理解领域的研究历史和现状,快速识别研究的前沿热点问题。通过技术趋势分析可以发现当前该领域的热点研究话题 TOP10 是:Virtual Reality、 Augmented Reality、Social Media、Social Interaction、Interaction Design、Mobile Device、Social Network、Ubiquitous Computing、Mobile Phone、Interaction Technique.2、国家趋势
国家趋势分析显示当前人机交互领域研究热度 TOP10 的国家分别是:United States、United Kingdom、Germany、Canada、China、Japan、South Korea、Australia、France、Netherla.3、机构趋势
机构趋势分析显示当前人机交互领域研究热度 TOP10 的机构分别是:Carnegie Mellon University、Washington College、University of California、Stanford University、University of Michigan、Massachusetts Institute of Technology、Georgia Institute of Technology、Cornell University、Seoul National University、Yonsei University.往期推荐
▎“云会展”还能火多久?▎创造历史的 SpaceX 凭什么超越百年波音?▎国产工业软件如何不掉队?▎直播电商黑幕曝光,快手回应主播带货数据造假;苹果承认iPhone屏幕会发绿;斗鱼、虎牙借网课推广网游被点名