你真的明白人机交互与智能吗? | 清华AI Time

2023-05-31 0 463

你真的明白人机交互与智能吗? | 清华AI Time大数据季刊公司出品作者:T6670寰

在2013年的影片《她》中,女主结束了初恋马拉松之后,圣戈当斯区了一个电脑程式的系统男声,这个叫“辛西娅”的姑娘不仅有着淡淡的低沉的妩媚声线,并且风趣风趣。

就这样,他们成了无话不说的朋友,甚至产业发展出几段“病态”的绯闻。

虽然影片是假想的,但这也不可否认证明了,今后以使用者为中心的建模模式不会实际上逗留在操作方便快捷等基础各方面,对于更快地辨识使用者抒发企图与感情等各方面,都将取得重大成果。

难题来了,当人和电脑之间的边界线逐渐模糊不清,建模式的边界线在哪里?今后建模式会产业发展成什么样子?

你真的明白人机交互与智能吗? | 清华AI Time在AI Time第六期的辩论会中,北大大学的史小兵、中国科学院应用软件所的毕阳、华为公司的蔡铮强、小马刺信息技术创意设计公司的CEO曹翔就一起浅谈了建模式与智能化的相关难题。

听觉化处理是关键

1945年,在计算机技术尚未“降生”时,范内瓦·布希就发表了专文“As We May Think”的该文,形像叙述了今后笔记型电脑——一种被称为MEMEX的电脑,阐述了间接建模、源文件、网络储存等概念。

1960年,托马斯·利卡罗尔提出“人工智慧共存”的思想,并在布希的党委下通过美国国家信息技术计划全力支持了人工智慧共存经营理念下的绘图与建模、交互式对象驾驭、互联网络等研究项目,在他的主导力量下,笔记型电脑、统计报告的举世闻名核心技术在五六十年代Soleymieux问世了。

托马斯·瑞斯明达党委的建模式计算不但研制了楔积作业系统,而且间接鼓励了绘图技术。

在范内瓦·布希、托马斯·利克莱德等先驱的推动下,在语言学、心理学、计算机科学的共同参与下,计算机从没有使用者界面,到有了绘图使用者界面,开创了笔记型电脑以及统计报告等惠及整个社会的新产业。

现在手机无需利用鼠标,可以利用新的传感技术,包括AI技术,这些都在使得人们能够更多地感受周围世界,这也是建模式的一部分。

今后,在新的传感和多媒体技术的共同支持下,电脑将可以通过感知和数据处理技术来理解我们,来理解周围的环境,实现更自然、更智能化的人机建模。

你真的明白人机交互与智能吗? | 清华AI Time

人工智慧互动的研究领域呈多样化

曹翔介绍道,他现在的工作可以说是“现实版神笔马良”,用一张普通的纸和一个普通的画笔作画之后,用手机采集,瞬间就能转化生成三维动画。通过技术把创作的门坎降低,让普通人能够抒发自己的创意设计是研究的初衷。到目前为止还是普适计算的时代,今后建模式会是多模态的,可以用键盘、语音,也可以用手势、表情、唇动等。他首先介绍了基于多通道或多模态感知理论的手语辨识,原因有二,其一是因为姿势语言太多太泛,没有清晰的目标边界线,其二是因为希望技术能服务于残障人士的日常交流。第二个工作也和多模态相关,建模式的终极目标是希望建模式和人人建模一样。目前通过多模态,包括知识性感知,让电脑获知人目前的状态,继而再进行下一步行为。今后可以利用可穿戴设备,对人的生理和心理的境况进行推断,然后进行建模。

蔡铮强也认为,今后的建模式模式会是多模态的。围绕“多模态”设想,他提到了目前工作。一个是基于多通道或多模态感知理论的手语辨识,将面部辨识、手势动作辨识和手语辨识相融合,用以提高手语辨识精度。二是通过多模态手段,使电脑人获知人类当前状态。

你真的明白人机交互与智能吗? | 清华AI Time输入技术和相关理论各方面的研究成果。由于输入不可避免地存在不精确性,希望用智能化化的方法进行改善和帮助。运动目标的选择是建模式里非常重要的任务,玩游戏的时候就知道,相对静止来说运动目标的选中更难,怎样来提高选中的效率,同时去理解使用者选择目标的能力。他们首先做了大量的使用者研究,产生了针对不同速度和尺寸的物体在运动过程的落点分布,建立出模型,计算出使用者选中物体的概率。这个模型不仅可以分析正常人,对帕金森病人等也可以用做辅助诊断。值得一提的是,毕阳带领团队研制的笔式电子教学系统获得了国家信息技术进步二等奖,并与协和医院共同取得了国家卫健委颁发的医疗健康人工智能化应用落地30最佳案例的荣誉。史小兵介绍道,在使用手机软键盘时,26个字母挤在狭窄的输入界面里,再配上胖乎乎的手指,点错的经历太多了。这是触屏这种自然建模界面上典型的难题:胖手指难题。

基于研究工作,他们提出了基于贝叶斯推理的自然使用者企图理解框架,建模使用者行为特征,在模糊不清的输入信号上推测使用者的真实企图。你点的不准没关系,算法可以猜得准。利用这项技术,史小兵团队已经研究实现了手机、平板、头盔、电视等一系列接口上的输入法,输入准确度大幅度提高,且几乎不需要听觉瞄准,进而还能支持盲人使用者准确实现软键盘输入。

今后的接口也会延伸感知人的驾驭行为,史教授正在研制的手机前置摄像头上就能:“感知到人手在界面上的变化后,我们就能以此做出新的‘输入法’。”

比如手握手机的任意边框或位置,就可以输入信息、访问界面,甚至和桌子的建模,也能变成对手机的操作。”

你真的明白人机交互与智能吗? | 清华AI Time

建模式离不开人工智能化

针对建模界面的构建是否存在计算模型的难题,毕阳指出,传统上存在计算模型,而针对自然人交互,现在还没有相应的理论计算模型,但是应该朝着这个方向努力。

史小兵教授同意以上观点,并指出定量评估的方法虽有,但很不充分。不过借助相应的传感技术,定量评估的原理和技术都在不断拓展,这从红外反射监测血流、血压参数、情绪变化等一系列应用上就可以看出。

以后的计算终端是多种多样的,适配的场景和任务也是不一样的,所以完全统一的大而全的模型非常难以建立,但是在特定任务上,技术背后的科学原理一定是有计算模型的,研究者们都应该去努力探索。此外,定量评估的方法理论上是存在的,但现在很难说是好方法,因为界面在扩展,相应的实现技术、原理和评价技术也都在做扩展和变化。你真的明白人机交互与智能吗? | 清华AI Time曹翔也指出,因为建模式的任务多样,很难去界定效率,更多是用主观感受衡量。从大方向上讲,一定是需要定量数据的,人工智能化需要数据,而建模式离不开人工智能化。针对建模的机制和限制,曹翔指出,具有明确任务的工作建模相对容易,因为目标很清晰,但是体验性的、娱乐性的、沟通性的工作比较难用计算的方式建模,因为其中夹杂着大量非简单建模式的内容,比如人与人之间的互动等。用大数据的方式对情绪的预测更有效果,本身人类对情绪化的东西也没有细分到小单元。反过来说,大数据分析或人工智能化分析,能在没有用明确的细分模型的情况下做出预测,不可否认能解决非标准性任务。但如果是利用大数据解决难题,建立的可能是一个通用的模型,涉及到个人也会一些差别。蔡铮强认为,建模式要做得好,就一定要做到个性化,也就一定会用到智能化方法。从建模来说,最初键盘是确定性建模,鼠标是属于感知层次。往智能化上走,语音辨识、手势辨识这部分在感知以外加入了知识性学习。到第三部分,即感情智能化,在执行前还需要加上知识,或者说认知。这也与人脑的三个部分,即中枢神经、小脑和大脑相对应。智能化和建模式一样,也是按人也分层次,建模式我们从传统到智能化也分层次,可以把它理解为消除不确定性。越往上走,不确定性越大,尤其对企图理解,但是我们怎么去消除它,是建模式上应用的一个探讨。

建模式和人工智能化协同共进

人工智能化和建模式,都有“人”这个字,对于二者的关系,史小兵首先指出,这是中文说法,英文没有这样的词,但二者的共性在于都是很早很明确地谈到人工智慧关系。

史小兵教授认为,建模式应该让电脑更快的适应人,适应人的本性,适应人的驾驭能力、感知能力和认知能力。从“人” 的研究内容上来说,建模式与人工智能化有差异,但出发点是一致的,即“人工智慧共存”。

目前看,人工智能化的研究更多的体现在人的辨识、语言的抒发等数据密集型任务上的处理方法,建模式的研究更偏重于对人的主动建模行为和感知能力的建模、传感和建立适应的接口技术,人工智慧关系必定向着共存的方向产业发展,这些研究内容和方法会相互影响和适应,交叠的研究内容会越来越多。

“做人工智能化最后要接触建模式,做建模式最后也要接触人工智能化。”

毕阳提到中国科学上有一篇观点性的论文,他指出,人机建模和人工智能化在今后的趋势会从交替沉浮走向协同共进。国家人工智能化产业发展规划里一个核心研究点是人工智慧协同,人工智慧协同也是建模式今后的方向。从人工智能化角度讲,自动驾驶等也讲人工智慧协同,其实是殊途同归的。你真的明白人机交互与智能吗? | 清华AI Time曹翔指出,人工智能化和建模式的研究价值观、出发点会略有不同。人工智能化根本上讲,终极目标是让电脑能做所有人能做的事情,建模式则是指人和电脑的合作,两者不矛盾,但是要看情境。针对建模式研究对AI的贡献,他指出,首先必须承认AI对建模式研究的贡献。从大趋势上讲,电脑学习中大量的人工标注数据就是建模式的过程。进一步讲,AI的一个挑战在于可解释AI,最终担心的是可不可被信任,解释的原因是希望能够放心地使用。某种意义上讲也许解决AI可信任的难题,在于创造一种方式,让人和AI的系统在一个互动过程中慢慢通过衡量判断,可能这个不可否认是建模式帮助解决所谓AI可解释难题的方法。对于智能化建模式的畅想,史小兵指出,今后计算机的形态会变化,甚至可能不存在了,但计算机技术会持续为我们服务,成为人工智慧共存的一部分,建模接口、建模任务会有很大的变化,但会更自然,更智能化。她把智能化建模式集中分为三类,一是手势,然后是语音,还有可穿戴设备,包括手环、头盔。在这三类上看到了很多新技术和新产品,但都还没有成为主流,也就是说,都存在一定的难题。比如语音建模,不光是辨识率没有达到百分之百,同时语音抒发的带宽和抒发的数据类型还不完整,和空间有关的数据效率低、没有精度。此外,还有打扰、隐私等,都有很大的限定条件,穿戴更是这样。

蔡铮强举例穿戴设备可以附着于衣服和鞋子,建模式最终将实现人工智慧共存。并且,在材料、技术的进步下,能够完全理解人类自然行为的企图,甚至帮助解决人口老龄化、阿尔茨海默病等。

你真的明白人机交互与智能吗? | 清华AI Time曹翔根据自己目前的研究内容,指出,要通过技术把每个人的创造力充分发挥出来,创造力在今后会成为生存和工作所不可或缺的一部分。今后在输出上或许能获得更多体验,比如把挖掘出更多感官体验,不只是听觉和听觉领域,甚至创造一个幻想的世界,这是十分有趣的。毕阳称,他对于如何通过建模式的研究推动产业产业发展更为关心,相关人口老龄化难题已经与协和医院进行了深入合作,通过对老年人的动作进行解读,提供量化的辅助诊断。针对建模式人才的培养,史小兵指出,工业界是有需求的,但是学术界还很迷茫。有博士生毕业后在工业界无法找到与专业十分匹配的职位,由于工业界的进步会促使学术界对人才培养建立一套科学的方法。

史小兵教授提到:“我们培养的人才应该能够发现建模难题,并且能通过科学的方法来解决这个难题。”

曹翔指出,建模设计师、使用者研究员等对口培养的专业,不难找工作;难找工作的是把建模式作为一个研究领域去学习的学生,因为现有的一个萝卜一个坑的职业体系,并不太适合跨学科的人才,但创业特别需要这样的人。

精神,邀请各界人士对人工智能化理论、算法、场景、应用的本质难题进行探索,展开辩论会,碰撞思想,打造人工智能化知识分享的策源地和聚集地。大数据季刊作为合作媒体将长期合作报道。

感兴趣的小伙伴还可以点击下方链接,查看前六期的内容:

技术界与翻译界的交锋:电脑翻译离我们还有多远? | 北大AI Time

自动驾驶是近在咫尺还是遥遥无期? | AI Time

数据共享的核心在定价,数据开放与隐私保护探讨 | AI Time

 北大张钹院士、人大文继荣院长激情辩论会:人类对AI的爱痴忧惧

 要强大的“黑匣子”,还是“可解释”的电脑学习?

 知识图谱的构建主要靠人工还是电脑?

实习/全职编辑记者招聘ing

加入我们,亲身体验一家专业信息技术媒“招聘”了解详情。简历请间接发送至[email protected]

你真的明白人机交互与智能吗? | 清华AI Time你真的明白人机交互与智能吗? | 清华AI Time点「在看」的人都变好看了哦!

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务