人机协作,新一代技术在路上

光山新闻网 采集侠 2024-05-16 01:31:01
浏览

原标题:人机协作,新一代技术在路上

未来世界,将是人机协作的世界。所有创新都需要从人的角度出发,而人机交互与协作技术也必须迎合和满足用户的需求,让人更方便快捷地完成任务。如今,我们正处于从人机交互向人机协作迈进的阶段——人机交互是人与计算机通过输入与输出设备进行沟通对话;人机协作则是建立在人机交互基础之上,让人和计算机通过优势互补,去共同完成任务。

从信号交互到“心领神会”

不知道是巧合还是有意设计,人机交互方式的演变与升级,完美复现了人类从婴幼儿到少年,再到成人的交互方式。这一发展过程可以大致分为四个阶段。

第一阶段是手眼协同交互。在人类婴幼儿阶段,还未学会开口说话之时,总习惯用眼睛来观察,然后用手指指戳戳,来表达自己的意图,或者与其他人进行沟通。类似地,计算机交互的首次大规模应用,也得益于图形界面与鼠标、键盘的问世,人们可以通过手指操控这样一套输入输出设备,与计算机进行沟通。这一阶段,人机交互基本是无声的。

第二阶段是基于语言和对话的交互。人类学会说话之后,会不断地学习,然后慢慢掌握一门甚至多门语言,不断提高自己的听说读写能力,而与更多的人进行更流畅的沟通。同理,语音识别技术以及自然语言处理技术的快速发展,使得计算机也可以听懂,并在一定程度上理解人类的语言,从而帮助人类完成某些操作。例如,手机语音助理软件、智能汽车的车载语音助理、家用智能音箱等产品的广泛使用,已经证明了这一技术的成功。

第三阶段是引入、融合眼神等生物信号的交互技术。成年人之间的默契往往不需要语言,“察言观色”便可领会彼此的意图。此类人机交互技术的标志性产品已于2024年上市——一种增强现实AR头盔,结合虚拟现实VR技术,通过组合多个摄像头和传感器,进行眼球追踪,然后提取眼球的特征信息来监测眼动的变化,从而控制头盔内虚拟屏幕上的光标定位,最后结合手势、语音等,完成在屏幕上的相关操作。假设人类目光所及的位置通常与思考的事物有关,那么,该技术就有可能通过眼动,让机器推断出人正在关注和思考的部分内容。

第四阶段则是一种基于意念感知的交互方式——“心领神会”,即通过非言语的方式传达信息和理解对方的意图。这也将成为未来人机交互技术发展的必经阶段。一种可能的实现方式是脑机接口交互技术,目前该技术还处于科学研究阶段。国外某公司于2024年向公众展示了首个产品“心灵感应”(Telepathy),即通过手术等方式,直接将电极植入到受试者的大脑皮层,以获得高质量的神经信号。展示中,首位接受脑机接口设备植入的患者,可以借助该设备移动计算机光标。同时,国内也有研究团队成功将无线微创半侵入式脑机接口,植入了两名瘫痪患者的颅内,成功采集到感觉运动脑区神经信号,使两位患者实现了自主脑控喝水,并成功用脑电信号控制电脑光标移动。但是,脑机接口的植入物需要替换一块头骨,因此,采用该技术仍然存在一定的伦理和社会问题。

人机协作为人机交互赋能

人机协作是建立在成熟的人机交互手段之上的智能技术,以达到人机协同完成任务的目的,一般可以分为人类单向指挥机器和人机双向合作两种模式。

单向指挥的人机协作模式,往往依赖于人通过传统的交互方式指挥机器完成一些重复性操作。例如,人类通过简单的指令或者多轮对话,基于鼠标键盘等传统交互手段,使用大模型让机器完成一些简单的创作(生成文本、图片、视频)。但是,普通用户并不精通如何对机器发号施令,会浪费大量时间去配合机器。如对大模型输入提示词进行设置,然后浏览机器返回的内容,这些内容很可能无法达到人类的要求。此外,通过声音、眼神、表情等信号,基于更先进的人机交互技术,人类可以远程控制手机或者智能家居设备完成操作。