国际知名商业技术媒体《计算机世界》5月3日刊登特约专栏作家mike elgan文章——《苹果即将推出的ar眼镜已经过时了吗》(are apple’s upcoming ar glasses already obsolete)。文章指出越来越多的事实清楚表明,增强现实可能会被人工智能替代,ar的未来将是ai。
我们真的需要眼镜?
文章开篇抛出问题:“我们真的需要眼镜吗”?接着指出:ar眼镜的未来原来是明确的,至少以前是这样。然而,当openai出现了,事情发生了变化。
具体地说,ar的重心一直是遵循微软hololens/magic leap的理念,研发目标是将高清3d数字对象锚定到物理空间上,并已为此花费了数十亿美元。其追求的目标——简单举例说明:就是一个逼真的猴子化身不仅可以站在真实的桌子上,还可以躲在桌子后面——或是坐在地板上的地形交互式地图上面。
为了实现这些可视化的壮举,微软和magic leap需要处理能力巨大的硬件,可这种硬件外形庞大、无法佩戴行走且价格昂贵。前卫的客户们叫嚷着要更小的东西。许多人长期以来一直认为,苹果会是第一家将一款引人注目的产品纳入主流的公司,该产品适用于看起来几乎像普通眼镜的全天候ar眼镜。该眼镜基于数百项专利、包括首席执行官蒂姆·库克在内的苹果高管的评论以及该公司在移动电子市场占据主导地位的出色记录。
苹果的无处不在的日常ar眼镜问世,还需几年的时间——至少四年。在此期间,库克应该在6月5日举行的今年全球开发者大会(wwdc)上,向公众推出一款名为reality pro的临时产品,并在很长一段时间之后向公众开放。该产品预计将是高端虚拟现实(vr)设备,主要起到ar的作用,即不是把虚拟对象和数据叠加在真实世界的自然视图上,而是叠加在真实世界的实时视频流上。reality pro每套售价2000至3000美元,不会成为大众的主流产品。
ai如何改变一切
当技术观察者们对引人注目的ar望穿秋水时,人工智能的革命发生了。
旧金山初创公司openai公开了对其dall-e ai文本图像生成器、以及基于gpt架构的chatgpt聊天机器人的访问。这些服务提供了api(应用编程接口),这样开发者就可以在人工智能之上构建应用程序,成千上万的应用程序借此蓬勃发展。而chatgpt不过仅仅是在五个月前——即2022年12月才推出的,这一点简直让人难以置信。
随着openai的出现,其他人工智能平台也出现了,而且还会有更多的平台出现。谷歌i/o下周将推出数十款新的人工智能产品。现在有太多的应用程序,以至于出现了100多个目录来链接到这些工具。由于目录太多了,甚至有一个目录可以链接到这些目录。
2023年的人工智能浪潮已经对文化产生了巨大影响,以至历史学家、哲学家、《智人》(sapiens)的作者yuval noah harari教授宣称:“人工智能入侵了人类文明的操作系统。”如果这种情况是真的,那是因为人工智能重新设定了我们对一切应该如何运作的期望。我们对ar的期望尤其如此。
向ar的转变——从搜索引擎到“一个真正的答案”,意味着我们寻找信息的方式发生了令人担忧的改变。使用搜索引擎,我们输入查询,得到一长串可能的答案链接。而有了ar,我们只想要一个答案,而不是考虑一千个链接。
一般来说,新的人工智能服务,特别是基于openai gpt的服务,已经改变了我们对“一个真实答案”概念在实践中应该如何发挥作用的愿望和期待。具体来说,我们希望它是详细的、灵活的、可变的,基于像chatgpt那样的提示性和互动性,而不像谷歌搜索的“特色代码段”或“知识面板”,那实际上只是一个静态的最终答案。
我们更想要ai而非眼镜
一家由前苹果高管imran chaudhri和bethany bongiorno夫妻二人创立的名为humane的初创公司,最近为ar粉丝留下了深刻印象。他们对ar的工作方式提出了一个聪明的新愿景。在ted演讲中,chaudhri展示了一款随身携带的可连接上网的小巧设备。该设备配有摄像头、麦克风和投影仪,可以访问人工智能和个人用户数据。这是不戴眼镜的ar。
humane设想在人工智能、电脑视觉和机器学习改变世界的“智能时代”,这款设备将替代智能手机。
在演示过程中,chaudhri把一块巧克力糖放在口袋里的设备面前,问道:“我能吃这个吗?”原型设备似乎使用电脑视觉识别产品,使用公共在线数据获取成分,然后将其与用户的不耐受或过敏列表进行比较,最终建议他不要食用。
设备将chaudhri的英语单词翻译成法语,并用chaudhri自己的模拟声音说话。它用命令“追上我”总结了最近电子邮件中的关键信息,并完成了其他类似chatgpt的技能。当他的妻子打来电话时,来电的身份信息被投射到他的手掌上,并用光做成可操作的按钮。
这是一种新型设备,可以理解为一种基于人工智能、高度个性化的可穿戴的亚马逊echo式智能扬声器。或者你可以把它想象成没有眼镜的高级ar眼镜。它不是通过眼镜显示数据,而是根据手势将信息投射到附近的任何表面。
但最令人信服的描述性比较是,它是人工智能特定的硬件。它的设计目的是使与各种人工智能交互所需的物理机器隐形为身体的一部分。鉴于目前人工智能的兴奋和活力,这是一个比我听到的所有关于苹果最终ar眼镜的描述都更有说服力的愿景。
需要明确的是,苹果未来的所有ar设备都可能访问ai,包括未来可能访问类似gpt语言模型的siri(语音识别接口)。humane的功能可以内置在眼镜中。但苹果的总体计划似乎越来越过时,即从一个巨大、庞大、强大、昂贵的ar凯发客户端登录的解决方案开始,然后在四五年或更长时间内将其缩减为社会可接受的移动、独立眼镜。
硅谷从凯发客户端登录转向ai
meta首席执行官马克·扎克伯格的元宇宙概念并没有像人们希望的那样大火起来。事实上,在openai驱动的革命觉醒之中,科技行业似乎普遍解雇了数千名从事ar和vr工作的员工,并加倍投资人工智能。这其中包括微软,它是openai的大股东。
目前,世界所期待的,以及许多初创公司和老牌企业正在开发的,无疑都是ar可穿戴设备。它可以通过访问人工智能、电脑视觉和机器学习的类人私人助理来实现增强现实。
虽然增强现实仍然是企业、创意人员和消费者的一个引人注目的愿景,但2023年的ai革命创造了增强我们自己的需求。世界现在想要的是可穿戴的ai硬件。
最后的话
面对横空出世的ai,一直被人们视为下一代互联网入口的ar眼镜,一时处境尴尬,前途未卜。增强现实真会被人工智能替代?ar的未来真的会是ai吗?
此事重大,关系ar生死存亡、命运前途,应引起所有从业者的高度警觉与密切关注,应及时对这一问题进行认真充分的研究探讨,为今后发展提出对策,指明方向。