前言

原文: David A Smith Why AR Will Win - And Why it Matters How it Will Win

David A Smith 曾在施乐 PARC 工作,在 AR/VR 领域探索了 35+ 年之久,与 Alan Kay 同为 Croquet 项目创始者,他是 AR/VR 的先驱和远见者,延续个人计算社区的理想。

译文

人类不仅是工具的制造者……他也是宇宙的创造者。 – Alan Kay 《一款适合各年龄儿童的个人电脑》

在引人入胜的增强现实( Augmented Realities)与强大的增强人类(Augmented Human)之间存在着一场竞赛。这两者必须保持平衡,否则我们将成为这个日益虚拟化的世界的奴隶,而不是它的主人。在此考虑的是一个有关真正的增强现实的想法 – 一个对我们未来所有清醒时间所在的世界的数字扩展。一个更重要的概念是 “增强人类” – 我们进化的下一步,将使我们能够理解和控制这个增强现实,反过来,也就是控制宇宙。增强人类是一个更好的你。

什么是 AR

我认为 VR(虚拟现实)是 AR(增强现实)的一个完整的子集/模式(mode)。我深深理解两者之间的区别,但我认为(区分它们)就像试图在智能手机和 MP3/音乐播放器 之间划清界限一样, 是无关紧要之举。

我对增强现实的定义很简明: AR对于你的意义和今天的智能手机对你的意义类似,但它将在你醒着的每一个时刻都可见,作为一个鲜活的网络浏览器显示整个世界。

最后这一点很重要,因为它涵盖了其他一切。想一想你每天甚至每分钟是如何使用网络的。为何这很重要? 因为 AR 与此相似,但又远不止如此。它将会令人非常上瘾,我们都知道,上瘾的产品有着迄今为止最好的市场 – 问问香烟制造商你就知道了。

想象一下,你走在城市街道上的每一步,都有一个有趣的时机来分散你的注意力。不仅仅是餐厅的菜单, 你可以查询旁边的一家古色古香的酒店,并查看曾在那里生活过和亡故的名人名单。有趣的是,它曾经是一家风月场所,更有趣的是,那个电影明星是如何在壁橱里结束生命的。谁是建筑师?他还设计了哪些建筑?他什么时候去世?又是死于什么原因?西班牙流感到底是什么?

你所见的或靠近你的一切,都会成为信息流和思想流的精彩探索的触发点。它在其他方面也很有用 – 你可以通过人行道向下看,看到地铁线路,看着火车在轨道上移动。模拟城市变得栩栩如生,你和你周围的每个人都是一个模拟。你可以查询最近的地铁站,哪些车厢最拥挤,你打算坐的那辆车上是否有性侵者? 没问题,你已经将系统设置为自动标记这样的人–当你真的看到他时,他被涂成了鲜红色,头上飘着一个霓虹灯。你甚至可以选择查看他的历史。

你走过一家汽车店,看到橱窗里的一辆新车。你停留片刻,走进一个完全沉浸式(VR)的虚拟汽车座椅,探索它的内部,并尝试一些功能(不离开人行道)。哎呀,你被提醒了,你之前用红色记号标记的的危险人物刚踏进了你的 100 英尺范围内。

是时候继续前进了。

走在人群中,你可以看到 Facebook 的图标在每个人的头上弹出,他们是你在Facebook里朋友。我说的是技术上可行的东西,但不一定是社会将认可的东西。你看到一个好看的人朝你走来 – 很好,你可以看到他们在 LinkedIn 上与你只有一度人脉的距离。你邀请他们进入你的网络。

你正在玩的游戏中, 一个生物从一辆汽车后面出现。它看到了你并试图逃跑,但你把它逼到了角落并抓住了它。

你收到提示, 视频会议即将开始。走进最近的星巴克–立即拿起你已经预定的咖啡,在一张空桌上坐下。其他与会者很快就会加入进来。你的AR设备可以捕捉到你的头部位置,你的脸和面部表情,当然还有你视线所在的地方。你的(线上)同事看起来几乎和坐在你旁边的人一样活灵活现。咖啡馆里的其他人甚至没有注意到或关心你在和幽灵对话。一位与会者将一份文件丢在桌子上。这是一张新的物联网烤面包机的预期增长的 3D 图表。新的烤面包机刚刚整合了 Alexa,所以它可以和你其他的厨房电器一起进行对话。你从未见过线上同事们的本尊,不知道他在虚拟的脸颊上去掉了一颗痣,还做了一个虚拟的隆鼻手术。

这款热门的新应用程序允许你将你的任何朋友变成好莱坞的角色,包括他们的声音。你已经决定,你的一个线上同事将变成 Humphry Bogart,包括帽子和风衣。你的老板是《沉默的羔羊》中的汉尼拔–这让他说的每一句话都更有趣。接待员变成 Rhett Butler – 带有某种南方口音的Clarke Gable。

这些功能中的大多数已经以某种形式存在 – 可能在你的手机上。所有这些都将很快存在。只是今天访问起来有点不方便而已。这就是为什么你不会每秒钟都使用它们。

摩擦

听起来像是一个美好世界。为何现在不拥有它?何时可以拥有它?

今天,AR 和 VR 并没有好的体验。它们很糟。目前的设备很复杂,难以设置,甚至难以使用。它们很丑,很重,而且没啥实际作用。他们确实展示出未来一旦可用,可能会发生什么,但同时也显现出目前的技术状态是何等糟糕。VR 游戏展示了新媒介的潜力,但即使在那里,也很难花同样多的时间和注意力在一个基于屏幕的版本上。

为了满足客户, “摩擦” 是你的产品必须克服的障碍。

在市场营销中,奇怪的是,摩擦的反面是粘性。今天,一台智能手机有着令人难以置信的粘性。 而 AR/VR 需要克服大量摩擦。

将 AR/VR 与你口袋里的智能手机相比。它在很多方面都很失败。

手机美丽、光滑而优雅 – AR让你看起来像一个带着脐带的外星人 Bono。VR 更糟,因为你不仅看不到外部世界,外部世界还看到你头上有个盒子。

手机吸引人们触摸它。用户用手指划过屏幕,产生美妙涟漪。 有趣的是,手机对于精细的操作相当无用。在手机上编辑文件是非常困难的–几乎不可能在文本中的字母之间进行选择。这种精细的操作很重要,我们将在后面看到。AR/VR的指点杆(pointing rods)除了振动之外,几乎没有任何触觉反馈。它没有手机界面引人入胜的特质,甚至在粗略操作方面也不是特别好。我知道有些人在 VR 中做了惊人的事情。坦率地说,我很惊讶他们能做到这一点。我做不到。毕加索也能在空中画出惊人的东西。但他是毕加索。

我们需要一种新的方式来与这个新的想法空间(new idea space)互动,就像发明鼠标是为了让我们我们能够与虚拟桌面互动一样。

电话是便宜又独立(self-contained)的。一个好的手机几乎不花钱,一个高端手机对于你所得到的东西来说仍然显得十分便宜, 当你考虑到把它拿在手上,它所提供的力量时。你不需要把任何东西插入它,也不需要把它插入任何东西来使用它。AR和VR通常需要一根电线,另一端连着一台笨重、昂贵的电脑。当然,也有更便宜的替代品,但在能力上有很大差距。

手机有这么多有趣的事情可以做: 与朋友沟通、看视频、玩游戏。VR/AR 仍然是基于一些有大缺陷的硬件的新兴市场。当开发者考虑他们的应用程序的目标市场的规模,他们发现,虽然今天的手机拥有数十亿的用户,但VR/AR世界的用户群只有相对不活跃的数百万。

手机是即时可用和无形的。你的手机就在你的口袋或钱包里。它提醒你要注意,你在几秒钟内就能把它打开并放在你的面前。大多数人不记得把他们的手机拿出来使用的过程。它只是突然神奇地出现在手中,并占据了他们的注意力。当你在使用手机时,你从来没有想过要使用手机 – 你通过它看到了屏幕另一边的丰富世界。另一方面,当你试图使用AR/VR时,你别无选择,只能关注 AR/VR 设备,从你设置它,到你参与并沉浸在其中,再到你试图在其中做任何事情里。它迫使你平分注意力在设备本身和它试图呈现的世界上。

最后这一点非常重要。在某种程度上,手机拥有你比你拥有它们更多。它们不断地呼唤你的注意,当它们得到你的注意时,它们会研究你,以确定如何最好地继续让你保持注意力。手机实际上是在利用它从你那里得到的数据, 来计算如何使自己更让你上瘾。 这是一种出色的毒品。

如果手机拥有如此强大的力量,以至于我们无法抗拒它们,甚至没了它们就没法生活。那为何AR会很重要呢?

因为手机只是拥有你。AR不只拥有手机的一切,它还会成为你。

一个更好的你

AR有一些严峻的挑战,但其中没有一个是不可克服的。AR设备该是什么样子,才能对手机构成严重的挑战?

最重要的是,AR必须是无摩擦的。它必须而且必将比手机更容易使用。你只需把它戴在头上,然后把它留在那里 – 一副轻巧的眼镜,看起来就像你今天戴的眼镜。你不再需要搜罗口袋寻找它,然后刷指纹或输密码,或深深地盯着手机的眼睛 – 摄像头 – 希望你看起来在某种程度上像你认识它时的那样。 AR 知道你什么时候需要它。当你说话时,它能听到你的声音。它知道你在看什么。所以看在上帝的份上,要好好表现。它看起来好像你一想到,它就出现。那是一个无形的界面。与正确的 AR 相比,你的手机像是一个船锚。

AR 必须做到手机现在所做的一切。AR 设备将成为手机 – 或者至少是手机的无缝延伸。反过来,Will Wright 指出,技术是人类身体的延伸。如果有人撞了你的车,你不会说 “我的车被撞了”。你会说 “有人在我开车时撞了我”。汽车成为 “我”,是你身体的延伸。你的手机以同样的方式是你的延伸和映射(reflection),但 AR 要更亲密更引人入胜。它就是你。

AR 必须看起来很酷。或者它必须由一个很酷的人佩戴,这样你就会认为你也可以佩戴它。我们是如此肤浅。它还需要轻便,以及凉爽(如温度)。

名词:协同作用(synergism) 1.两个或多个组织、物质或其他代理人(agents)的相互作用/合作,产生的综合效应大于各单独效应的总和。

当 AR 变得足够好时,它将会是这样,你在早晨戴上你的AR设备,戴一整天。它像助听器或假牙 – 或眼镜。事实上,普通眼镜(和白内障手术后的眼内眼镜)增强了你的视力,使你能看到真实的世界。没有它们,你就会失明,即使不是完全失明,也会变得视力衰弱。在一个封闭的房间里,灯泡的作用也类似。除非你把灯打开,否则什么都看不见。正如麦克卢汉所说:”一个灯泡仅凭它的存在就创造了一个环境”。没有灯泡,房间是否存在?是的,但你看不到它,而且与它的互动会出现大麻烦。但是你从来没有注意到像电灯开关这样的技术–它们是无摩擦的,在某种意义上已经消失了,尽管它们确实在根本层面上重新定义了你是什么。数字世界已经存在 – 并且和物理世界一样是我们存在的一部分,但我们注意不到它。我们偶尔会在办公室和实验室里对它一瞥(至少我是这样),毫无疑问,虚拟的灯光很快就会被打开。就像我们的眼镜和灯泡一样,媒介似乎会消失,但事实上媒介会重新定义我们是什么。

这个东西远比手机更有粘性。它将是人类和互联网的融合。两者之间的界限将被抹去。它将是光荣的 – 也是可怕的。

巴士或推土机

你很少使用电脑思考,更是从未使用手机思考。你是一个信息消费者,而不是一个创造者。部分原因是由于手机的限制。今天,如果没有精细的操作,你根本不可能成为真正有创造力的人。手机界面是围绕着粗略操作而设计的,因为触摸屏不允许你轻易地指定一个触摸点 – 它是一片的触摸区域。这意味着手机上的交互目标必须更大,以适应你可以对它进行的粗略操作。没有精细的操作就很难创造,而且几乎不可能编辑任何有趣的东西。创造任何有趣的东西时,绝大部分努力都是在编辑、重新工作、重新思考。这些都是你用手机做不到的事情。这并不意味着这是不可能的–我们经常被一些完全用手机创作的漂亮作品所打动。印象深刻不仅仅是因为这种创造性努力更好 – 而是因为它竟完全以这种(硬核)方式创造和完成。

创造力受到的限制, 部分是由于智能手机设计方面的固有限制。它的屏幕很小,而你的手指很大。显示屏本身很小,意味着如果你想表达自己,你并没有真正的空间。真正的艺术家需要空间。

相当有趣的是,这种限制变成了一种功能性的东西–就手机制造商看到的而言。手机不是一个足够好的创造性设备。然而,它是一个惊人的消费性设备。消费有两个部分。选择要消费的东西 – 然后消费它。我们不需要一个特别精细的界面来做这个。更麻烦的是,苹果电脑公司决定将这一”功能”奉为圭臬,根本不允许在他们的手机上有任何种类的编程环境。事实上,Scratch – 一种为儿童设计的积木块编程语言,在手机上很好使用 – 但多年来一直被挡在应用商店之外,目前依然如此。这是对设备的消费者属性的一种尝试,而且它成功了。

手机围绕着这个想法来设计: 你是一个信息和想法的消费者。你可以控制你去哪里,但你不能去手机没有预料到的地方。这就像上了公交车。如果你已经知道你想去的地方,这是一种方便快捷的旅行方式。

然而,你不能把公交车开到一个新的和未开发的地方。为此,你需要一套更精细和强大的工具。你最好有一台推土机,这种东西对新想法反应灵敏,能够让你去任何你想去的地方。除了你的想象力,没有其他限制。

这就是 AR 的真正承诺 – 如果它能摆脱粗略操作与精细操作的挑战。

放大器

为什么有必要使用 AR/VR 作为创造性平台?我们如何确保人类有能力扩展、探索和分享他们的想法和他们的世界?我们如何放大将人类定义为创造性工具建造者的属性?

首先,在我们能够从 AR 系统中创造和修改 AR 系统之前,我们无法真正理解 AR 应该如何工作。它必须是一个创造性的放大器。我们(在AR系统里)创造的东西扩展了 AR 系统的能力,然后使我们能够创造出更好的东西。今天的 AR 的问题是,它是从外部建造的 – 就像瓶子里的船一样,目的是为了让它可以下水而不会沉没。它可能的确很美,但这种思考方式有问题。相反,我们需要推出一个合适的筏子,这样我们就可以一边学习航海,一边设计一艘船。我们将设计出正确的船,因为它是我们将要居住的船。我们需要从它内部以及在我们使用它的过程中发明 VR/AR 界面。这不是一个新的想法 – 它是恩格尔巴特 50 年前那些示范工作的基础,创造工具,以便于创造更好的工具。Xerox Parc 从 Smalltalk 中创造了电脑和手机的现代用户界面。Smalltalk 允许开发者重塑系统的每一个方面,从下面的基础操作环境到用户可以操作的实际小工具。你在现代电脑或手机上使用的几乎所有东西都是在 Xerox 以这种方式发明的。我相信这是创造一个真正新的和强大的平台的唯一方法。Will Wright曾这样描述它:

我们现在,通过这些小型微观世界,基本上有能力将我们想象中的东西外化,并与其他人分享。你知道,过去你必须有非常丰富的技能,比如你必须是一个出色的艺术家才能做到这一点 – 在你的想象中画一些东西,然后与其他人分享。但现在有了这些工具,它们给我们提供了创造性的杠杆,普通的休闲游戏玩家有能力将自己的想象力外化,创造出一些东西,与其他玩家分享,并实际拥有这些共享的想象世界。因此,我认为这是计算机给予创意杠杆的例子之一 – 创意放大器。

第二,我们需要一个工具来放大我们的智慧,无论是个人还是集体。人类正在与自己进行一场决定其命运的竞赛。我们可能正在输掉这场竞赛。我们需要为正确的一方提供它今天严重缺乏的不公平优势。我们可能无法从这里到达那里,至少不能直接到达。恩格尔巴特50年前在这场竞赛中展示了一条新的起跑线。他不仅展示了许多我们现在认为理所当然的人机界面的基础,他还为我们提供了一个新的视角,即计算机作为人类的延伸意味着什么。这不是一个意外,而是一个预先计划好的有意行为,重新定义了计算机和人类如何接触的性质,使之成为比其组成部分更伟大的东西。一个定义了共生体(symbiont)的协同作用(synergism)。

更为壮观的是,他如何利用新赋予的共生体来包含其他人类,同样赋予这些技术,以便他们可以合作探索和创造出更伟大的东西。他的目标不仅仅是放大一个人的智慧 – 他打算放大人类整体的智慧。为了让 AR 真正发光,我们还必须把它看成是一个根本的破坏性事件。AR 并不是一个更好的手机,尽管它的第一个流行版本可能会接受这种方法。它们将是增强现实技术为我们提供的第一个示范–无论好坏。我们需要更强大的东西–一种允许我们思考、探索和创造新工具的工具,将我们的智慧放大。恩格尔巴特的三轮车是对这个问题的一个很好的比喻。将手机扩展到AR,也包含其固有的局限性和偏见。就像提高三轮车的能力,新的三轮车将以用户反馈为基础,将是一个非常引人入胜的产品,非常稳定和安全。它提供了一个很棒的用户体验,而且是每个人都认为这是他们想要的。但这一过程永远不会产生自行车,这是一个强大得多的产品,可以大大增加用户的速度。这是一个颠覆性的产品,需要克里斯坦森所说的 “不连续” 创新。苹果公司曾经把 Macintosh 称为 “心灵的自行车”–事实上,Macintosh为我们中的许多人提供了一个令人难以置信的工具来构建新的现实。Mac 不是一个更好的苹果,它是一个非常新的东西。我们的挑战是要确保 AR 做得正确。

第三,我们需要一个意图(intention)放大器。我们需要一种新的方法来实现3D世界中的用户交互,提供我们所拥有的自由形式的粗略手势,同时也提供通过鼠标获得的精细控制(鼠标是恩格尔巴特的另一项发明)。鼠标并不是一个偶然的设计–恩格尔巴特探索了许多与计算机交互的替代方案。鼠标明显更好。鼠标放大了用户的行动,同时保留了控制权。即使在我使用的这种大屏显示器上,我也可以将鼠标从屏幕的一侧移动到另一侧,仍然能够将光标放在两个字母之间来编辑这篇文章。鼠标放大了我的行动范围,但保持了必要的精细控制。

我们有比恩格尔巴特那个时代更好的传感器。与鼠标相当的东西肯定是可以实现的。身体和手是明显的改进目标,但如果只是简单地把身体的运动投射到三维世界中,那就错了。伟大的用户界面是看不见的。用户会思考他们想要的东西,然后进行必要的操作来完成它。你不会关注鼠标–你会关注你正在塑造的东西。AR 的最佳界面将基于眼球追踪和语音。手、手指动作和手势将对用户界面起到辅助作用,就像 meta 按键辅助键盘用户一样,但这些将是例外。

第四,我们需要一个控制放大器。Facebook 和谷歌通过聚集大量的注意力并将其卖给出价最高的人而赚钱。此外,他们训练,或允许其他人训练用户对某些事情的渴望。这些平台上的机器学习的主要目标是了解人们想要什么,然后提供给他们。我们看到这些机器学习系统几乎是实时变化的,利用用户的弱点来训练他们可能渴望的东西。操纵人类行为是一种游戏,而机器学习系统在这方面极为擅长。另一个选择是,利用机器学习系统来实现个人用户的创造力和探索。它应该是参与、构建和探索新的虚拟世界的全面合作伙伴。它需要成为用户精细操作的另一种工具,成为我们的推土机更锋利的铲子,使我们能够驾驶它到达我们想去的任何地方。

我们正处于令人上瘾的增强现实 与 强大的增强人类之间的竞赛中。这两者必须保持平衡,否则人类将成为我们所处的日益虚拟的世界的奴隶,而不是它的主人。增强现实是我们未来所有清醒时间的居住地。我们所知道的 “真实” 世界也将是数字世界,它将与数字世界共存并混合在一起,它就像今天黑暗房间里的电灯开关一样重要。数字世界是存在的 – 你只是还看不到它。增强型人类是我们进化的下一步。我们将理解、控制和扩展这个增强的现实,并反过来扩展宇宙。我们即将打开电灯。