思维工具
文章目录
— 摘自 Howard Rheingold《Tools For Thought》, 来自 Dynamicland 的推荐书单
-
我的探索始于我发现了 Xerox PARC 和 Doug Engelbart,并意识到所有涌入硅谷的记者都忽略了真正的故事。是的,关于青少年在车库中创造新产业的故事很吸引人。但个人计算机的概念并不是从 Steve Jobs 的头脑中完全形成的。事实上,人们可以使用计算机来增强思维和交流,作为智力工作和社交活动的工具,这一理念并不是主流计算机行业、正统计算机科学,甚至是自制计算机爱好者的发明。如果没有像 J.C.R. Licklider、Doug Engelbart、Bob Taylor、Alan Kay 这样的人,这一切都不会发生。但他们的工作植根于更早期、同样古怪、同样有远见的工作中,所以我回溯到 Boole、Babbage、Turing 和 von Neumann——尤其是 von Neumann——如何创建了后来的工具构建者所依赖的基础,从而创造了我们今天所生活的未来。 你无法理解心智扩展技术的未来走向,除非你了解它的起源。
第一章:计算机革命尚未发生
-
没有人知道这将成为人类为自己做的最好的事情还是最糟糕的事情,因为这种赋权的结果在很大程度上取决于我们如何应对以及我们选择如何利用它。人类的思维不会被机器取代,至少在可预见的未来不会,但毫无疑问,幻想放大器、智力工具包和互动电子社区的全球普及将改变人们的思考、学习和交流方式。
-
书籍只是载体,通过它们,思想从精英的私人图书馆中流出,并在大众中传播。
-
书籍的真正价值在于它们所促成的社区,一个至今仍在全球范围内活跃的知识社区。印刷品一直是传播化学与诗歌、进化与革命、民主与心理学、技术与工业等思想的媒介,这些思想远远超出了发明活字印刷术并开始大量印刷《圣经》的人们的理解范围。
-
由于复杂电子设备的大规模生产可能会比研究原型的最先进状态滞后十年或更长时间,自 1960 年以来计算机科学的惊人成就的首批影响才刚刚开始进入我们的生活。文字处理器、电子游戏、教育软件和计算机图形在十年前对大多数人来说还是陌生的术语,但今天它们已成为价值数十亿美元的产业名称。而专家们一致认为,最令人惊讶的发展尚未到来。
-
“计算机是用于数学计算的神秘设备。”就这样。计算机技术被认为对非专业人士来说过于脆弱、珍贵和复杂。
-
在 1950 年,你可以用一只手的手指数出那些反对这一教条的人。这些少数人的不同观点涉及一种不同的思维方式,即关于计算机可能被如何使用的思考。持不同意见者分享了一种个人计算的愿景,其中计算机将被用来增强人类智能中最具创造性的方面——对所有人,而不仅仅是技术精英。
-
那些质疑数据处理教条的人同意计算机可以帮助我们进行计算,但他们也怀疑如果这些设备能够变得更加互动,这些工具可能会帮助我们推测、构建和研究模型、在各种选择中做出选择,并在信息集合中寻找有意义的模式。他们想知道这个新生的设备是否可能成为一种交流媒介,而不仅仅是一个计算机器。
-
这些异端的计算机理论家提出,如果人类的知识确实是力量,那么一种能够帮助我们将信息转化为知识的设备应该成为一种非常强大的技术的基础。尽管大多数科学家和工程师仍然对巨型加法机感到敬畏,但这一少数人坚持思考如何以非数学的方式使用计算机来辅助人类思维的运作。
-
《思维工具》聚焦于一些在创造过去、现在和未来的人机技术方面发挥了重要作用的人的思想。
-
探索心智与机器交互的前沿。
-
正如我们将看到的,这项技术的未来限制不在于硬件,而在于我们的思维。数字计算机基于一个被称为“通用机”的理论发现,这实际上不是一个有形的设备,而是一个能够模拟任何其他机器动作的机器的数学描述。一旦你创造出一台可以模仿任何其他机器的通用机器,工具的未来发展就只取决于你能想到用它来完成什么任务。在不久的将来,机器能否变得智能的问题不如学会处理一台可以成为我们清晰想象中任何事物的设备更为重要。
-
未来的那些技能与如何操作计算机关系不大,而与如何使用增强的智力、加强的沟通和扩展的想象力有很大关系。
-
忘掉“计算机素养”或晦涩的技术术语吧,因为当机器及其程序变得更智能时,这些偏差将会消失。最初制造个人电脑的原因是为了让人们能够通过使用机器来做机器最擅长的事情,从而更好地发挥人类的长处。许多人害怕今天的计算机,因为他们被告知这些机器比他们更聪明——这种误解通过新手为了使用计算机而被迫经历的仪式得到了强化。事实上,沟通的负担应该在机器上。难以使用的计算机就是无法理解你需求的愚蠢计算机。
-
如果本书中一些人的预测继续准确,那么在现在到世纪之交之间,我们的整个环境将突然拥有一种自身的智能。
-
准确预测任何新技术的社会影响的可能性至少是值得怀疑的。在二十世纪初,普通人甚至最有学识的科学家都无法想象他们的孙辈的生活会是什么样子,而我们现在知道,他们会坐在小盒子前观看此刻发生在世界另一端的事件。
-
在他们之前,数千年前,不同文化的思想家努力寻找更好的方法来使用符号作为工具,最终导致了数学和逻辑的发明。正是这些用于操控符号的形式系统最终引导了计算的发展。我们现在可以看到,这一连续的思想链条是由一系列希腊哲学家、英国逻辑学家、匈牙利数学家和美国发明家创造的
-
他们异常聪明并不令人惊讶,但不寻常的是,他们似乎都专注于自己思想的力量。许多聪明人为了纯粹的智力冒险,追求星辰的秘密、生命的奥秘,以及利用知识实现实际目标的无数方法。但这些软件先驱者试图创造的是放大自己大脑力量的工具——机器来接管他们认为是思维中更机械的部分。
-
这种危险的自我反思事业的职业风险
-
乔治·布尔发明了一种为未来计算机制造者准备的数学工具——一种“逻辑代数”,这在近百年后被用来将人类推理过程与机器操作联系起来。这个想法是在他十七岁时的一天,当他穿过草地时灵光一现的,但他花了二十年时间自学足够的数学知识来写《思维定律》。
-
尽管布尔的毕生工作是将他的灵感转化为一个代数系统,但他仍然对那天在草地上突然袭来的启示的力量和突然性感到印象深刻,以至于他还广泛撰写了关于无意识心灵力量的文章。在他去世后,布尔的遗孀将这些想法转变为一种人类潜能崇拜,这比“自我时代”早了一百年。
-
他以邋遢闻名,性格孤僻,有时言辞激烈,甚至他的朋友们也认为他将不合群的行为推到了怪异的极端。在四十二岁时,他自杀了,被他曾帮助拯救的政府无情地逼迫。
-
约翰·冯·诺依曼是创造“存储程序”概念的团队的核心人物,这一概念使得真正强大的计算机成为可能
-
克劳德·香农,另一位独行天才,在马萨诸塞州剑桥市仍以其骑摩托车的技艺为邻居所知。1937 年,作为一名 21 岁的研究生,他证明了布尔的逻辑代数是分析电话系统中使用的复杂交换电路网络以及后来计算机中使用的完美工具。在战争期间及之后,香农建立了信息理论的数学基础。与控制论一起,这些关于信息和通信的定理集合创造了一种理解人类和机器的新方式——并将信息与能量和物质一起确立为宇宙的基本要素。
-
软件先驱们来自截然不同的背景。过去和现在一样,计算机天才常常被周围的人视为“怪人”,而他们想要发明计算设备的原因似乎和他们的个性一样多样化。某种关于通用机器的概念吸引了数学家和哲学家、逻辑学家和密码破译者、神童和炸弹制造者。即使在今天,计算机研究和软件行业的世界也汇聚了一群看似不可能的组合:企业家和布道者、未来主义者和乌托邦主义者、狂热分子、痴迷者、天才、恶作剧者以及投机取巧者。
-
但任何现代黑客都会承认,他自己生活中最迷人的事情就是他自己的思维,并会告诉你,他认为与计算机程序进行的紧密、持久的互动是一种特别令人满意的自我思想对话。
-
从我们今天对这些先驱和开创者的了解来看,他们似乎都在追求一种新的思维方式。每个人都在尝试创造一个精神杠杆。他们每个人都为最终组装的设备贡献了不可或缺的组件。但没有一个人能涵盖全部。
-
像他们的前辈一样,这些人试图创造一种精神杠杆。与大多数前辈不同的是,他们还试图设计一种全体民众都可以使用的工具。
-
如何利用计算机为人类智力创造杠杆,就像车轮和发电机为人类肌肉创造杠杆一样。先驱们的目标是创造计算,而个人计算机的先驱们则寻求转变计算
-
在 20 世纪 60 年代初,Licklider 资助的研究人员通过一种称为分时的方式,在一个新的更高的层次上重建了计算机科学。
-
早在哈里·杜鲁门担任总统时,道格·恩格尔巴特就开始思考构建一个思维放大设备,并在过去三十年中顽强地追求他最初的愿景,即建立一个增强人类智力的系统。
-
Kay 还以终生不服从权威而闻名。自从他第一次因为比老师懂得多而被赶出教室以来,Kay 一直宣称他的目标是构建一个“幻想放大器”,任何有想象力的人都可以用它来自主探索知识世界,一个“动态的创造性思维媒介”,对幼儿园的孩子和研究实验室的科学家都同样有用且能激发思考。
-
利克莱德(仍在麻省理工学院)称之为对交互式计算的“宗教皈依”
-
他们称之为“用户界面”的科学——即心灵与机器相遇之处
-
特德·尼尔森是一个辍学者、爱挑刺的人和自称天才的人,他自费出版了《Computer Lib》,这是微型计算机革命中最畅销的地下宣言。他梦想着一种新型的出版媒介和不断更新的世界图书馆,这个梦想有可能成为世界上最长的软件项目。他狂野而蓬松,富有想象力且过于活跃,难以维持工作和与同事相处,并且是几年前那些拼凑自制计算机或自制程序的少年们的秘密灵感来源,而这些少年现在已成为微型计算机行业的主宰大亨。
第二章:第一位程序员是一位女士
-
她是一个长发披肩的少女,擅长数学,并且对赛马赌博情有独钟
-
巴贝奇是一个地道的英国人,固执地古怪,顽强地富有远见,有时心不在焉,并且相当富有,直到他把自己的财富投入到建造计算引擎的梦想中。
-
巴贝奇为铁路设计了第一个速度计,并发表了第一部关于精算理论的综合论著(从而帮助创建了保险业)。他发明并破解密码,还为“无法撬开的锁”制作万能钥匙——这种对密码分析的兴趣后来也被计算机制造者所共享。他是第一个提出通过观察树木年轮的周期来发现过去几年天气的人。他对一些后来被历史证明只是荒诞不经的想法也充满热情。
-
他的社交关系和他的智力冒险一样不稳定,从巴贝奇参与的终生公开争斗的数量来看就是如此。除了与皇家学会的长期争斗外,巴贝奇还对手风琴演奏者和街头音乐家进行了长期的论战。巴贝奇会给编辑写信抱怨街头噪音,而伦敦一半的手风琴演奏者在喝醉时都会在巴贝奇的窗下演奏。一位传记作者 B.V. Bowden 指出:“这个人的悲剧在于,尽管他的想象力和视野无边无际,但他的判断力却远不及此,而且他的急躁使他对那些不支持他项目的人无法容忍。”
-
巴贝奇留下了一本古怪的回忆录,名为《哲学家生活的片段》——计算机先驱赫尔曼·戈尔茨坦将其描述为“一组从崇高到荒谬,从深刻到无聊的糟糕品味的文章。事实上,巴贝奇的职业生涯大多是这样的。在他行为如此古怪的情况下,他竟然有这么多忠诚的朋友,真是令人惊讶。”
-
我能追溯到的关于用机器计算算术表的最早想法是这样产生的:有一天晚上,我坐在剑桥分析学会的房间里,头靠在桌子上,处于一种梦幻般的状态,面前摊开着一本对数表。另一位成员走进房间,看到我半睡半醒,喊道:“巴贝奇,你在做什么梦呢?”我回答说:“我在想所有这些表(指着对数表)都可以用机器来计算。”
-
如果能够构建一台进行某种计算的机器,巴贝奇推理道,那么是否有可能构建一台能够进行任何种类计算的机器?与其制造许多小型机器来执行不同种类的计算,是否可以通过改变部件交互的顺序,使一台大型机器的部件在不同时间执行不同的任务?
-
巴贝奇偶然发现了通用计算机的概念,这一概念在 20 世纪 30 年代被艾伦·图灵——另一位才华横溢、特立独行且不幸超越时代的英国数学家——重新考虑时,产生了重大影响。巴贝奇将他假想的主计算器称为“分析机”。通过使用不同的“动作模式”来重新配置部件在每次计算中移动的顺序,相同的内部部件可以执行不同的计算。
-
每当看起来某种构建他设备的方法可能真的有效时,巴贝奇就会想到一种新的、更好的方法。
-
分析机的四个子组件的功能与现代计算机设备中的类似单元非常相似。磨坊相当于数字计算机的中央处理单元,存储器则是记忆装置。二十世纪的程序员会将打印机识别为标准输出设备。然而,正是输入设备和控制单元使得从计算(calculation)向真正的计算(computation)迈进成为可能。
-
分析机的输入部分是编程历史上的一个重要里程碑。巴贝奇借鉴了法国发明家 Jacquard 的打孔卡编程理念,Jacquard 通过发明一种在织物中编织图案的机械方法,引发了纺织业的革命。织布机使用金属杆阵列自动将线拉到位。为了创造图案,Jacquard 的装置在金属杆和线之间插入了一张打孔的硬卡片。卡片的设计是为了阻止某些金属杆在每次通过时接触到线;卡片上的孔只允许特定的金属杆将线带入织机。每次梭子投掷时,一张新卡片就会出现在金属杆的路径上。因此,一旦特定编织图案的指令被翻译成打孔卡上的孔图案,并且卡片按正确顺序排列以呈现给卡片读取装置,织物图案就可以预先编程,整个织布过程就可以实现自动化。
-
这些卡片让巴贝奇意识到它们是实现自动化计算的关键。这是一种控制那些令人沮丧的抽象“动作模式”的具体手段:巴贝奇将复杂计算的逐步指令编码成一系列打孔的卡片,这些卡片会在每一步改变机器的工作方式。以正确的方式排列正确编码的卡片,你就可以替代一队年长的康沃尔绅士。更换卡片,你就可以替代他们整个军队。
-
艾达是少数能够认识到差分机与过去的机械计算器完全不同的人之一。以前的设备是模拟的(通过测量进行计算),而巴贝奇的设备是数字的(通过计数进行计算)。更重要的是,巴贝奇的设计结合了算术和逻辑功能。(巴贝奇最终发现了德摩根的朋友乔治·布尔关于“逻辑代数”的新工作——但那时,对艾达来说已经太晚了。)
-
艾达对穿孔纸板卡片的数学意义特别感兴趣,这些卡片将用于向巴贝奇的设备输入数据和方程。艾达的文章题为《对巴贝奇先生的分析机的观察》,其中包含了不止一段预言性的文字,这些文字在她的同时代人中大多未被重视,但随着一个世纪的流逝,其重要性日益增加:
-
分析机的独特特征,以及使其能够赋予机械如此广泛功能的原因,使得这台机器有望成为代数的得力助手,是引入了由 Jacquard 发明的原理,通过穿孔卡片来调节织锦织物中最复杂的图案。这就是两台机器之间的区别所在。差分机中不存在这样的东西。我们可以非常恰当地说,分析机编织代数图案,就像 Jacquard 织机编织花卉和树叶一样……
-
然而,一旦应用卡片的想法出现,算术的界限就被超越了;分析机并不与普通的“计算机器”处于同一水平。它占据了一个完全独特的位置,其引发的思考本质上极具趣味。通过使机械能够以无限多样和广泛的顺序组合通用符号,建立了物质操作与数学科学中最抽象分支的抽象思维过程之间的连接纽带。为未来的分析使用开发了一种新的、广阔而强大的语言,以运用其真理,使其比我们迄今为止所拥有的手段更快速、更准确地应用于人类的实际目的。因此,不仅在数学世界中,精神与物质、理论与实践之间也被紧密联系在一起。 我们没有记录表明,任何具有被称为分析机特性的事物曾被提出,甚至被认为是实际可能的,就像思考或推理机器的想法一样。
-
即使引擎尚未建成,艾达也尝试编写指令序列。她注意到在这门新艺术中几个特定技巧的价值,这些技巧在现代计算机语言中仍然至关重要——子程序、循环和跳转。如果你的目标是通过子计算来编织一个复杂的计算,其中一些可能会重复多次,那么一遍又一遍地重写一打或一百条指令是很乏味的。为什么不将常用的计算或子程序的副本存储在一个“程序库”中以供以后使用呢?然后,当你的计算需要时,你的程序可以自动从库中“调用”子程序。这样的子程序库现在几乎是每种高级编程语言的一部分。
-
分析引擎和数字计算机非常擅长快速地重复执行多次操作。通过发明一种指令,使卡片读取设备回退到指定的前一张卡片,从而可以多次执行指令序列,艾达创造了循环——这可能是每种现代编程语言中最基本的程序。
-
是条件跳转让艾达作为逻辑学家的天赋得以发挥。她又想出了一种操控卡片读取器的指令,但这次不是回退并重复一系列卡片,而是如果满足特定条件,这条指令可以让卡片读取器跳转到序列中的另一张卡片。将这个小小的“如果”添加到以前纯粹的算术操作列表中,意味着程序不仅仅可以进行计算。在一种原始但潜在有意义的方式中,引擎现在可以做出决策。
-
她还指出,未来可能会制造出能力远远超出维多利亚时代技术的机器,并推测这些机器是否有可能实现智能。她在“观察”中提出的反对人工智能的论点,几乎一个世纪后被另一位软件先知艾伦·图灵所铭记,他将她的论点称为“洛夫莱斯夫人的反对”。这种观点在关于机器智能的辩论中仍然经常被听到:“分析机,”艾达写道,“绝对没有任何原创的企图。它只能执行我们知道如何命令它执行的事情。”
-
巴贝奇在阿达生命的最后阶段深深卷入了她的赌博活动。阿达则在多个筹款计划中帮助巴贝奇,以建造分析机。这是一种奇特的混合体,包含了恶习、高度的智力冒险和怪异的创业精神。
-
查理和艾达试图开发一个万无一失的赛马投注系统,这使得艾达在丈夫不知情的情况下两次典当了丈夫的家族珠宝,以支付敲诈勒索的赌徒
-
由于他那个时代的工具制造技术无法达到他设计所需的精度,巴贝奇开创了使用金刚石刀具进行精密车削的先河。为了系统化地生产他的机器的组件,他设计了批量制造可互换零件的方法,并撰写了一本关于后来被称为“批量生产”的经典著作。
-
“在巴贝奇去世前不久,他告诉一位朋友,他记不起自己一生中有过一个完全快乐的日子:‘他说话的样子仿佛他憎恨人类,尤其是英国人,最恨的是英国政府和街头风琴手。’”
-
1832 年,一位名叫乔治·布尔的十七岁英国青年在穿过草地时受到了一次惊人的启示。这个想法来得如此突然,并对他的生活产生了如此深刻的影响,以至于布尔开始对一种他称之为“无意识”的人类能力进行开创性的但晦涩的推测。然而,布尔对人类知识的贡献并不在心理学领域,而是在他自己创立的领域。正如伯特兰·罗素在七十年后所说,布尔发明了纯数学。
-
当计算机技术的不同部分在一百年后意外融合时,电气工程师需要数学工具来理解他们发明的复杂机器。他们创建的开关网络是电路,其行为可以通过精确的方程来描述和预测。由于电脉冲的模式现在被用来包含逻辑操作,如“与”、“或”和至关重要的“如果”,以及计算器常用的“加”、“减”、“乘”和“除”,因此需要方程来描述计算机电路的逻辑特性。
-
布尔在那片草地上发现并在二十年后在纸上推导出的东西,注定要成为将软件的逻辑抽象与电子机器的物理操作结合起来的数学关键。
-
在巴贝奇和布尔的灵感之间,可以说它们代表了几个世纪以来促使富有想象力的人们尝试并最终成功建造计算机的两种不同动机。一方面是科学家和工程师,他们总是渴望有一种设备能为他们处理繁琐的计算,从而解放他们的思维去追求更有趣的问题。另一方面是数学思维中更为抽象的愿望,即用一组符号捕捉人类理性本质的愿望。
-
如果艾达能多活几年,她对编程原理的强大直觉理解将因布尔代数的使用而得到极大的增强。
-
对于他这样的人来说,数学是最具成本效益的智力活动,因为它不需要实验室设备,只需少量的基础书籍
-
在二十岁时,他发现了一个当时最伟大的数学家们都未曾注意到的东西——一种不变性的代数理论,这一理论后来成为爱因斯坦在制定相对论时不可或缺的工具。1849 年,在多年担任小学教师后,布尔的数学出版物为他赢得了爱尔兰科克皇后学院数学教授的职位。五年后,他出版了《思维法则的研究》,这本书奠定了逻辑和概率的数学理论基础。
-
一千多年来,唯一一个可以用符号表达且足够严谨和精确到可以称为“数学”的逻辑系统是欧几里得所奠定的几何学。正如欧几里得用公理和定理来描述空间图形的基本陈述和规则一样,布尔用代数符号奠定了逻辑的基础。这并不是一个小小的野心。虽然几何学知识是一个在世界上广泛有用的工具,但布尔确信逻辑是人类理性本身的关键。他知道自己找到了亚里士多德到笛卡尔等每位形而上学家所忽视的东西。在他的第一章中,布尔写道:1. 本论著的设计是研究那些进行推理的心智操作的基本法则;用演算的符号语言表达它们,并在此基础上建立逻辑科学并构建其方法……从这些研究过程中揭示的各种真理元素中收集一些关于人类心智的性质和构成的可能模仿…… 2.逻辑的目的不仅仅是使我们能够从给定的前提中推导出正确的推论……这些研究还有另一种兴趣,源于它们对智力能力的启示。它们教导我们语言和数字如何作为推理过程的工具性辅助;它们在某种程度上揭示了我们共同智力的不同能力之间的联系;它们为我们展示了……真理和正确性的基本标准——这些标准不是从外部得来的,而是深深植根于人类能力的构成中……揭示那些高等思维能力的秘密法则和关系,这些能力使得超越仅仅感知的世界和自我知识得以获得或成熟,这是一个不需要向理性心灵推荐的目标。
-
布尔用来连接逻辑和计算这两种迄今为止不同思维工具的概念是一个数学系统的想法,其中只有两个量,他称之为“宇宙”和“无”,并用符号 1 和 0 表示。虽然他当时并不知道,但布尔发明了一种用于量化逻辑的双态系统,这也恰好是分析双态物理设备(如电继电器或真空管)逻辑的完美方法。
-
自布尔时代以来,科学已经了解到,人类的理性工具比形式逻辑的工具要复杂得多、模糊得多、不可预测得多,也强大得多。但数学家们发现,布尔的数学逻辑对他们事业的基础比他们最初想象的要重要得多。而第一台计算机的发明者们了解到,一个只有两个值的简单系统确实可以编织出非常复杂的计算。
-
霍勒瑞斯使用了一种机电计数器,其中如果遇到孔,铜刷会闭合某些电路;如果没有孔,则不会闭合电路。
-
几年后,霍勒里斯的制表机成为了一家名为“国际商用机器”的机构,由一位名叫托马斯·沃森的高级人士经营
-
数字计算机的诞生并非源于人口普查办公室或商业机器公司,而是源于战争部,且其诞生过程有许多助产士——从艾伦·图灵的英国团队需要一种特殊的计算设备来破解德国密码,到约翰·冯·诺依曼在洛斯阿拉莫斯的数学家们面临制造原子弹时几乎无法克服的计算,再到诺伯特·维纳的研究人员发明更好更快的防空炮火瞄准方法,以及陆军弹道研究实验室的项目,该项目生产了电子数字积分计算机(ENIAC)。
-
弹道学催生了控制论。ENIAC,第一台电子数字计算机,最初是为了计算弹道射击表而建造的。当 ENIAC 的发明者后来设计出第一台微型计算机时,那就是 BINAC,一种小到可以装在洲际弹道导弹的弹头中,并且足够聪明可以通过星星的位置进行导航的设备。
-
第一台现代计算机不是一台机器。它甚至不是一个蓝图。数字计算机被构思为一个符号系统——第一个自动符号系统——而不是一个工具或武器。发明它的人关心的不是弹道或计算,而是思维的本质和机器的本质。
第三章:第一位黑客和他的虚拟机器
-
尽管他的言谈透露出中上阶层的出身,但他的着装方式、随意的仪容和刺耳的声音让大多数同龄人感到不快。作为大学更高学术社交圈的局外人,他的朋友不多,更喜欢把时间花在数学、化学实验、国际象棋谜题和乡间长跑上
-
那篇数学论文是西方文明文化史上的一个关键点。导致数字计算机出现的智力游戏的第一步,也是另一个持续了数千年的游戏的最后一步。在埃及和巴比伦,土地测量和星象预测系统的起源地,只有祭司和他们挑选的工匠才有特权了解这些神秘的计算艺术。在公元前五、六世纪希腊文明的鼎盛时期,这些原始科学被塑造成被称为公理系统的思维工具。
-
在一个公理系统中,你从已知为真的前提和已知有效的规则开始,以产生保证为真的新陈述。通过根据一套规则操纵符号可以得出结论。欧几里得几何是由正式公理系统所可能创造的一种普遍有用工具的经典例子。
-
公理系统是增强人类思维的工具。除了少数“闪电”计算器,人们无法在脑海中加上两个六位数。然而,几乎所有十岁以上的人只要给他们一张纸和一支铅笔,他们就能在不到一分钟的时间内告诉你答案。使一个学童变成计算机器的神奇成分是执行计算的逐步配方,这种配方被称为算法。我们知道这些算法有效的原因是因为它们基于我们知道为真的形式系统,称为算术。
-
图灵的论文所做的事情,以及使数字计算机成为可能的事情,源于千百年来将各种形式系统简化为一个基本系统的努力,这个基本系统是所有系统的基础。科学——我们文明中用于收集和验证知识的卓越系统——建立在数学之上,而数学又是对巴比伦人和希腊人原始数论的逻辑形式化。计算是试图证明数学真理可以简化为逻辑真理的意外结果。
-
与此同时,随着我们的文明在预测和理解宇宙的方法上因这些智力系统(即科学、数学和逻辑)而变得强大,一些人继续询问这些系统是否可以被简化为其基本组成部分。如果所有科学在足够先进时都可以简化为数学方程,那么是否有可能将数学简化到最基本的逻辑层面?
-
由于我们对知识系统的完整性和一致性的确信可能取决于这种简化是否可行,当证据开始出现表明存在例外、异常、悖论——数学结构中的漏洞可能阻碍任何此类形式系统的宏大简化时,这对西方思想家来说是非常令人不安的。这两项智力探索——将数学简化为一个基本的、正式的符号系统的努力,以及在追求这种宏大简化过程中出现的悖论进行修补的尝试——直接但出乎意料地导致了计算的发展。
-
在二十世纪的最初几十年,数学家和逻辑学家试图将数学形式化。大卫·希尔伯特和约翰·冯·诺依曼在 1920 年代制定了形式主义的规则(我们将在下一章中看到)。在希尔伯特和冯·诺依曼之前,怀特海德和伯特兰·罗素在他们的《数学原理》中展示了人类推理的某些方面可以被形式化描述,从而将对数学逻辑的这种新兴兴趣与该领域的早期创始人乔治·布尔的思想联系起来。形式系统的概念特别引人关注,因为它似乎在数学的抽象和人类思想的奥秘之间架起了桥梁。
-
形式系统是一种严格定义的游戏,规定了操作符号的规则。创建形式系统的条件与任何其他游戏的规则非常相似。为了告诉某人如何玩游戏,并使这套规则符合形式系统的标准,必须传达游戏的三个方面——符号的性质、起始位置的描述(或“棋盘”的起始布局),以及在任何给定位置允许的移动列表。国际象棋、跳棋、数学和逻辑是满足这些标准的形式系统的例子。到 20 世纪 30 年代,将数学简化为逻辑上安全的基础的努力导致了几次尝试,将算术——即涉及数字运算的数学分支——视为一种形式系统。
-
1936 年,年仅二十四岁的艾伦·M·图灵向他的同事们指出,可以通过一种机器——一种体现形式系统规则的机器——在数论中进行计算,从而确立了他作为有史以来最伟大的数学天才之一的地位。尽管这种机器本身并不存在于实际模型中,图灵从一开始就强调这种机器实际上是可以建造的。他的发现是数学形式化努力中的一个里程碑,同时也是计算历史上的一个分水岭。
-
在对形式主义者提出的关键元数学问题的精彩解决方案中,艾伦·图灵用精确的数学术语描述了一种具有极其简单操作规则的自动形式系统如何能够拥有非常强大的能力。自动形式系统是一种物理装置,它根据系统的规则自动操控形式系统的符号。图灵的理论机器既是他计算理论的一个例子,也是某种计算机实际上可以被构建的证明。
-
当他将数学和逻辑结合成一台机器时,图灵使符号处理系统成为可能。他提出,大多数智力问题都可以转换为“找出一个数字 n,使得……”的形式。比这一将智力的抽象与数字的具体领域联系起来的挑衅性声明更重要的是,图灵认识到在这种情况下,数字作为符号比作为数学计算的元素更为重要。这一认识至今仍激励着人工智能研究者的努力。
-
图灵最伟大的见解之一是他从一开始就理解了一件大多数计算机领域的专家尚未理解的事情——即数字只是解释自动形式系统内部状态的一种可能方式。巴贝奇的“行动模式”现在被用数学严谨性形式化了。图灵的“状态”提供了一个关键的隐喻,连接了人类认知的力量和机器的能力。
-
图灵在他的论文中形象地描述了计算过程,他让读者考虑一个可以在分成方格的纸带上读写简单符号的设备。“读/写头"可以沿着纸带向任一方向移动,每次移动一个方格,而一个控制单元可以解释关于在方格中读写符号的简单指令来指导头部的动作。每个阶段被"扫描"或"读取"的单个方格称为活动方格。想象一下,可以在现有纸带的任一端添加新部分,因此它可能是无限的。
-
假设符号是"X"和"O”。假设设备可以在读取活动方格中的符号时擦除任一符号,并用另一个符号替换它(即,擦除 X 并用 O 替换,反之亦然)。设备还能够根据控制单元解释的指令每次移动一个方格,向左或向右移动。指令会导致符号被擦除、写入或保持不变,具体取决于读取到的符号。
-
有四种不同的操作;它们是这个游戏中唯一合法的移动。它们是:将 O 替换为 X , 将 X 替换为 O, 向右移动一格, 向左移动一格
-
图灵证明对于任何形式系统,都存在一台可以被编程来模仿它的图灵机。图灵所指的正是这种具有模仿任何其他形式系统能力的通用形式系统。这些系统现在被称为“通用图灵机”。该理论首次在一篇题为《论可计算数及其在判定问题中的应用》的论文中提出
-
图灵和他的同事通过一个令人震惊的发现,结束了对形式系统逻辑确定基础的长期探索:我们永远无法确定形式系统的一些重要特征。形式系统本质上具有某些固有的局限性。在这一点上,计算理论不仅仅是元数学的一个重要分支,因为形式系统的特性逐渐淡出,而机器的特性则以一种完全出乎意料且戏剧性的方式显现出来——因为就在图灵限制了形式系统能力的同时,他证明了确实存在一种通用的形式系统。而这正是计算机在最基本意义上的定义。
-
通用图灵机模仿其他图灵机的方式就像我们的倍增机将输入乘以二一样自动。假设设备的控制单元能够解释简单的指令——自巴贝奇时代以来,这一直是工具制造者而非数学家的问题——就可以对描述各种图灵机的更复杂的指令列表进行编码,并将其与起始位置一起放到输入带上。
-
正如机器遵循的指令可以用英语(或德语、法语等)表示,或用像“7XL8”这样的缩写形式表示,它们也可以被编码成一种更原始的形式。可以设计一种代码,使用相同的 X 和 O,来唯一地表示每个指令和指令表(程序)。指令和数据都可以放在同一条带子上。然后,通用图灵机可以扫描该编码带,并执行代码中指定的功能(在我们的例子中,将带子数据部分的数字加倍)。
-
这种模仿其他机器的能力引领了计算机的发展。磁带上的数字(或 X 和 O)并不那么重要。它们只是过程状态的符号——“倍增游戏”中的标记。指令列表(程序)使机器能够将输入数字加倍。是指令,而不是记录它们执行方式的符号——是规则,而不是标记——让图灵机运作。通用图灵机主要是符号操控者。而数字计算机就是通用图灵机。
-
将游戏规则视为一种机器并不容易。如果你考虑那些定义得如此清晰和具体的“机械过程”,以至于机器可以通过参考指令表来执行它们,这项任务就会稍微容易一些。所有通用图灵机都是功能上相同的设备,用于遵循指令表指定的程序。指令表可以不同,它们可以将通用图灵机变成许多不同类型的机器。出于这个原因,这些程序有时被称为“虚拟机器”。
-
与其为解决不同问题而构建不同的物理机器,不如向一个遵循指令的机器描述不同的虚拟机器(程序),这些程序利用这种一次一方块的机械指令执行过程,通过简单操作的模式来解决复杂问题,这样更为实用。
-
遵循指令是数字计算机的本质。例如,计算器和打字机之间的区别在于它所遵循的指令——即它所接收到的虚拟机的编码描述,以便执行某项任务。由于计算机理解可以对应于 O 和 X,或 0 和 1,或“开”和“关”的“位”,你可以使用这些符号来编写描述,将通用机器转变为你想要的特定机器。这就是程序员的工作。他们设想人们可能想要使用的机器,并找出将这些机器描述给通用机器——也就是计算机的方法。
-
如果程序员必须花费所有时间来思考如何用 O 和 X 的字符串来描述机器,那么在编程中实现任何重要的事情将会过于耗时。O 和 X 代码类似于现在所谓的机器语言,实际上只有相对少数的程序员能够用它编写程序
-
汇编语言通过使用单词而不是数字,使得操控计算机的“方格”——即内存单元——变得更容易。你可以使用上面描述的翻译程序,称为汇编器,将汇编语言翻译成机器语言。
-
每种不同的微处理器(每台现代计算机核心的实际硅芯片硬件)都有大约一百种原始机器语言操作的列表——称为“固件”——内置其中。当汇编器按照汇编语言程序中的指令,用机器语言与微处理器对话时,虚拟机与实际机器相遇,计算机能够为启动整个过程的人类完成指定的任务。
-
由于在汇编语言中完成任务时,你必须非常具体地告诉计算机在哪里找到你想要的信息,何时将其移动到称为累加器的“活动方格”中,以及在处理后将其存储在哪里,因此用汇编语言编写任何复杂的东西都可能是一项苦差事——就像用信号旗写书,或用码尺测量城市一样。
-
最后一种虚拟机——类似英语的那种——被称为高级编程语言。高级并不意味着这种语言在智力上高深莫测,只是指它是由一个低级机器解释的虚拟机,而这个低级机器又可能被更低级的机器解释,直到达到最低级的开关脉冲,将 0 和 1 转换为电子可读的形式。BASIC 和 FORTRAN 以及程序员使用的其他语言实际上是虚拟机,这些虚拟机通过类似于上面提到的汇编器的其他虚拟机向计算机描述,这些虚拟机被称为解释器和编译器。
-
1936 年,克劳德·香农尚未发现乔治·布尔发明的用于形式化逻辑运算的代数与描述开关电路的数学是相同的。约翰·冯·诺依曼和他的同事们还没有设计出存储程序(stored programming)的概念。诺伯特·维纳还没有正式描述控制系统中的反馈电路。几个关键的电子发展尚未到来。
-
图灵是个古怪、有趣、随意、极其诚实、反复无常、内省、才华横溢且优雅的人,在社交方面有些笨拙
-
图灵关于计算机设计正确方法的理念强调需要将计算能力构建在程序中,而不是硬件中。他特别关注编程操作——或者说“编码”,因为它已经开始被这样称呼——通过这些操作,真正有趣的数学运算,甚至可能是“思考”本身,最终可能会被电子计算机模拟出来。尽管图灵首次尝试编写编程语言在今天看来可能显得粗糙,但他的理念远比当时可用的硬件先进得多。
-
但图灵意识到,计算只是计算设备可以模仿的形式系统之一。特别是,他看到了他理论机器的简单“指令表”如何成为一种强大语法的元素,这种语法可以被机器用来修改其自身的操作。
-
图灵的一项创新源于这样一个事实:基于布尔逻辑的计算机仅对以二进制数字形式输入的数据进行操作(即,使用两个符号表示的以二为幂的数字),而人类习惯于使用十进制系统书写数字(在该系统中,数字以十为幂,使用十个符号表示)。图灵参与编写了指令表,自动将人类书写的十进制数转换为机器可读的二进制数字。如果像加法、乘法和十进制到二进制转换这样的基本操作可以通过指令表输入到机器中,图灵认为可以建立起这样的表的层次结构。程序员将不再需要逐步重复地编写每一个操作指令,从而可以腾出精力编写更复杂操作的程序。
-
他认识到计算机的最终能力并不总是严格受工程考虑的限制,而是受当时尚未被称为“软件”的因素限制。
-
图灵不仅预见到软件工程最终会比硬件工程更困难、更耗时,还预见到了后来被称为“调试”的重要性: 指令表需要由具有计算经验的数学家来编制,或许还需要具备一定的解谜能力。可能会有大量这样的工作需要完成,因为每个已知的过程在某个阶段都必须被翻译成指令表的形式。这项工作将在机器建造的同时进行,以避免机器交付与结果产生之间的延迟。延迟是不可避免的,因为几乎看不见的障碍存在,在某种程度上,允许这些障碍存在比花费时间在设计上以消除它们更好(这种方法需要多少年?)。构建指令表的过程应该非常有趣。它永远不会真正变成一项苦差事,因为任何完全机械化的过程都可以交给机器本身来处理。
-
他最初的元数学形式主义源于他试图将人类思维过程与形式系统结构联系起来的努力,而图灵仍然对自动形式系统——计算机——有朝一日可能模拟人类推理的某些方面的可能性感到好奇。
-
图灵提出的关于通用机器能力的最深刻问题,集中在计算引擎未来可能具备模拟人类思维的能力上。如果机器有一天能够帮助创建自己的程序,机器是否在原则上能够执行类似人类思维的活动?
-
1950 年,图灵发表了另一篇具有深远影响的文章,这篇题为《计算机器与智能》的文章发表在哲学期刊《Mind》上。图灵用相对简短的文字,运用的不仅仅是常识,而完全没有数学公式,开创了计算机科学中最大胆的分支领域——人工智能。
-
1950 年的文章值得任何对人工智能问题感兴趣的人阅读。第一句话依然如图灵无疑所希望的那样直接而富有挑衅性:“我提议考虑这样一个问题‘机器能思考吗?’”
-
以典型的图灵风格,他通过描述——一个游戏!来开始对深层人工智能问题的思考。他称之为“模仿游戏”,但历史上称之为“图灵测试”。他写道,让我们开始时先搁置机器智能的问题,考虑一个由三个人玩的游戏——一个男人,一个女人,以及一个位于另一个房间的任意性别的审问者。游戏的目的是通过询问另一个房间的人,最终仅根据答案来识别谁是男人,谁是女人。为了掩饰外貌、声音和其他感官线索,审问通过电传打字机进行。
-
图灵接着让我们用一台机器代替其中一个未知的玩家,并为游戏制作一个新对象:这次,询问者要根据电传打字的对话来猜测,另一个房间里的哪个是人类,哪个是机器。
-
我相信大约在五十年后,可以对计算机进行编程……使它们能够如此出色地进行模仿游戏,以至于一个普通的询问者在五分钟的提问后,正确识别的机会不会超过 70%。原来的问题“机器能思考吗?”我认为太没有意义,不值得讨论。然而,我相信到本世纪末,词汇的使用和受过教育的观点将发生如此大的变化,以至于人们能够谈论机器思考而不期望它会被反驳。
-
阿达指出了一个问题,这个问题在关于机器智能可能性的争论中仍被大多数人引用:“分析机没有任何原创的企图。它能做的只是我们知道如何命令它去执行的事情。”图灵指出,如果阿达看到了他所看到的证据,即电子设备可以表现出一种原始形式的“学习”,她可能会有不同的看法。通过这种学习,程序最终能够掌握从未被具体编程过的任务,而这些任务是通过预先编程的试错技术而出现的。
-
1954 年 6 月,艾伦·图灵躺在床上,咬了一口苹果,将其蘸上氰化物,再次咬下去
-
如果不是第二次世界大战提供了顶尖的工程团队、几乎无限的资金,以及将科学发现应用于现实问题的意愿,计算机时代可能会被推迟几十年。
-
计算理论是一个非常重要的步骤——但如果你被限制在一个沿着磁带移动、擦除 O 并写入 X 的盒子里,你就无法在相当短的时间内进行非常复杂的计算
-
人类很少能产生像冯·诺依曼这样的博学者
第四章:约翰尼造炸弹和约翰尼造大脑
-
多种不同的科学和政治发展共同促成了 ENIAC 的发明。电子管技术、布尔逻辑、图灵型计算、巴贝奇-洛夫莱斯编程和反馈控制理论因战争部对计算能力的极度渴求而结合在一起。约翰·冯·诺依曼是唯一一个不仅对科学问题有足够了解,而且能够在普林斯顿、洛斯阿拉莫斯和华盛顿的社交圈中游刃有余的人,他将这些线索结合在一起,设计出一个优雅而强大的方案。
-
他是现代博弈论的共同创始人(在巴贝奇的基础上继续发展),运筹学的创始人之一(同样有趣的是,这一领域最初也是由巴贝奇探索的)
-
根据前原子能委员会主席刘易斯·斯特劳斯上将的说法:“在临终前的一次戏剧性场合,沃尔特·里德医院举行了一次会议,国防部长及其副手、陆军、海军和空军部长以及所有参谋长联席会议的成员都聚集在他的病床旁,倾听他最后的建议和智慧之言。”
-
与图灵不同,冯·诺依曼是一个老练、世故且善于交际的人,他因在普林斯顿高等研究院任职期间以及在洛斯阿拉莫斯的梅萨山上与妻子举办的每周鸡尾酒会而闻名。他有可观的私人收入,并从研究所获得每年额外的 1 万美元。他以掌握多种语言的笑话、对低俗打油诗的广博知识以及随意而鲁莽的驾驶方式而广为人知,他经常在撞毁汽车后奇迹般地毫发无损。
-
洛芙莱斯因癌症在三十六岁时去世,图灵因氰化物在四十二岁时去世,而冯·诺依曼因癌症在五十三岁时去世
-
约翰尼的朋友们记得他特有的姿态:站在黑板前或在家中讨论问题。不知何故,他的手势、微笑和眼神总是反映出正在讨论的问题的思考或性质。他中等身材,年轻时相当瘦削,后来逐渐发福;以小步伐移动,伴有相当随意的加速,但从不以极快的速度。当一个问题展现出逻辑或数学悖论的特征时,他的脸上总会闪现出微笑。尽管他喜欢抽象的机智,他对更接地气的喜剧和幽默有着强烈的欣赏(几乎可以说是渴望)
-
在阿伯丁的这次偶然相遇,为冯·诺依曼提供了一个几乎完成的方法来解决一个他独特地能够理解其战略意义的问题,其细节复杂而深奥,足以吸引他的智力好奇心,而成功完成这一问题可以通过他所拥有的政治影响力来加速。
-
虽然第一台电子计算机的其他主要创造者要么是数学家,要么是电气工程师,但冯·诺依曼还是一位出色的逻辑学家,这使他能够理解其他人很少能理解的东西——这些设备属于一个远远超越超级快速计算引擎的类别。
-
在 1920 年代末,在他对量子物理学、逻辑学和博弈论的重大贡献之间,来自哥廷根的年轻约翰·冯·诺依曼是国际数学谜题游戏的主要参与者之一,这场游戏始于七十年前的布尔,并在十年后导致了图灵的通用机器的发明。
-
十九世纪末即将到来的哲学与数学的碰撞让数学家们感到极为不安。与人类思想相关的滑溜的形而上学概念可能会吸引像布尔或图灵这样的人。但对于哥廷根的戴维·希尔伯特和其他 20 世纪初的人来说,这种模糊性对一个旨在将所有科学定律简化为数学方程的事业的未来构成了严重威胁。
-
希尔伯特坚持认为,更“纯粹”形式的数学的逻辑和元数学基础只能用数值问题以及精确定义的符号、规则和操作来清晰地表述。这就是形式主义的学说,后来激发了图灵对机器能力的惊人发现。约翰·冯·诺依曼是希尔伯特的学生之一,也是形式主义者中的明星。冯·诺依曼的元数学成就本身就很了不起
-
1927 年,年仅 24 岁的冯·诺依曼发表了五篇论文,这些论文在学术界立刻引起轰动,并在三个不同的思想领域中仍然被视为里程碑。这是历史上最引人注目的跨学科三重奏之一。他在 1927 年的三篇杰作对量子物理学领域至关重要。另一篇论文奠定了博弈论这一新领域。与计算未来最直接相关的论文则讨论了形式逻辑系统与数学极限之间的关系。
-
在他 1927 年的最后一篇论文中,冯·诺依曼展示了证明所有数学一致性的必要性,这是为计算建立理论基础的一个关键步骤(尽管当时还没有人知道这一点)。这导致一年后,希尔伯特发表了一篇论文,列出了他和冯·诺依曼认为是现代逻辑学家和数学家面临的最重要的三个未解问题。
-
第一个问题是数学是否是完备的。完备性,在数学家使用的技术意义上,意味着每一个真实的数学命题都可以被证明(即,是一个有效证明的最后一行)。
-
第二个问题,也是冯·诺依曼最关心的问题,问的是数学(或任何其他形式系统)是否是一致的。在技术意义上,一致性意味着不存在一个有效的允许步骤序列(或“动作”或“状态”)可以将一个不真实的命题证明为真实。如果算术是一个一致的系统,就永远不会有办法证明 1 + 1 = 3。
-
第三个问题,打开了通向计算的侧门,问的是数学是否是可判定的。可判定性意味着存在某种确定的方法,可以保证正确地判断一个命题是否可以被证明。
-
对于第一个希尔伯特-冯·诺依曼问题,很快就出现了一个令人震惊的答案。1930 年,另一位年轻的数学家库尔特·哥德尔证明了算术不能是完备的,因为总会有至少一个无法证明的真命题。在证明这一点的过程中,哥德尔跨越了逻辑与数学之间的关键门槛,他展示了任何像数系一样丰富的形式系统(即包含数学运算符+和=)都可以用算术来表达。这意味着无论数学(或任何其他同等强大的形式系统)变得多么复杂,它总是可以用对数字进行操作的方式来表达,系统的各个部分(无论它们是否本质上是数值的)都可以通过计数和比较的规则来操作。
-
冯·诺依曼和希尔伯特关于数学可判定性的第三个问题引导图灵在 1936 年取得突破。可判定性问题所要求的“确定方法”(用于判断数学命题是否可证明)被艾伦·图灵表述为一种机器,该机器可以在纸带上以符号编码的陈述上进行确定步骤的操作。哥德尔已经展示了如何用数字表示形式系统的操作,而图灵展示了如何将形式系统以数字形式描述给一台能够解码这种描述的机器(例如,将系统的规则翻译成“找到一个数字 n,使得……”的形式,其中“n”可以表示为一串零和一)。
-
类似的角色由数百名熟练的计算员担任,图灵和他的同事称她们为“女孩”以及“计算机”(computers)。
-
真空管可以以每秒一百万次的速度开关
-
Mauchly 特别注意到宇宙射线研究人员开发的一种电路——巧合电路,其中只有当几个信号同时到达时开关才会闭合,从而实际上做出一个决定。通过这种电路的某种变体,是否有可能制造出能够进行电子逻辑运算的机器?
-
我们应该意识到,所提议的机器最终包含了超过 17,000 个 16 种不同类型的电子管,以每秒 100,000 次脉冲的基本时钟频率运行……如果 17,000 个电子管中有一个运行不正常,每 10 微秒就会发生一次错误;这意味着在一秒钟内有 17 亿次……发生故障的可能性……人类从未制造出能够以如此高的精确度或可靠性运行的仪器,这就是为什么这个项目如此冒险,而成就如此伟大。
-
ENIAC 是个庞然大物——长 100 英尺,高 10 英尺,深 3 英尺,重达 30 吨——足够热以至于房间温度接近 120 华氏度,同时它通过其超过 17,000 个管子、70,000 个电阻器、10,000 个电容器和 6,000 个手动开关处理多变量微分方程。它消耗了巨大的电力——传说中,当它插上电源时,费城的灯光都变暗了。
-
冯·诺依曼开始意识到,他们所谈论的是一种通用机器,其本质上特别适合作为人类思维的延伸。
-
他似乎对这些设备可能演变成某种智力延伸的想法最为热衷
-
他更倾向于将计算机视为其用户功能的技术延伸;这将导致人类大脑的扩展,而冯·诺依曼希望尽可能快地推动这种扩展。
-
如果能有一种更直接的方法让不同的指令集——计算系统中不灵活、难以改变的部分——与存储在电子存储器中的数据进行交互,这样计算的更快速访问部分就能更快地实现。冯·诺依曼和他的同事们提出的解决方案是基于逻辑突破的创新。
-
在一个关键段落中,EDVAC 草稿指出了一些巴贝奇(如果不是图灵的话)所忽视的东西:“该设备需要相当大的内存(memory)。虽然看起来这内存的各个部分需要执行在性质上略有不同且在目的上相当不同的功能,但仍然很有诱惑力将整个内存视为一个器官。”换句话说,一台通用计算机应该能够在其内部存储器中存储指令以及数据。
-
过去复杂的交换机设置配置可以由程序员以数字形式符号化,并由计算机读取为存储在内存中的指令位置,这个指令会自动应用于同样存储在内存中的指定数据。这意味着程序可以调用其他程序,甚至修改其他程序,而无需人工操作员的干预。突然间,通过这个简单的改变,真正的信息处理成为可能。
-
自 1939 年以来,他几乎只关注符号、状态和指令表——以及如何将这些尽可能有效地体现为具体形式的问题。
-
第四,他清晰地阐述了现代计算机的串行操作模式,即一次检查并执行一条指令。这与 ENIAC 的并行操作形成鲜明对比,后者同时执行许多操作。
-
这种可变性是通过将数值数据视为可以分配到内存中特定位置的“值”来实现的。EDVAC 型计算机的基本内存组件使用称为“寄存器”的内存元素集合,以一系列开/关脉冲的形式存储数值。每个数字在内存中被分配了一个“地址”,任何地址都可以包含数据或指令。通过这种方式,控制单元可以在需要时定位特定的数据和指令。其结果之一是,特定的数据可以是一个变量——就像代数中的 x——可以通过将操作结果存储在适当的地址,或者通过指示计算机对该位置的内容执行操作来独立更改。
-
任何一系列计算指令的特征之一是对数据的引用:当指令告诉机器如何执行计算时,它们必须指定要插入计算的数据。通过将对数据的引用变为对特定内存位置内容的引用,而不是对特定数字的引用,就可以根据前面步骤的结果在计算过程中更改数据。正是通过这种方式,存储在内存中的数字可以象征除数值以外的其他数量,就像代数使人们能够在不指定值的情况下操作像 x 和 y 这样的符号一样。
-
如果你将内存地址想象成编号的小隔间或邮政信箱,这个模式的逻辑就更容易理解了——每个地址只不过是找到信息的地方。地址就像是容易找到的容器,用来存放(可变的)值(即“信息”)。例如,1 号箱可能包含一个数字;2 号箱可能包含另一个数字;3 号箱可能包含对 1 号和 2 号箱中数字进行算术运算的指令;4 号箱可能包含在 3 号箱中指定的运算。前两个箱子中的数字可能是固定的数字,也可能是变量,其值可能取决于其他运算的结果。
-
通过将指令和原始数据放在同一内存中,计算速度比 ENIAC 快得多,但也有必要设计一种方法,明确指示机器某些特定地址包含指令,而其他地址包含这些指令要操作的数字。
-
所有指令的执行都基于内置时钟的滴答声按照时间方案进行。“指令”周期和“执行”周期交替进行:在“滴答”时,机器的控制单元将传来的数字解释为指令,并准备在“答滴”时执行指令中指定的操作,当“执行”周期开始时,控制单元将输入解释为要操作的数据。
-
“初步报告”的作者宣称,所有此类机器都必须具备一个可以执行算术和逻辑运算的单元(即进行实际计算的处理单元,相当于巴贝奇的“磨坊”),一个可以存储当前问题的指令和数据的单元(类似于巴贝奇的“存储器”,一种临时存储设备),一个按照指定顺序执行指令的单元(类似于图灵理论机器的“读/写头”),以及一个人类操作员可以输入原始信息或查看计算输出的单元(我们现在称之为“输入输出设备”)。
-
算术和逻辑单元是系统基本操作的所在。所有其他指令都是由这些基本操作构建而成的。原则上,可以用极少数非常简单的内置操作来构建这种类型的设备。例如,当程序请求乘法操作时,可以通过重复执行加法来实现。实际上,唯一绝对必要的两个操作是“非”和“与”。使用少数非常简单的硬件操作和由此构建的相对复杂的软件结构的问题在于,这会减慢计算机的操作速度:因为指令是随着内部时钟的滴答声一个接一个地执行的(“串行”),所以程序中的基本指令数量决定了计算机运行该程序所需的时间。
-
输入输出设备是系统中进展最缓慢的部分,而基于开关的存储、算术和控制组件则以数量级的速度提升。
-
在 1945 年 11 月关于 IAS 机器的早期提案之一的备忘录中,冯·诺依曼预见到了在该领域未来突破的可能性及其影响,并预期可能会创造出一种更具视觉导向的输出设备: 在许多情况下,真正需要的输出不是数字(可能是打印的),而是图像(绘图)。在这种情况下,机器应直接绘制图像,尤其是因为绘图可以通过电子方式完成,因此比打印更快。在这种情况下,自然的输出是示波器,即其荧光屏上的图像。在某些情况下,这些图像需要永久存储……在其他情况下,只需要进行目视检查。两种选择都应提供。
-
冯·诺依曼专注于生命之谜中吸引他最深的本能和最强大能力的方面——自然代码的纯粹、逻辑、数学基础。他特别对被称为自动机的理论装置的逻辑特性感兴趣,图灵机就是一个例子。
-
冯·诺依曼特别被自我复制自动机的概念所吸引——这些是在空间和时间中能够自我复制的数学模式。他能够利用自己对计算机的知识、对神经生理学和生物学的日益理解,并特别善于运用他对逻辑的深刻理解,因为他认为自我复制自动机本质上是逻辑的产物。地球上存在的生物体完成这一任务的方式只是其中一种方式。原则上,这一任务可以由一台能够遵循计划的机器来完成,因为计划,而不是执行计划的机制,是系统的一部分,具有将生命与非生命物质区分开来的特殊且迄今为止神秘的属性。
-
冯·诺依曼在抽象层面上研究“元胞自动机”,就像图灵对其第一台机器所做的那样。早在 1948 年,他就表明,任何自我复制系统都必须具备原材料、提供指令的程序、遵循指令并在图灵型机器的单元中排列符号的自动机、复制指令的系统以及一个监督单元——这恰好是对活细胞中 DNA 指导蛋白质合成的极好描述。
-
利用他的同事 Stanislav Ulam 的工作,冯·诺依曼能够完善他的计算并使其更具普遍适用性。冯·诺依曼的思维实验,我们可以轻松地以游戏的形式呈现,利用一个由单元格划分的均匀空间。我们可以将这些单元格视为棋盘上的方格。为每个方格分配有限数量的状态——例如,空的、被占据的或被特定颜色占据的。同时,为每个单元格定义一个邻域。这个邻域可以由四个正交相邻的单元格或八个正交和对角相邻的单元格组成。在这样划分的空间中,转换规则同时应用于每个单元格。任何特定单元格的转换将取决于其状态及其邻居的状态。冯·诺依曼能够证明,一个由大约 200,000 个单元格组成的配置,每个单元格有 29 种不同的可能状态,并且每个单元格位于 4 个正交相邻方格的邻域中,可以满足自我复制自动机的所有要求。 由于冯·诺依曼的模型也被设计用来模拟图灵机,因此需要大量的元素。理论上,冯·诺依曼的机器可以执行任何数学运算。
-
冯·诺依曼提出了这样一个系统:一个工厂内部包含了制造相同工厂(以及相同蓝图)的机器和详细蓝图,使用提供给它的原材料。再进一步增加复杂性,细节可以包括一个子系统的规范,该子系统从环境中寻找工厂所需的原材料,无需人工干预。
-
如果在复杂性谱系上再幻想一步,这些指令和能力可以指定能够建造宇宙飞船的工厂,以便将更多的宇宙飞船送往其他星球,在那里找到的原材料将被加工成更多的工厂-宇宙飞船-发射台系统,如果你能够建造能够建造两个或更多此类综合体的工厂,你就可以形成一种对抗宇宙普遍无序趋势的力量,以一种(无意识的?)工厂建造工厂的群体形式,像反熵的逻辑蝗虫群一样向外吞噬穿越星系。
第五章:前神童与防空炮
-
如今,当分子生物学家谈论 DNA 分子的“编码”,认知科学家讨论“大脑的软件”,行为心理学家写到“重新编程旧习惯”时,他们都在利用一种源自计算技术的科学隐喻,但这种隐喻已经涵盖了远不止计算设备的机械原理
-
诺伯特在十八岁时完成了数学逻辑的考试和博士论文,然后在剑桥与伯特兰·罗素学习,并在哥廷根与大卫·希尔伯特学习,在那里他后来与小他九岁的冯·诺依曼相遇,冯·诺依曼也是希尔伯特的学生
-
很少有老师或学生不被冯·诺依曼的魅力所吸引,他总是尽力向周围的人保证自己和其他人一样是凡人。维纳则不同,他性格不安、远不如冯·诺依曼世故,有时自负,常常过于敏感,他在数学领域之外并不费心去给人留下深刻印象
-
尽管他情绪多变且多疑,维纳真正关心“人类对人类的使用”(这是他后来一本关于控制论影响的书的标题),并热情地提醒科学界他们对自己创造的毁灭性武器负有特殊责任。尽管他未能与一些同事和睦相处,维纳始终坚信科学事业的未来在于跨学科合作。
-
像冯·诺依曼一样,维纳最重要的需求是有趣的问题。
-
在第二次世界大战初期,盟军面临的两个最紧迫的问题是北大西洋的毁灭性 U 型潜艇战争和同样毁灭性的德国空军对英国的攻击。图灵对海军 Enigma 密码机的秘密破解在很大程度上解决了 U 型潜艇的问题。但图灵的问题是密码分析,即通过数学手段从混乱的信息中提取意义,而德国空军的问题则是预测未来:如何射击一架飞行速度与子弹相当的飞机?
-
雷达最初的通信问题在于雷达设备就像一个调谐不良的收音机。攻击飞机的真实信号常常被来自其他来源的虚假信号——噪声——淹没。维纳认识到这也是一种密码学问题,如果将敌机的位置视为必须从周围噪声中解码的信息。
-
嘈杂的雷达不仅仅是一个普通的“有趣问题”,因为一旦你从相对于无序和不确定性来衡量的秩序和信息的角度理解信息和噪声,并应用统计学来预测未来的信息,就会变得清晰(对于维纳这样级别的数学家来说),这个问题与宇宙中基本的秩序和无序过程有关。一旦从统计和数学的角度来看,通信问题就引向了一个更重要的核心,被称为信息论。
-
然后,Wiener 和 Bigelow 想到,人类有机体已经解决了他们面临的问题。任何一个人类,或者说一只黑猩猩,如何能够伸出手去拿起一支铅笔?人们如何能够把一只脚放在另一只脚前面,向前倾倒一小段距离,最终迈出一步?这两个过程都涉及肌肉的连续、精确调整(移动枪的伺服机制),由连续的视觉信息(雷达)引导,并由预测轨迹的连续过程控制。预测和控制发生在神经系统中(动画自动机的控制电路)。
-
反馈是连接大脑、自动火炮、蒸汽机、自动驾驶仪和恒温器执行其功能的概念。在这些系统中,过去输出的一小部分被反馈到中央处理器作为当前输入,以引导未来的输出。眼睛看到的手与铅笔之间的距离信息被反馈给控制手的肌肉。同样,雷达感知到的炮的位置和目标的位置被反馈给自动瞄准装置。
-
麻省理工学院的团队曾想知道是否有对神经生理学更了解的人遇到过类似的数学问题,并得出了相似的结果。恰巧,确实有另一个团队,像维纳和比格洛一样,由一位神童和一位稍年长的天才组成,分别是皮茨和麦卡洛克,他们正从另一个方向走上完全相同的道路。
-
他们相信该模型将展示目的如何体现在机制中——无论该机制是由金属还是肉体构成
-
因此,McCulloch 作为数学家,非常渴望有一种工具能够将神经生理学中模糊的观察和理论不确定性转化为数学的精确性。在他之前,图灵和伯特兰·罗素,以及更早的布尔,都在追求类似的东西,但他们都缺乏对大脑生理学的深入理解。McCulloch 的目标是找到大脑的基本功能单元,由某种神经细胞的组合构成,并发现这种基本单元如何构建成更复杂的系统。他一直在试验“神经网络”模型,并发现这些网络具有某些数学和逻辑特性。
-
十五岁时,沃尔特·皮茨离家出走,因为他的父亲想让他辍学去找工作。他到了芝加哥,遇到了一位对逻辑略知一二的人。这个人名叫“伯特”,建议皮茨阅读当时在芝加哥任教的逻辑学家卡尔纳普的书。伯特原来是伯特兰·罗素,而皮茨则向卡尔纳普自我介绍,以指出这位伟大的逻辑学家在书中犯的一个错误。
-
皮茨帮助麦卡洛克理解某些类型的网络——这些网络可能是神经系统和电子设备的重要组成部分——如何能够体现被称为图灵机的逻辑装置。
-
麦卡洛克和皮茨发展出一种理论,将神经视为全或无、开或关的开关装置,并将网络视为可以用数学和逻辑描述的电路。他们的论文《神经活动中固有思想的逻辑演算》于 1943 年发表,当时皮茨年仅十八岁。他们认为自己只是开始了一项工作,这项工作最终将解决大脑生理学如何与知识相联系的问题。
-
1943 年和 1944 年,维纳、比格洛和罗森布鲁斯与麦卡洛克和皮茨聚在一起,达到了一个思想的临界质量
-
对冯·诺依曼来说,噬菌体——一种可以自我复制的非生命微生物——是一个更有前途的研究对象。他认为,通过研究微生物可以比研究大脑学到更多关于自然编码的知识。脑生理学的奥秘与生物繁殖的秘密之间的联系后来在涉及信息本质的理论中更加清晰地显现出来,而冯·诺依曼被证明是正确的——生物学家在理解生物繁殖编码方面的进展比神经科学家在解码大脑功能的探索中要快得多。
-
他讲一口优美而清晰的英语,带有轻微的中欧口音,总是穿着考究;通常穿着背心,扣上外套,口袋里放着手帕,更像银行家而非学者。他被视为文雅、国际化、机智、低调、友好且平易近人。他说话很快,梅西会议上的许多人常常跟不上他那精确而快速的推理
-
维纳在讨论中打瞌睡甚至打鼾的倾向让一些人既感到好奇又感到恼火,但显然他能听到并消化所说的内容。他一醒来就常常发表深刻的评论。
-
后来的研究表明,开关电路并不是人类神经系统的准确模型,因为神经元并不严格作为“全或无”的设备运作
-
在 1944 年和 1945 年,维纳已经在思考一个涉及通信、信息、自我控制的科学模型——一种包罗万象的自然观,包括对计算机和大脑、生物学和电子学、逻辑和目的的解释。他后来写道:“几乎从一开始,我就清楚地意识到,这些关于通信和控制的新概念涉及对人类、人类对宇宙的认知以及社会的新诠释。”
-
回到墨西哥城后,维纳撰写了他的书,并决定将其命名为“控制论”,这个词源自希腊语,意为“舵手”。副标题是:或动物与机器中的控制与通信。控制论描述了一种普遍的科学机制,用于在无序的宇宙中维持秩序,通过关于过去的信息和对未来的预测来引导穿越物理世界随机力量的过程。
-
当舵手移动舵时,船只会改变航向。当舵手发现之前的航向改变过度时,舵会再次被移动,朝相反的方向。舵手感官的反馈是保持船只航行在正确航线上的控制要素。维纳打算在学科名称中嵌入这样一个理念,即操控与通信之间存在联系。他表示:“工程中的控制理论,无论是人类、动物还是机械,都是信息理论中的一个章节。”
-
看起来 Wiener 可能发现了信息、能量和物质之间更为宇宙的联系。
-
维纳时不时会走进学生的办公室,神秘地告诉他“信息就是熵”,然后一句话也不说就走了。
-
量子物理学家埃尔温·薛定谔于 1945 年在剑桥大学发表了一场著名的演讲,后来以《生命是什么?》为题出版。听众中一位年轻的物理学家弗朗西斯·克里克决定转向生物学,在那里,科学史上最关键的解码问题正等待着他。冯·诺依曼在与维纳的争论中被证明是正确的——下一个伟大的解码对象是噬菌体,而不是神经系统。
-
某种关于秩序与无序、信息与噪声的东西接近生命的核心
-
信息,以一种直到克劳德·香农 1948 年发表的论文才在数学上得到证明的方式,开始看起来像是宇宙运作方式的反映
-
在二十世纪初,科学家们将宇宙视为粒子和力以复杂但有序的模式相互作用的体系,原则上是完全可预测的。在重要的方面,生活在日益机械化文明中的所有非科学家也将宇宙视为粒子和力以及一个钟表般的宇宙。大约六十年前,量子理论摒弃了钟表机制和可预测性。大约三十年前,一些人开始以诺伯特·维纳所说的方式看待世界,看到“无数的致相关人士的信息。”
-
维纳和克劳德·香农赋予了诸如通信和信息等常用词汇新的技术含义,他们独立且几乎同时地证明,从亚原子粒子的随机运动到电气开关网络的行为以及人类语言的可理解性,都以某种方式相关,并可以通过某些基本的数学方程来表达。
-
受信息-通信模型启发的研究为宇宙的一些基本特征提供了线索,从生命的细胞指令如何编织在 DNA 分子中的原子排列中,到大脑细胞编码记忆的过程。该模型已成为托马斯·库恩所称的“科学范式”。这一范式的两个基本支柱是 Claude Shannon 的信息论和 Wiener 的控制论。
-
能量——牛顿力学的核心概念——现在被信息所取代。信息论的思想,如编码、存储、噪声等,为从电子电路的行为到复制细胞的行为等一系列事件提供了更好的解释。……这些术语的意思几乎就是你所想的那样。编码指的是“在传递信息时用来表示字母或数字的信号系统”;存储意味着在需要时保留这些信号。噪声是在传输过程中模糊或影响信号(或信息)质量的干扰。
-
编码和存储恰好是计算机逻辑设计和软件创建中的核心问题
第六章:内幕信息
-
克劳德·香农是一位名副其实的神童,他在 22 岁时(1937 年)发表了著名的麻省理工学院硕士论文,将电路与逻辑形式联系起来。他是图灵、维纳和冯·诺依曼等先驱的同辈,是第一代人工智能探索者如约翰·麦卡锡和马文·明斯基的老师,也是伊万·萨瑟兰的导师,后者是当代最重要的信息建筑师之一。
-
布尔在《思维法则》中指出,他成功地将人类推理过程与数学的精确符号力量联系起来。在布尔提出的逻辑计算系统中,只有两个值:1 和 0。如果一个值为真,可以用符号 1 表示;如果为假,则可以用符号 0 表示。在这个系统中,真值表描述了系统的各种可能的逻辑状态
-
通过在真值表中匹配适当的行和列来确定结果的方式,这是一种纯自动化的过程,与图灵提出的“指令表”有着重要的相似之处。
-
通过在每个与输入之前加上一个非,并在其输出之后再加上一个非,可以构建一个“或”运算
-
通过仅使用这两个基本运算“非”和“与”的各种序列,可以构建加、减、乘、除的过程。因此,逻辑和算术是密切且简单相关的。直到香农告诉我们之前,没有人知道同样的代数可以描述电气开关电路的行为。
-
同样重要的是,这些逻辑和算术操作的组合可以用来构建一个“记忆”操作。布尔代数使得设计一个程序或构建一个设备成为可能,其“状态”可以存储特定的信息——无论是数据还是操作。如果电路能够执行逻辑和数学操作,并且还能存储这些操作的结果,那么电子数字计算机就可以被设计出来。
-
香农对由称为继电器的非常简单的设备构建的复杂电路的特性很感兴趣。继电器是一种开关——一种打开或关闭电路、允许或阻止电流流动的设备——与普通的电灯开关类似,只是继电器不是由人手开关,而是由电流的通过来控制。
-
继电器包含一个电磁铁。当小电流流入继电器时,电磁铁被激活,关闭由继电器控制的电路,直到输入电流被关闭。换句话说,电磁铁是一个打开和关闭另一个电路的小电路。一个继电器的电路也可以控制下一个继电器的电磁铁,依此类推,直到你拥有一个完全由开关组成的电路,所有开关相互控制,取决于它们在开始时的设置以及如何被新的输入改变。
-
每个继电器及其控制的电路只能处于两种状态之一,开或关。这种开关电路的双态特性将电力与逻辑联系起来,因为每个继电器控制的电路可以看作是真值表,只有在满足特定输入条件时,电流才会从输出端流出,而逻辑操作可以看作是物理设备,只有当所有输入开关都处于开、关或某种特定组合时,才会发出输出脉冲。
-
在 20 世纪 30 年代,电话系统使用的电路迷宫越来越大、越来越复杂,这些电路由继电器控制。继电器可以在达到特定输入条件时闭合电路,而不再需要人工操作员将正确的插头插入交换机的正确部分。使用继电器,可以在自动拨号和路由方面完成各种有用的事情。但电路的日益复杂化开始成为一个问题。越来越难以弄清楚这些庞大的开关集合在做什么。
-
如果逻辑是最接近人类推理操作的形式系统,而布尔的真值表可以体现这样一个模拟推理的形式系统,那么使用真值表作为图灵所讨论的“指令表”,并用继电器这样的开关设备来表示机器的“状态”(或磁带的单元),就有可能构建出能够模拟人类思维某些逻辑操作的电路。
-
正如他在战后找到了描述继电器电路的完美工具一样,香农希望找到数学工具来精确定义这些新机器正在处理的无形但强大的商品。他成功地找到了他所寻求的描述工具,这些工具并不是在数学的某个晦涩角落中发现的,而是在支配能量的基本法则中找到了。
-
虽然香农具体研究的是人造系统中信息传递的基本规律,并普遍关注信息与噪声之间的区别,但他最终处理的是宇宙中能量流动的规律。特别是,他发现了解码电话交换网络的秘密,这些秘密隐藏在先前科学家们发现的关于蒸汽机热能的某些规律中。
-
热力学第一定律指出,封闭系统中的能量是恒定的。这意味着在这样的系统中,能量不能被创造或销毁,只能被转化。第二定律实际上指出,每次发生转化时,那部分不可改变的能量储备会变得稍微不稳定。当你将热水倒入冷水中时,你无法再将其分离回一杯热水和一杯冷水(除非使用更多的能量)。熵,意为“转化”,是克劳修斯后来为那部分丧失的可用能量提出的词。
-
而克劳修斯证明了这种系统的熵随着时间的推移趋于增加,因此关于遥远但不可避免的“宇宙热寂”的阴郁预测成为热力学第二定律的一个令人不安的含义。他们称之为“热寂”,因为热是最具熵的能量形式。
-
但关于时间终结的阴郁消息并不是熵概念的唯一含义。当人们发现热量是分子群体平均运动的度量时,熵的概念就与系统中的有序或无序度量联系在一起
-
一副未洗过的牌具有较低的熵,因为在以不太可能的方式排列它时投入了能量。然后需要较少的能量将这副牌置于一个更可能、更无序、更不可预测、熵更高的状态:根据热力学第二定律,宇宙中的所有牌最终都会被洗乱,就像所有分子最终会拥有相同的能量一样。
-
1922 年,一位名叫 Leo Szilard 的匈牙利物理学学生(后来成为冯·诺依曼在曼哈顿计划中的同事)在柏林最终解决了麦克斯韦妖的悖论。他证明了妖确实需要向系统贡献能量,但就像一个优秀的魔术师,妖并不是在最显而易见的活动——移动门——中消耗能量,而是在它对系统的了解中消耗能量。妖是系统的一部分,它必须做一些工作,以便在适当的时机区分热分子和冷分子来打开门。仅仅通过获取操作门所需的分子信息,妖向系统增加的熵比它减少的还要多。
-
在这个游戏树代码中的基本元素,二进制决策,是香农信息基本度量——比特的基础。每当计算机爱好者谈论“比特”时,他们指的就是分叉路径花园中的一个决策。
-
每一个决策、每一位信息都会减少情况的不确定性,无论你是在指定路径中的转弯、猜谜游戏中的数字,还是容器中分子的能量状态
-
一个事件发生的相对概率,无论是一个分子是热的概率,还是一个符号是字母表中特定字母的概率,取决于总体中的案例总数和指定事件的频率。如果总体中只有两个案例,一个简单的是或否的决定就能将不确定性降为零。在一个由四个组成的群体中,需要两个决定才能确定。在一个由万亿个组成的群体中,你需要稍微猜测一下。当你对如此庞大的群体进行预测时,必须用基于总体行为的平均值来代替基于个体行为的精确逐案计算。
-
每当一个系统用平均值来表示时,必然会丢失一些信息,就像两个能量状态在达到平衡时会损失一点能量一样。
-
香农在 1948 年展示的其中一件事是,一个系统的熵可以用该系统中可能状态组合的对数来表示——这与为了定位一个个体情况需要问的是非问题数量相同。香农重新定义的熵,与识别特定符号序列所需的二进制决策数量相同。综合来看,这些二进制决策就像游戏中的答案一样,构成了关于该系统的确定信息量。
-
在分子排列方面,生物体似乎拥有大量关于如何将基本物质转化为复杂化合物的信息。不知何故,活细胞能够将其环境中的各种分子杂乱无章地组合起来,并将其排列成维持生物体生命所需的物质。从无序的环境中,生物体以某种方式创造了自身的内部秩序。这种非凡的特性现在听起来令人怀疑地像麦克斯韦妖。我们现在知道,答案在于 DNA 分子排列其元素的方式——以这种方式,代谢和繁殖所需的过程被编码。薛定谔所说的所有生命的“负熵”就是信息,而香农准确地展示了这种编码如何完成——无论是在分子、信息还是交换网络中。
-
顺便说一下,香农对于使用“熵”这个词来表示他的方程所暗示的这个度量是持保留态度的,但冯·诺依曼告诉他还是用这个词,因为“既然没有人知道熵是什么,在辩论中你肯定会占有优势。”
-
传递信息的信号与其他事件有何不同?为了确保声音在无线电中被理解,尽管有大气干扰或其他来源的静电,需要投入多少能量?这些是香农试图解答的问题。
-
香农表明,通过设计合适的编码,任何信息都可以以任意高的可靠性进行传输。自然界施加的限制仅与通信信道的极限有关。只要存在信道,无论多么嘈杂,都可以设计出一种编码,以任何程度的确定性传输任何信息
-
人们似乎过于迅速地从基于能量的宇宙隐喻转向信息模型
-
与其将人体视为钟表般的机器,不如将其理解为复杂的通信网络。香农的“噪声信道”定理所保证的纠错码对于蛋白质合成的遗传控制和计算机网络中的协议同样有用。香农在麻省理工学院的同事诺姆·乔姆斯基在探索语言的“深层结构”时也使用了类似的工具。
-
维纳将计算机视为一种自我控制的机制,而冯·诺依曼则将其视为具有逻辑和数学特性的设备,香农则倾向于将 ENIAC 和 UNIVAC 视为信息处理机器。
-
香农指出了当时极少数人认识到的事实——电子数字计算机可以“被改编为符号化地处理代表单词、命题或其他概念实体的元素。”
-
这种“组合爆炸”——在任何系统中,每个层级通向两个或更多更深层级时,快速且压倒性的替代方案积累——是克劳德·香农习惯揭示的另一个自然秘密。替代决策数量的爆炸性增长是一个障碍,阻碍了任何试图详尽检查分支结构的努力,并且继续困扰着那些试图通过在问题空间中进行搜索来模拟认知功能的程序员。
-
图灵和香农对国际象棋的兴趣是非常认真的,因为游戏规则的简单性与游戏的复杂性形成了对比,他们怀疑,为了执行这种耗时的搜索程序所需的捷径,也可能是大脑解决各种问题的方法的线索。
-
1953 年,香农撰写了一篇论文《计算机与自动机》,其中提出的问题至今仍引起心理学家和计算机专家的浓厚兴趣。一个下棋的计算机能否从错误中学习?是否有可能制造出一台能够自我诊断并修复自身故障的机器?能否创建计算机程序(“虚拟机”),使计算机能够根据人类用户的规格编写自己的软件?人类大脑处理信息的方式(在某些硬核人工智能圈子中称为“湿件”)是否能够通过硬件和软件有效模拟?
-
1953 年夏天,当香农正在研究这些想法时,他雇用了两名临时实验室助理,名叫明斯基和麦卡锡
-
他们聚集在一起讨论的新领域是一个尚未命名的科学分支,但其基础假设是,计算机的存在现在使得考虑创造一种科学上已知的最复杂系统——人类智能的人工版本成为可能。
-
1956 年和 1957 年,人工智能叛逆者们的希望高涨。重大努力正在进行中,雄心勃勃的目标已在眼前。少数几个不拘一格的思想家将他们的职业生涯押在这样一个信念上:这个曾经属于科幻小说的计算机科学分支,很快将被视为人类所尝试过的最重要的事情。明斯基留在麻省理工学院,专注于研究知识在大脑和机器中的表示问题;纽厄尔和西蒙(现为诺贝尔奖得主)开始了他们与卡内基梅隆大学的长期合作,专注于心理学和人工智能设计的信息处理方法;麦卡锡创造了 LISP,一种专门用于进行人工智能研究的语言,并离开麻省理工学院,主持斯坦福大学的人工智能实验室。
-
在 20 世纪 60 年代,香农对股市产生了兴趣,将其视为概率论的现实实验,据说他做得还不错。
-
他在 20 世纪 50 年代完成了一大批从未发表的作品。他不希望别人替他写论文,而他自己也不愿意写。事情就是这么简单又复杂。他不喜欢教学,也不喜欢讲课。他的讲座都是珍品,听起来即兴发挥,但实际上都经过非常非常精心的准备。
第七章:用于思考的机器
-
连接了过去的数字计算器和未来的思维放大器
-
尽管他主要对大脑如何处理听觉信息感兴趣,但他觉得自己大部分时间都在把东西放进文件夹或从中取出,以及管理他构建心中模型所需的越来越多的数据信息。出于好奇,他想知道是否有同事研究过科学研究人员如何分配时间。
-
他的观察显示,他大约 85%的“思考”时间实际上花在了“为思考、做决定、学习我需要知道的东西做好准备”上。花在寻找或获取信息上的时间远远多于消化信息的时间。
-
像几乎所有其他实验者一样,他无法理解心理声学数据,除非能将其转换为图表形式。绘制图表需要几天时间。即使是教助手如何绘制图表也需要几个小时。一旦图表完成,他能够查看时,他所寻找的关系就立刻变得显而易见。花费几天时间绘制图表,而解释它们只需几秒钟,这种做法极其低效且乏味。
-
虽然他一直认为解释和评估是他作为科学家最重要的功能,但利克莱德对自己研究行为的分析显示,他的大多数任务都是文书或机械性的:“搜索、计算、绘图、确定一组假设或假说的逻辑或动态后果,为决策或洞察做好准备。此外,我选择尝试或不尝试的事情在很大程度上是由文书可行性而非智力能力决定的,这让我感到尴尬。”
-
他得出的结论,虽然在今天听起来并不那么激进,但在 1957 年对他来说是一个震惊。一个不那么谦虚的人可能无法面对这个结论:利克莱德根据他非正式的自我研究决定,任何技术思考者所花费的大部分时间的任务将更有效地由机器完成。
-
大约在同一时间,其他一两个人也产生了这样的想法——尤其是在加利福尼亚的 Doug Engelbart。但由于 Licklider 在 20 世纪 50 年代与麻省理工学院某些军方资助的研究项目有关联,他与其他梦想将计算机转变为某种心智扩展工具的人之间存在一个重要区别。这个关键的区别在于,Licklider 得出结论后不久,环境就使他处于一个能够资助整个新技术创建的机构的权力中心。
-
在计算机技术历史的那个阶段——Licklider 直到那时才稍微涉足的领域——没有哪个受人尊敬的计算机科学家敢于建议彻底改造计算机技术,以便科学家可以使用这些机器来帮助跟踪数据并构建他们所研究现象的理论模型。对于那些大胆到提出这种建议的人——尤其是当时在麻省理工学院创立人工智能领域的年轻计算机特立独行者——这个想法可能显得过于显而易见和琐碎而不值得追求。无论如何,人工智能的创始人更感兴趣的是取代科学家,而不是科学家的档案管理员。然而,Licklider 既不是受人尊敬的计算机科学家,也不是计算机特立独行者,而是一位在电子学方面有一定专长的心理学家。和其他任何有能力的研究者一样,他跟随数据的指引。
-
如果你是人口普查办公室,手头有几亿人的信息,并且出于某种疯狂的原因,你想知道有多少 60 岁以上的离婚者住在阳光地带的农场上,你可以使用 UNIVAC 来执行所需的排序和计算,以告诉你想知道的答案。这就是数据处理。如果你每隔一个星期五需要计算 1 万名员工的工资,并需要将时间表转换为账簿条目并打印所有支票——数据处理能力正是你可以从当地 IBM 代表那里购买的。
-
“我想你可以说我经历了一种宗教般的转变,”Licklider 承认道,回忆起二十五年前第一次接触交互式计算机时的感受。正如他所预料的那样,确实可以利用计算机从实验数据中构建模型,并理解任何复杂的信息集合。
-
然后他了解到,尽管计算机是他构建模型所需的合适机器,但即使是 PDP-1 对于他想研究的现象来说也过于粗糙。大自然对于 1960 年代风格的计算机来说实在太复杂了。他需要更多的内存组件和更快的大量计算处理能力。当他开始思考计算机和大脑各自的优缺点时,他意识到自己在寻找的是当时存在的人机关系的替代方案。
-
自 1956 年夏天他们在达特茅斯会面以定义这一领域以来,Licklider 认识的几位来自麻省理工学院的年轻计算机和通信科学家一直在谈论一个模糊而遥远的未来,那时机器将超越人类智能。Licklider 更关心计算机与人类关系的短期潜力。即使在一开始,他就意识到各种技术思维者开始遇到他在 1957 年开始注意到的问题。让人工智能的研究者去担心如何构建下棋或翻译语言的机器吧。他和许多其他人需要的是一个智能助手。
-
尽管他因“对交互式计算的宗教皈依”而深信不疑——这一短语被参与后续事件的人们反复使用——但 Licklider 对计算机技术的经济学知之甚少,因此无法看出如何才能真正构建一个智能实验室助手。尽管他不知道计算机何时会变得足够强大和便宜,以至于可以作为“思维工具”使用,但他开始意识到,通用计算机如果能够以人类可以直接与之交互的方式设置,可能会演变成与 20 世纪 50 年代的数据处理器和数字计算器完全不同的东西。尽管创造个人工具的可能性在经济上似乎仍不可行,但现代化社区资源(如图书馆)的想法开始吸引他。他对 1945 年 Vannevar Bush 提到的一个新型图书馆的概念充满热情,这种图书馆适应世界的新知识体系。
-
当他意识到这种不断加速的增长速度将在十五年内使计算机的性能比 PDP-1 强大一百倍,而成本仅为其十分之一时,Licklider 开始设想一个结合了计算机的电子能力和人类操作员的皮层能力的系统。操作员与 PDP-1 之间粗糙的互动可能只是新型强大的人机合作关系的开端。
-
在这种更高水平的人机交互成为可能之前,一种新型计算机必须得以发展。人们操作机器的方式需要改变,机器本身也必须变得更快、更强大。尽管 Licklider 在数字计算机设计方面仍是新手,但他熟悉真空管电路,并且在“人因工程”这一跨学科领域足够专业,能够认识到他想要的机械助手需要具备的能力只能通过他预见的未来超高速计算机来实现。
-
Licklider 发现自己被一种更具动态性、更具对话性、在制定和绘制模型时更具辅助作用的计算理念所吸引。
-
“信息处理设备将把假设转化为可测试的模型,然后根据数据测试这些模型(当计算机呈现数据供人类操作员批准时,操作员可以大致指定并识别相关数据)。设备将回答问题。它将模拟机制和模型,执行程序,并向操作员展示结果。它将转换数据,绘制图表(按照人类操作员指定的方式“切分蛋糕”,或者如果操作员不确定自己想要什么,则以几种替代方式进行)。设备将进行插值、外推和转换。它将把静态方程或逻辑陈述转换为动态模型,以便人类操作员可以检查其行为。总的来说,它将执行可例行化的文书操作,以填补决策之间的间隔。”
-
“此外,计算机将作为统计推断、决策理论或博弈论机器,在有足够依据支持正式统计分析时,对建议的行动方案进行基本评估。最后,计算机将尽可能多地进行诊断、模式匹配和相关性识别,但在这些领域中,它将接受明显的次要地位。”
-
他认识到复杂性管理是 20 世纪余下时间及未来需要解决的主要问题。机器将不得不帮助我们跟踪维持全球文明生存和发展的复杂性。而人类将需要新的方法来解决因我们持续存在和发展而产生的大问题。
-
假设生存和可忍受的生活质量是所有理智、智能生物的最基本需求,无论它们是生物体还是技术体,Licklider 想知道,对于地球上的人类和人类创造的符号处理实体来说,最好的安排可能既不是主仆关系,也不是竞争者之间的不安共处,而是合作伙伴关系。
-
由此产生的想法发展成一个如此大胆而宏大的理论,如果被证明是正确的,它将不仅改变人类历史,还将改变人类进化。
-
“无花果树仅由昆虫榕小蜂授粉。昆虫的幼虫生活在无花果树的子房中,并在那里获取食物。因此,树和昆虫之间存在着高度的相互依赖:没有昆虫,树无法繁殖;没有树,昆虫无法进食;它们共同构成了一个不仅可行而且富有成效和繁荣的合作关系。这种“不同生物之间亲密共生,甚至紧密结合”的合作关系被称为共生。”
-
“人机共生”是人机系统的一个子类。人机系统有很多种。然而,目前还没有人机共生……希望在不久的将来,人类大脑和计算机能够紧密结合,形成的合作关系将以人类从未有过的方式思考,并以我们今天所知的信息处理机器无法企及的方式处理数据。
-
在实现这种合作关系时需要克服的问题,部分是建造更好的计算机,部分是学习大脑如何与信息互动。最重要的问题可能既不在于大脑,也不在于技术,而在于它们结合的方式。
-
此时,他已经偏离了他的心理声学研究方向,被建造他最初设想的设备的前景所吸引,这个设备是用来帮助他理解实验室数据的工具。就像巴贝奇需要一种方法来生成精确的对数表,或戈尔茨坦想要更好的射击表,或图灵想要一种完美明确的方法来解决数学和密码学问题一样,利克莱德在被创造他所需工具的兴奋所吸引时,开始偏离他之前的目标。
-
尽管 Licklider 的愿景宏伟,但仅凭愿景本身并不足以确保在现实世界中实现任何事情。作为一名实验心理学家,即使是麻省理工学院的教授,也很难让大批计算机工程师朝着互动未来迈进
-
显示屏的问题开始从电子学偏离,进入人类感知和认知的领域,这正是 Licklider 加入计算机制造者的契机。但早在 1953-1954 年林肯实验室成立之前,Licklider 就被咨询过关于开发新技术以向人类操作员显示计算机信息的可能性,以提高空中防御能力。毫无疑问,当时他和其他被称为“展示小组”的成员考虑空中防御指挥中心需要的视觉显示类型时,他关于人机共生的未来想法的种子就已开始萌芽。
-
正如弹道计算的需求间接触发了通用数字计算机的发明,斯普特尼克事件的后果启动了交互式计算机的发展,并最终直接导致了现在被称为个人计算机的设备的出现。正如冯·诺依曼在 ENIAC 时代发现自己处于政治技术事件的中心,利克莱德被吸引到一个后来被称为“ARPA 时代”的核心角色。
-
ARPA 的任务是寻找和资助有可能大幅推进美国国防相关技术的大胆项目——通过让研究管理员直接与研究人员联系,绕过同行评审过程。
-
Licklider 提出的创建一种能够通过键盘和显示屏界面直接与人类操作员互动的新型计算机的想法(而不是依赖批处理甚至纸带输入)让 Ruina 相信,Licklider 所谈论的少数计算机研究人员可能正是实现这种可能突破的关键。
-
“我让 Jack 认识到交互式计算不仅对军事指挥和控制至关重要,对日常商业世界也是如此,”Licklider 回忆道。“所以,在 1962 年 10 月,我搬进了五角大楼,成为信息处理技术办公室的主任。”而这一事件,与那个时代的其他发展一样,标志着个人计算时代的开始。
-
历史上最富有、最强大的国家决定将其大量资源投入到电子技术的发展中,这一决定发生在电子学历史上一个极为有利的时刻。使微型化革命成为可能的基础科学发现——产生晶体管和集成电路的新半导体研究领域——清楚地表明,1960 年只是计算机快速发展的开始
-
随着 Licklider 的出现,一代新的设计师和工程师也随之而来,他们的目标是一些在斯普特尼克之前的计算机正统观念中会被视为科幻的东西。突然间,人机共生不再是技术期刊中的深奥假设,而是一个国家目标。
-
当他的办公室决定支持一个项目时,这意味着为研究人员提供他们习惯预算的三十到四十倍的资金,以及使用最先进研究技术的机会,并要求他们大胆思考、快速行动。
-
Licklider 当时称为“交互式计算”的一系列新功能是最终目标,而第一步是一个令人兴奋的新概念,即分时。分时将是从批处理过渡到个人计算(即一人一机)的第一步,也是最重要的一步。这个想法是创建能够同时与许多程序员交互的计算机系统,而不是让他们拿着卡片或磁带排队等待。
-
MAC 是 20 世纪 70 年代人工智能天才和 80 年代软件设计师最重要的聚集地之一。然而,在 ARPA 支持的鼎盛时期结束时,人工智能人员和计算机系统人员已经不再走在同一条轨道上。
-
第一步是为所有研究人员提供一台足够互动的机器,以便用于设计更具互动性的版本——这就是利克莱德及其继任者所采取的“自举”(bootstrapping)过程。
-
Licklider 回忆起第一次关于交互式图形的正式会议,在会上展示和讨论了第一波初步研究,以便规划如何解决将信息从新计算机内部传输到各种显示屏表面的主要问题。Licklider 记得,正是在这次会议上,Ivan Sutherland 首次以引人注目的方式登上了舞台。
-
“萨瑟兰当时还是一名研究生,”利克莱德回忆道,“他并没有被邀请发表论文。” 但由于他正在为博士论文创建的图形程序,因为他是克劳德·香农的门徒,以及关于他正是 ARPA 所寻找的那种天才的传闻,他被邀请参加了会议。
-
因此,Licklider 安排他在第二天向小组发表演讲:“当然,他带来了一些幻灯片,当我们看到这些幻灯片时,房间里的每个人都意识到他的工作比在正式会议上描述的要好得多。” Sutherland 的论文是在 Lincoln 的 TX-2 上开发的一个程序,展示了一种处理计算机图形的创新方法——以及一种指挥计算机操作的新方式。他称之为 Sketchpad,显然在场的专家们都看出,他已经超越了他们多年的研究,创造了即使是他们中最有野心的人也未曾敢想的东西。
-
Sketchpad 允许计算机操作员使用计算机在类似电视机的显示屏上快速创建复杂的视觉模型。这些视觉图案可以像其他数据一样存储在计算机的内存中,并可以由计算机的处理器进行操作。在某种程度上,这是对 Licklider 快速模型构建器追求的一个戏剧性回应。但 Sketchpad 远不止是一个创建视觉显示的工具。它是一种模拟语言,使计算机能够将抽象概念转化为感知上具体的形式。它也是一种全新计算机操作方式的模型;通过改变显示屏上的内容,可以通过 Sketchpad 改变计算机内存中的内容。
-
“如果我知道这有多难,我可能就不会去做了,”艾伦·凯回忆起萨瑟兰对他那现在已成传奇的程序所说的话。不仅技术理论大胆、创新且合理,而且程序实际上也能运行。通过光笔、键盘、显示屏以及在 1962 年相对粗糙的实时计算机上运行的 Sketchpad 程序,任何人都能亲眼看到计算机除了数据处理之外还能用于其他用途。而在 Sketchpad 的情况下,眼见为实。
-
当他在 1964 年离开 ARPA 时,Licklider 推荐 Sutherland 作为 IPTO 的下一任主任。Licklider 回忆道:“我对推荐一个如此年轻的人有些犹豫,但 ARPA 主任 Ruina 的继任者 Bob Sproull 说,如果 Sutherland 真的像传言中那样聪明,他对他的年轻没有问题。”那时,Sutherland 还在二十出头,但他已经通过做 ARPA 最喜欢的事情为自己建立了良好的记录——超越技术的前沿,完成正统观念认为不可能或完全未曾考虑的事情。
-
莱克莱德指出,科学家和工程师现在知道的一件事是,当他和其他人开始时并不知道的,那就是“自然界对信息处理的友好程度远超任何人在 20 世纪 50 年代所能想象的。我们没有意识到分子生物学家已经为一种极其高效、可靠的信息处理机制提供了存在证明——即人类遗传系统的分子编码。世界上全部知识的等量信息可以存储在不到一立方厘米的 DNA 中,这告诉我们,我们还没有开始接近信息处理技术的物理极限。”
-
分时共享社区以及随后出现的社区网络是另一个梦想的一部分——即在全球范围内建立计算机媒介的社区,不仅限于计算机专家,还包括思想家、艺术家和商界人士。Licklider 相信,他所梦想的在线互动人机社区在未来十年内完全有可能在技术上实现。
-
展望他在六十年代中期设想的“星际网络”成为现实的那一天,他仍然坚信,预测中的人类文化能力提升将会发生,但前提是足够多的人使用该系统的早期版本来构思出一个更强大的系统供所有人使用:“有足够多的人参与改进系统,新想法的诞生和传播将变得更容易,”他指出,也许是回忆起那些年,当时互动计算被一群特立独行者视为大胆的冒险。他仍然认为,最重要的问题是这种媒介是否会真正普及。
-
“总人口中有多少比例能够加入那个社区?这仍然是个重要的问题。”利克莱德总结道,他仍然不确定这种新媒介是否会继续成为少数群体的专属财产,这些人可能因为能够使用这些工具而对他人拥有不成比例的权力,还是它会像识字一样成为整个文化的财产。
第八章:历史的见证者:Project Mac 的吉祥物
-
当他试着转动门把手,发现门没锁,然后打开 26 号楼的门,把头探进一个充满怪人、享受糖果和计算机程序的房间时,大卫·罗德曼知道他发现了什么。
-
事实证明,这些面色苍白、眼神空洞、满口行话、疯狂大笑的年轻人是第一代自称为“黑客”的辍学编程奇才的创始成员
-
格林布拉特以典型的黑客饮食为生,喝软饮料,吃糖果和 Rolaids,他从不休息,更不用说洗澡或换衣服了。
-
他是那种天才,因自己的大脑被困在孩子的身体里还要再待八年而感到愤怒。从六岁起,他就是一个出色的音乐家,但在十岁时放弃了钢琴,因为他厌恶为成年人表演。他是个独行者,一个漫游者,一个透过门缝观察的人,一个城市探险者——一个窥探者,但不是小偷,除非你认为了解如何穿越复杂系统的知识是一种可被窃取的财产。到十五岁时,大卫和他的朋友们已经能够通过地下公用隧道系统进入麻省理工学院的任何建筑。
-
“大卫在二十年后回忆道:“他们对我很微妙。我想这是一种认可。他们都经历过,但在我自己弄明白之前,他们不会告诉我任何事情。”他只是坐下来,那里有一个键盘,有人让他开始,虽然他们是他遇到的第一个不对他的聪明才智大惊小怪的人,但他们确实注意到他学得很快。
-
但和许多现在三十多岁、不穿西装、不提公文包的人一样,早期的历史既多彩又有些痛苦:“十岁时,我内心像一根紧绷的弹簧——孤独、紧张、愤怒、愤世嫉俗。我无法将自己的聪明才智与外界平衡。然后突然间,这里有一些和我相似的人,他们向我展示了一种设备,当我坐下来编程时,它会对我做出反应。那些人知道我正在经历什么,当我开始编程时,他们鼓励我。”
-
校园人口主要由全国各地高中里那些在其他人参加舞会时留在家里学习积分计算或组装业余无线电的人组成。
-
你不能只是闯入并让自己成为黑客。你必须去黑客。而这意味着让计算机做出制造商从未预料到的事情。(这种编程在黑客中被称为“黑魔法”。)
-
们的价值观完全是他们自己的:学术或商业成功过于琐碎,无法被视为驱动力;与志同道合的同事一起在最先进的设备上工作是最重要的
-
18 岁的 MIT 辍学生大卫·罗德曼想要效仿的人,与他们表面上相似的嬉皮士和激进分子不同,因为他们都恰好拥有一种在当时特别受重视的才能,现在仍然如此——编写使计算机对非程序员有用的代码的能力。
-
他们的工作并不是被分配去开发工资系统或航空公司订票服务。黑客们知道,即使没有其他人知道,他们——而不是 IBM,甚至不是计算机科学中那些更正统的“FORTRAN 类型”同事——才是计算前沿的试飞员,不断推动每一代新硬件的极限。
-
自学掌握复杂技术是黑客痴迷的标志,所有信息(以及信息传递技术)都应该是免费的信念是黑客伦理准则的核心原则
-
在某种程度上,MAC 黑客是 20 世纪 60 年代出现在大学校园的其他类型精神叛逆者的先驱。对中产阶级价值观的蔑视以及对自身思维运作的持久兴趣是黑客与后来与计算机无关的亚文化共同的两个特征
-
“我会将我的第一次迷幻药体验描述为对我自身心理内部的一次量子飞跃,”大卫今天回忆道。“突然间,我就在那儿——在我自己内部。我不知道进入的路径,但我就在那儿。我可以观察自己弹吉他或写代码,并在即兴创作时思考
-
Dreyfus 事件始于 1965 年夏天,当时 Hubert Dreyfus——一位哲学家,而非计算机科学家——在兰德公司度过了几个月。Dreyfus 在那个夏天结束时写的论文,题为《炼金术与人工智能》,作为兰德报告非正式地流传开来。
-
当魏岑鲍姆后来谈到使用计算机可能改变数百万人生活方式的道德问题时,他是从经验出发的。他创造了一个程序,给人一种智慧、全知的计算机化精神病医生的假象,而他看到即使是那些精通计算机的同事也如此轻易地被假象所迷惑时感到震惊,这引发了魏岑鲍姆的异议。
-
在计算机中心已经建立的地方,也就是说,在美国无数的地方,以及世界上几乎所有其他工业地区,可以看到一些外表邋遢的聪明年轻人,他们常常眼窝深陷、目光炯炯地坐在计算机控制台前,手臂紧绷,准备随时出击,手指已经准备好敲击那些他们专注得如同赌徒盯着滚动骰子的按钮和键盘。当不那么专注时,他们常常坐在堆满计算机打印输出的桌子旁,像着魔的学生研究神秘文本一样仔细阅读。他们一工作就是二十、三十个小时,直到精疲力竭。他们的食物,如果安排的话,会有人送来:咖啡、可乐、三明治。如果可能,他们就在计算机附近的床铺上睡觉。但只睡几个小时——然后又回到控制台或打印输出前。他们皱巴巴的衣服、未洗的脸和未刮的胡子、未梳理的头发都表明他们对自己的身体和所处的世界毫不在意。他们的存在,至少在如此投入时,仅仅是通过计算机和为了计算机。这些是计算机迷,强迫性的程序员。 它们是一个国际现象。
-
强迫性程序员花在玩电脑上的时间远远超过用电脑解决他们被支付去解决的问题的时间
-
痴迷的黑客动机并不是解决问题,而是与计算机互动的纯粹刺激感,而魏岑鲍姆指责这不是天才的表现,而是病态的表现。他坚持认为,“强迫性的程序员”不过是被赋予了一个舞台——计算机——来实现其幻想的典型疯狂科学家。
-
黑客更愿意通过他们的创造而不是行为来被评判,没有人关心梵高的穿衣习惯,或者莫扎特是否连续几天不睡觉。明斯基谴责公众对那些恰好对编程而不是小提琴演奏、篮球或赚钱充满热情的人的刻板印象和替罪羊行为。
-
魏岑鲍姆无疑正确地指出了使用计算机来刺激对极其可控世界的全能幻想的诱惑。
-
在你被告知可以给出简单的指令如“放下剑”、“向上走”、“过桥”之后,屏幕上出现了以下仍然在每个计算机中心都很有名的话:“你站在一条路的尽头,面前是一座小砖房。你周围是一片森林。一条小溪从建筑物中流出,顺着沟壑向下流去……”
-
毫无预警,也没有任何高分辨率的图形或音效,你被吸引进入巨洞探险,在那里,一个充满宝藏、矮人、魔法、策略和危险的迷宫等待着你的指挥。完成一局游戏可能需要数周时间。不止一位评论员将“冒险”作为黑客行为的隐喻:这是一条隐藏在计算机内部的复杂路径,黑客需要运用所有的技能、知识和魔法来找到宝藏并将其带回。
-
对编程技能的高度重视、顽皮的倾向以及对游戏的偏爱似乎伴随着黑客文化的传播而出现,
-
这些人值得描述。他们在很多方面都不显得普通。首先,他们都非常聪明,事实上,他们在对计算机产生兴趣之前就已经遇到了社交问题。其次,他们是自给自足的。他们的整个社交生活通常都围绕着彼此。第三,他们生活的各个方面相互强化。他们上学是为了学习计算机,他们从事编程和计算机维护的工作,他们的社交生活与黑客为伴。在学术上、社交上以及金钱世界中,计算机是他们生活的中心。
-
我们正在处理一种无限可塑的工具。选择开发和使用这种工具的人,无论是为了工作、娱乐,还是两者兼而有之,都有这样的选择权,不能被剥夺。一个选择成为音乐家的人必须投入大量时间以获得足够的专业技能。但你会认为计算机黑客比这样的人更缺乏创造力吗?我绝不会这样认为。计算机不仅是一个工作工具,也是一个展示创造能力的画架。因此,在我看来,黑客并没有限制自己。相反,他扩展了自己的智力视野,因为现在他拥有了这无限的工具。
-
至于它扰乱社交生活的指责,我在某种程度上倾向于同意这一点。但这取决于个人的自控能力。任何时候,他都可以回到更正常的时间表。那他为什么不这样做呢?原因显而易见。这个几乎没有边界的无限工具更容易获取,因此他可以投入更多时间
-
“我想不出有什么比爱上知识更自然的事情了,”他说,“而黑客们对计算机知识的热爱如此深沉,以至于他们完全被吸引住了。”
第九章:长距离思考者的孤独
-
当道格·恩格尔巴特首次想到在雷达屏幕上显示文字和图像、将它们存储在计算机中,并通过杠杆、按钮和键盘进行操作时
-
三十多年来,恩格尔巴特一直在努力加速他认为自印刷术发明以来文化进化的最大一步。听他今天的讲述,无论是计算机机构还是计算机革命者,仍然未能理解使用计算机作为思维放大器的艺术和力量不在于放大器如何工作,而在于被放大的思维能够实现什么。
-
信息处理技术可以用来增强人类记忆和思维的理念,最早且最清晰的表述之一,是道格在 1945 年那天发现的,发表在《大西洋月刊》战争末期的一篇题为《诚如所思》(“As We May Think,")的文章中
-
布什在撰写文章时并没有提到早期计算机作为信息处理设备的潜力。但他确实提出了一个多年后才结出硕果的想法——一个类似科幻小说的通用工具的描述,帮助我们跟踪我们所知道的东西。
-
展望战后世界,布什预见到最近在科学和技术方面的突破将会带来自身的问题。随着所有这些科学家以空前的速度产生所有这些知识,任何人如何能够跟踪所有这些信息?如果没有人知道如何获取他们所需的信息,这个迅速扩展的知识体系将如何使任何人受益?
-
“人类经验的总和正在以惊人的速度扩展,而我们用来穿越由此产生的迷宫以找到暂时重要项目的方法,仍然和方帆船时代所用的方法一样,”布什写道。
-
他敦促科学家们将努力转向使日益庞杂的人类知识积累更易于个人获取。
-
但布什所预见的未来技术不仅限于科学领域,还扩展到了普通市民。未来的某一天,不仅科学家,普通市民也需要在日益复杂的信息领域中导航。在《大西洋月刊》的文章中,布什提议开发一种设备,一种可以提高人类思维质量的设备。因为其功能之一是扩展人类记忆,布什将他假想的机器称为记忆扩展器(memex)。但布什是最早看到快速访问大量信息不仅仅是记忆的简单延伸的人之一。尽管他用 20 世纪 40 年代的原始信息技术来描述它,记忆扩展器在功能上类似于现在所知的个人电脑——甚至更多。
-
有些想法就像种子,或者病毒。如果它们在合适的时间出现在空气中,就会感染那些最容易将生命奉献给这些想法的人。知识扩展技术的概念就是这样的想法之一。在布什发表他的《大西洋》文章十五年后,J. C. R. Licklider 发表了关于将计算机变成通信媒介的文章。但在布什的文章发表仅五年后,受创造心智扩展工具的想法感染的道格·恩格尔巴特,开始孕育他自己关于如何利用机器增强人类智能的想法。
-
“我们订婚后的那个星期一,”恩格尔巴特今天回忆道,“我开车去上班时,突然意识到我不再有任何目标。作为一个在大萧条中长大的孩子,我有三个目标——接受教育,找到一份稳定的工作,结婚。现在我已经实现了这些目标。没有什么剩下的了。”
-
“在决策过程中,我很早就把金钱作为目标排除在外。按照我成长的方式,只要有足够的钱过日子就行了;我从未认识过任何富人。但到了 1950 年,我觉得世界变化得如此之快,我们的问题变得如此之大,于是我决定寻找一个对人类最有回报的人生目标。”
-
世界变得过于复杂,只有最有组织的运动才能奏效。
-
恩格尔巴特意识到,就像范内瓦·布什一样,人类正进入一个时代,在这个时代中,全球问题的复杂性和紧迫性超越了传统的解决问题的工具。他也开始理解,就像几年后的利克莱德一样,处理问题解决过程中产生的信息副产品本身已成为解决其他所有问题的关键。最重要的任务不再是设计新的方法来扩展我们的知识积累,而是知道在哪里寻找已经存储在某处的答案。
-
“当我第一次听说计算机时,我从雷达经验中了解到,如果这些机器可以在打孔卡片和纸质打印件上显示信息,它们就可以在屏幕上书写或绘制这些信息。当我看到阴极射线屏幕、信息处理器和一种向人们展示符号的媒介之间的联系时,这一切在大约半小时内就全都涌现出来了。
-
“我开始勾画一个系统,在这个系统中,计算机为你在屏幕上绘制符号,你可以通过旋钮、杠杆和传感器在不同领域中引导它。我在设计各种各样的东西,如果你有一个像范内瓦·布什建议的那样的系统,你可能会想要做这些事情——例如,如何将其扩展到类似剧院的环境中,在那里你可以和同事一起坐着交流信息。天啊!想想这将如何让你在解决问题时放手一搏!”
-
Doug Engelbart 在谈到他在二十五岁时预见并一直追求的前景时,仍然无法掩饰他柔和声音中的兴奋和眼中遥远的神情。但他不确定今天的计算机一代,尽管拥有各种花哨的硬件,是否更接近真正的问题。
-
尽管历史证明他在许多方面是一个准确的预言家,但可能不是一个理想的项目和人员管理者
-
当他微笑时,他的脸上流露出一种惆怅和稚气,但一旦他前进的能量停止,他停下来思考时,他那浅蓝色的眼睛似乎表达出一种悲伤或孤独。道格·恩格尔巴特在问候你时,声音低沉而柔和,仿佛经过长途跋涉而变得微弱,仿佛他的言语被多层冥想所削弱。他身上有一种既谦逊又温暖的特质,一种既温柔又固执的性格,赢得了人们的尊重。
-
“他让我想起摩西分开红海的情景,”艾伦·凯这样形容恩格尔巴特温和的魅力。
-
“当我们建好计算机时,”这位年轻工程师不断问道,“我可以用它来教人吗?我能把它连接到键盘上,让人和计算机互动吗?也许教人打字?”心理学的人觉得这很棒,但计算机几乎不属于他们的领域。工程师们则说:“这种想法绝对行不通。”
-
互动的东西是如此疯狂,以至于那些了解计算机的人都不想听说它。在那时,即使你是程序员,你也不会与计算机互动。你把问题以一盒穿孔卡片的形式交给它,如果你非常努力地正确陈述了问题,你就会得到答案。计算机并不是为了直接互动而设计的。而用它们来帮助人们学习的想法简直就是亵渎。
-
同时在他为市场化设备的发展做出贡献的过程中支付他的食宿费用
-
当恩格尔巴特宣布他思考并努力阐述了十多年的概念框架时,社区一片沉寂。然而,恰好有几个人在倾听,而这些人正是合适的人。鲍勃·泰勒是 NASA 的一位年轻同事,他是后斯普特尼克时代的技术先锋之一,是不惧怕创新的新一代研究资助者之一,他推动了道格项目的最早期资助。
-
1963 年吸引 ARPA 注意并在更广泛的计算机理论界引起巨大沉默的论文题为《增强人类智力的概念框架》
-
通过“增强人类智力”,我们指的是提高一个人处理复杂问题情境的能力,获得适合其特定需求的理解,并找到问题的解决方案。
-
我们并不是在谈论在特定情况下帮助的孤立巧妙技巧。我们指的是一种生活方式,在一个整合的领域中,直觉、尝试与错误、无形因素和人类对情境的“感觉”与强大的概念、精简的技术和符号、复杂的方法以及高效的电子辅助工具有益地共存。
-
我们的文化为我们提供了处理问题的复杂程序,这些程序通过让我们受益于前人所学,增强了我们学习新事物的天生能力。这些做事的方法就是创造文明的软件
-
如果你把一个在纽约生活了一辈子的人丢到新几内亚高地,不要指望他或她知道如何建造草棚或在热带风暴中该做什么。知道在这些情况下该怎么做的人必须教会新来者生存技能,从而增强他或她的天生能力。这里就是人类智力最初增强的地方——文化为个人提供的工具和程序
-
我们的文化已经发展出方法来组织和利用我们的基本能力,使我们能够理解真正复杂的情况,并完成设计和实施问题解决方案的过程。人类能力因此得以扩展的方式在这里被称为增强手段
-
语言——个体将其世界图景分类为其心智用来模拟世界的概念,以及他附加于这些概念并在有意识地操控这些概念时使用的符号(“思考”)。
-
这种假想的写作机器允许你使用一种新的文本创作过程。例如,可以通过重新排列旧草稿的摘录,快速撰写试验草稿,并插入你手动输入的新词或段落。你的初稿可能代表着思想的自由倾泻,顺序可以随意,之前的想法不断激发新的思考和创意。如果草稿中代表的思想过于复杂,你可以快速编写一个重新排序的草稿。这样,你可以在寻找适合自己需求的路径时,容纳更多复杂的思维轨迹。
-
如果你能够快速灵活地更改你的工作记录,就能更轻松地整合新想法,从而更持续地发挥创造力。如果可以更轻松地更新工作记录的任何部分以适应思想或环境的新发展,你会发现更容易在你的工作方式中融入更复杂的程序。
-
从恩格尔巴特的角度来看,文字处理技术花了十五年以上的时间才流行起来
-
他在 1963 年的框架中提出的假设是,计算机代表了人类智力能力进化的新阶段。概念操控阶段是最早的,基于大脑的生物能力,随后是基于言语和书写的符号操控阶段,以及基于印刷的手动外部符号操控阶段。
-
在这个阶段,人类用来表示他所操控概念的符号可以在他眼前排列、移动、存储、召回,并根据极其复杂的规则进行操作——所有这些都能以极快的速度响应人类提供的极少量信息,通过协作的技术设备实现。在我们现在可以想象的极限情况下,这可能是一个计算机,个人可以与之快速、轻松地交流,并与一个三维彩色显示器相连,在其中可以构建极为复杂的图像,计算机能够根据人类的指示对这些图像的部分或全部执行各种各样的处理。这些显示和处理可以提供有用的服务,并可能涉及到以前未曾想象过的概念(例如,前图形思维者无法预测条形图、长除法过程或卡片文件系统)。
-
我们可以设想一些相对简单的方法来提高我们的外部符号操作能力,并试图想象这可能在我们的语言和思维方法中引发的变化。
-
如果查找信息如此容易,我们的词汇量将如何发展?我们探索他人智力领域的习惯将如何改变?如果每个人都能如此快速轻松地查找适用的规则,实际组织的复杂性将如何成熟?我们的教育系统将如何利用学生、教师和管理者这种新的外部符号操作能力?
-
由于最终的产品是面向所有人,而不仅仅是计算机专家,因此需要招募参与编辑、设计和其他知识相关领域的人士加入电气工程师和程序员的行列。因为目标是增强人类思维的能力,并学习如何将这种增强引入人类组织,所以还需要一位心理学家。
-
实验室本身必须是一个有意识设计的自举工具,因为这个团队首先要构建的工具正是他们自己更好完成工作的工具。在他们希望增强他人任务之前,他们必须先增强自己的工作。自举——构建工具以打造更好的工具,并在过程中对自己进行测试,是恩格尔巴特策略的核心组成部
-
计算机可以帮助知识工作者更好地思考
-
1968 年秋天,当一个名为秋季联合计算机会议的大型计算机界聚会在附近的旧金山召开时,道格决定将他在门洛帕克长期追求的增能实验室的声誉——到那时几乎是他一生的工作——押在一次如此大胆而直接的演示上,终于在这些年后,计算机科学家们会理解并接受那个长期以来一直未被他们发现的重要线索。
-
两个小时里,Doug Engelbart 终于有机会带领他的同行——增强技术的先驱和数据处理专家——在信息空间中翱翔。
-
恩格尔巴特完全是新型载具试飞员的形象,这种载具不是飞越地理领土,而是穿越计算机科学家称之为“信息空间”的抽象领域。他不仅外形符合,而且行为也相符:计算机宇宙中的查克·耶格尔,冷静地测试新系统,并以平静、低沉的声音向他那目瞪口呆的地面观众汇报。
-
想象一下,你正处于一种新型交通工具中,这种交通工具在空间和时间上几乎没有限制。在这个交通工具中有一扇神奇的窗户,可以让你从非常广泛的视野中进行选择,并快速过滤大量的可能性——从微观到宇宙,从某个图书馆中的某本书中的某个词,到整个知识领域的概述。
-
通过新交通工具的增强窗口看到的景象不是普通的平原、树木和海洋的风景,而是一个信息景观,其中的特征是文字、数字、图表、图像、概念、段落、论点、关系、公式、图解、证明、文献体和批评学派。起初,这种效果令人眼花缭乱。用道格的话来说,我们所有旧的信息组织习惯都被一种系统所“彻底打破”,这种系统不是基于铅笔和印刷机,而是基于人类大脑处理信息的方式。
-
当被称为阿拉伯数字的新思维工具被引入西方,数学家们发现他们不再需要在计算中笨拙地使用罗马数字时,这种精神上的自由最初一定是令人眩晕的。但这远不及现在的眩晕。信息景观的动态性无需解释,只需亲身体验即可理解。从这个意义上说,道格知道他别无选择,只能冒险将其展示在大屏幕上,让观众自行判断。
-
即使是道格在 1968 年试图启动的那种用口香糖和铁丝拼凑的版本,也具备在其窗口中施加新结构的能力。从细枝末节到最宏大的特征,信息员可以随意安排符号领域,他通过窗口观察,同时驾驶他的工具,而观众则在大屏幕上目睹这一切。信息特征可以被重新排序、并列、删除、嵌套、链接、链式、细分、插入、修订、引用、扩展、总结——所有这些都可以通过指尖命令完成。可以调出整个文档,或者视图可以限制为每段的第一行或第一个词,或每页的第一段。
-
他展示的一个示例任务涉及到他当时正在进行的演讲的创建,从演讲的大纲到将他们的设备搬到市政礼堂的后勤安排。屏幕上显示的信息内容与他当时正在进行的演讲有关,而演讲又提到了屏幕上的信息——这是程序员称为“递归”的一种自我引用过程的例子。
-
Doug 通过操控信息的“视图”来引导观众的注意力。他的操作使屏幕显示和观众的意识在信息类别中穿梭
-
为了寻找一个小成功就能大幅提升效率的领域,并且成功会吸引大规模的研究和开发努力,Doug 选择了增强那些在我们社会中占据越来越大比例的人的“平凡但实用且重要的任务”:准备、编辑和发布文档。文档准备和交流这个领域只是他设想的广泛应用中的一小部分,但这是增强团队本身立即需要的工具,也是世界上每个实验室和办公室都会想要的工具——只要人们明白计算机不仅仅是计算器。
-
文本编辑系统是道格长期计划的第一阶段。使用该系统设计和描述下一代系统是第二阶段
-
软件被创建出来,以连接文本编辑系统和一种特殊的电子归档安排,这种安排将作为他们个人努力的统一记忆、记录和媒介。自 1965-1966 年以来,个人和团体可以通过软件日志访问共享的思考和交流空间;它使个人能够在增强实验的群体记录中插入评论(或浏览它们),并使程序员能够追踪系统功能的演变方式。该日志与共享屏幕电话一起,旨在增强实时的一对一通信,是整体对话支持系统的一部分,旨在帮助提高群体沟通和决策的有效性。
-
该日志旨在为在构建系统和探索其工作方式过程中产生的一系列对话、笔记和出版物带来秩序。除了作为对人因工程专家和系统程序员有用的电子日志外,该日志还旨在成为用户之间正式对话的媒介,发挥与当今传统图书馆和专业期刊相同的作用——但其放大效果将使其成为一种独特而强大的知识传递方法。
-
例如,各个领域的科学期刊遵循一种形式,其中描述研究结果的论文经过审稿后发表,随后其他论文可以引用这篇论文。任何科学知识领域的记录——以及讨论研究结果重要性的论坛——都由不断增长的期刊引用和附带文本组成。新创新和评论的传播需要时间,个人在分支的引用历史中穿行也需要相对较长的时间。在 NLS 版本中,可以非常轻松快捷地直接从任何文章跳转到被引用文章的文本并返回——将即使是最有效的图书馆/期刊系统中需要数小时或数月的程序缩短到几秒或几分钟。
-
这种更正式且高度结构化的智力交流对科学至关重要,但并不是普通公民日常事务中常用的交流方式。正如 Licklider 和 Taylor(Doug 的长期同事和主要资助者)在 1968 年指出的那样,新的交互式计算机和新的计算机网络将使得使用像 NLS 这样的工具成为可能,从而构建一个计算机辅助的社区,在这个社区中,不仅智力可以得到增强,交流也可以得到增强。
-
在最基本的层面上,交流始于两人或多人需要共享信息、进行交易、做出决策、解决分歧、达成协议、解决问题、传达计划
-
……两个人或更多人,位于分开的显示控制台,可以将他们的显示屏连接在一起,以便所有人都能看到相同的图像,并且可以选择由任何人进行控制。当同时通过电话交谈时,所产生的对话可以非常有效——相当于围绕他们的草稿本、工作记录和个人支持设施进行的面对面会议……
-
我们思维和工作方式的变化将比我们任何人所能预料的更加广泛和极端——这将是一场类似于文字和印刷术发展结合在一起的革命……
-
在 1970 年的同一次演讲中,他将多用户计算社区称为“供应商在观察探矿者贸易的会议”,恩格尔巴特还预测,未来会有“越来越多的人在终端上花费大量的专业时间”,并推测未来分散的个人增强系统连接成网络社区将创造出新型的社会机构:“特别是,将会出现一个新的‘市场’,代表着知识、服务、信息、处理、存储等商品的巨大财富。”
-
在 20 世纪 70 年代初的某个时候,恩格尔巴特受到了书籍的启发,就像过去几年他曾被布什和利克莱德的杂志文章所激励一样。这次,是商业管理专家彼得·德鲁克在 20 世纪 60 年代末提出的理论。根据德鲁克的定义,知识是信息的系统化组织;知识工作者是创造和应用知识以达到生产目的的人。德鲁克预测,主要基于知识的经济的快速出现,将是 20 世纪最后四分之一中最重要的社会变革。
-
德鲁克是最早的一批社会科学家之一,他们声称对劳动统计的研究揭示了知识工作在每个人未来中的重要作用。
-
在 1900 年,大多数美国人和最大的单一群体依靠农场谋生。到 1940 年,最大的单一群体是产业工人,特别是半熟练的机器操作员。到 1960 年,最大的单一群体是专业、管理和技术人员,即知识工作者。到 1975-80 年,这个群体将包括大多数美国人。根据德鲁克的说法,知识的生产力已经成为国家生产力、竞争力和经济成就的关键。知识,而不是土地、原材料或资本,已成为生产的核心因素。
-
普通的知识工作坊——办公室、会议室、图书馆、大学、工作室——已经存在了几个世纪。然而,增强的知识工作坊仅以原型形式存在,直到 ARC(以及后来在溪对岸的新地方,称为 PARC)开创的技术变得足够经济,可以作为办公设备出售,才会得到广泛使用。这是后来被他人改编为“未来办公室”这一简化版本的想法的起源。
-
作为一个有远见的人,Doug Engelbart 让自己沉迷于一个过时的愿景。NLS 功能强大但非常复杂,而学习复杂且困难的语言以操作信息工具的知识精英的概念,在恩格尔巴特的学生创造的更简单但更平等的个人计算机世界中已不再流行。
-
新的 Xerox 设施是一个以增强为导向的思想温床,但有一个重大区别——大规模集成电路的出现使得梦想甚至设计可以放在个人桌面上的高性能计算机成为可能。这种一人一机的强调在哲学和技术上与 Engelbart 的方法产生了重要的差异。
-
PARC 后来成为那些将计算机视为增强人类智力工具的人的新圣地
-
无论未来的历史学家如何评价参与这次前所未有的计划突破的人员的个性,他们都必须考虑那些在 20 世纪 60 年代和 70 年代初创造了分时、计算机网络和个人计算机的黑客的角色,他们这样做并不是出于病态的痴迷或小团体的轻浮,而是出于构建一种新的人人沟通媒介的严肃愿望。
第十章:来自 ARPAnet 的新老男孩
-
有许多不同大小的方块,在施乐的术语中称为窗口,看起来就像桌子上重叠的纸张。符号和图像也明显比我习惯在计算机屏幕上看到的更清晰。
-
1984 年,苹果公司的 Macintosh 计算机将这种处理电子桌面的方式引入大众市场。对泰勒来说,这并不特别具有未来感。Alto 和以太网自 1974 年以来就在这里运行。
-
1965 年,时年三十三岁的罗伯特·泰勒在五角大楼的办公室工作,先后担任 ARPA 信息处理技术办公室的副主任和主任。他的工作是寻找并资助涉及分时、人工智能、编程语言、图形显示、操作系统及其他计算机科学关键领域的研究项目
-
鲍勃·泰勒还负责发起创建 ARPAnet——由国防部创建的计算机(和思想)原型网络社区,这项工作始于 1966 年
-
1969 年,施乐公司首席执行官彼得·麦克洛宣布,他打算让施乐成为未来“信息的建筑师”
-
麦克洛任命乔治·佩克负责。佩克做的第一件事就是聘请他能找到的最优秀的长期计算机愿景家、研究组织者和人才搜集者——鲍勃·泰勒
-
如果说曾经有一个为“知识部门”的技术前沿设立的典范环境,那就是 PARC。从激光实验室的物理学家和定制微芯片车间的工程师工匠,到计算机语言设计师、人工智能程序员、认知生理学家、视频骑师、音响工程师、机械师、图书管理员、秘书、厨师、清洁工和保安,你会从遇到的每个人身上感受到一种美好的、理想化的氛围。
-
泰勒认为,个人计算的理念是 Licklider 在 20 世纪 60 年代初通过分时研究所启动的直接产物。分时技术就像最初的高级语言一样,是计算机科学和增强方法的一个分水岭
-
分时系统是早期且有效的应用,其哲学是现有的计算机使用方式应根据人类的运作方式进行调整,而不是强迫想要使用计算机的人去适应机械的限制。如果没有六十年代初期多用户计算的发展,个人计算的理念将永远只是一个梦想。
-
这些卡片被送到数据处理中心,由系统管理员决定如何以及何时将它们输入主计算机。(这些人过去是,现在仍然是支持“编程祭司”神话的丰富轶事来源。)
-
通过消除批处理中的“等待和观察”环节,分时系统使程序员能够将他们的技艺视为一种表演艺术。
-
一旦分时项目接近完成,泰勒首先追求的是一种互联分时社区的方法。他对当时分散的计算机研究世界有一个特权的全景视角,因为他的大部分时间都花在访问大学和智库,寻找和资助研究人员上。到 20 世纪 60 年代初,计算机研究各个子领域的进展正在加速。到 1966 年,拼图的各个部分即将准备好组装,分散的团队需要密切沟通。
-
泰勒资助的人随后开始规划和创建一个计算机网络,这些计算机位于全国不同地区,通过公共通信线路连接,能够共享资源并与不断壮大的计算机研究人员社区进行远程互动。那些将要构建并最终使用该系统的人开始亲自聚集在一起,讨论将资源以他们设想的方式连接所需的技术。一个来自分时研究工作的领导小组不再孤立工作,而是开始协同设计第一个在线互动社区
-
“我安排这些会议,让他们都必须互相了解,并在我面前进行技术上的争论,”泰勒回忆道。“我会提出一些问题,迫使人们在技术问题上站队。通过这种交流,建立了持久的友谊。我向他们提出了困难的问题。然后,在他们回到各自的实验室和校园后,他们的交流在质量和数量上都有所增加,因为他们彼此熟悉了。”
-
泰勒还发起了研究生的年度会议。老 ARPA 研究人员中最优秀的研究生们自己开会,远离像泰勒这样的“年长”人士,毕竟他也才三十多岁。就像规划欧洲哥特式大教堂的流动建筑团队一样,许多参与 ARPA 研究生会议的计算机系统建设者后来在 SAIL(斯坦福人工智能实验室)和 PARC 再次相遇,之后又在苹果和微软重聚。
-
互动计算社区的核心成员开始通过这个独特的新型互联计算机社区原型进行实验,不仅是对计算机的实验,也是对自身的实验。令所有参与者欣喜且毫不意外的是,这个实验网络迅速演变成一个激发人们交流和共享研究信息的环境,甚至可以用于传输和借用计算机程序。
-
“当思想互动时,新想法就会出现,”
-
作者没有从计算机的功能开始讨论,而是研究了他们希望增强的人类功能,特别是群体决策和问题解决的功能。他们主张,为了实现这种增强,工具应该根据该人类功能的特殊需求来构建。为了将计算机用作人群的沟通放大器,需要一种新的沟通媒介:“创造性、互动性的沟通需要一种可塑或可模塑的媒介,这种媒介可以被建模,是一个动态的媒介,其中前提会流入结果,最重要的是,这是一种所有人都可以贡献和实验的共同媒介。”
-
“迄今为止数量最多、最复杂、最重要的模型,是那些存在于人类头脑中的模型。”
-
事实、记忆、感知、图像、联想、预测和偏见是我们心智模型的组成部分,从这个意义上说,心智模型如同构建它们的人一样独特。我们在头脑中构建的模型具有本质上的隐私性和多样性,这就需要我们制作外部版本,以便他人能够感知并达成共识。因为社会作为一个集体实体,不信任仅由一个人头脑中构建的模型,它要求人们在模型被接受为事实之前达成一致。
-
因此,交流的过程就是将心理模型外化的过程。口语、书面文字、数字和印刷媒介都是人类在外化和达成共识模型方面的重要进步。这些发展中的每一个都依次改变了人类文化,并增强了我们对环境的集体控制。在本世纪,电话系统为人类交流工具箱中增添了一种强大的新建模媒介。Licklider 和 Taylor 宣称,如果计算机和通信技术的结合能够被个人所使用,它将有可能成为有史以来最强大的建模工具。
-
更重要的是,他们展示了这种微妙的通信增强如何提升创造性的信息活动。能够从微观细节切换到宏观视角,组装和重新组装模型,查找和替换文件,剪切、粘贴和整理,同时公开查看某些信息并做私人笔记,在演讲者讲话时翻阅他的文件或检查他的参考资料,这些都使得人们能够通过计算机系统以非增强会议中无法实现的方式进行交流。
-
“几年后,”作者在文章的开头预测道,“人们将能够通过机器比面对面更有效地交流。”
-
这些社区在多个方面都是社会技术的先锋,领先于计算机世界的其他部分:是什么使他们如此?首先,他们的一些成员是计算机科学家和工程师,理解人机交互的概念和交互式多用户系统的技术。其次,其他成员是来自其他领域和学科的创意人士,他们认识到交互式多用户计算对其工作的实用性和影响。第三,这些社区拥有大型多用户计算机,并已学会使用它们。第四,他们的努力是再生性的。
-
泰勒和利克莱德谈到了他们所启动的各种项目的最终目标:创造工具以增强个人的思维能力并加强群体之间的交流。
-
Licklider 和 Taylor 预见到这些系统在大规模上变得实用的那一天,并提醒他们的同事,这种新的信息处理技术不仅可以彻底改变研究中心和大学,还可以改变办公室、工厂,最终甚至是学校和家庭。
-
展望当时的长期未来,Licklider 和 Taylor 对超级社区可能产生的影响持积极态度,这些社区可能不仅包括计算机科学家和程序员,还包括家庭主妇、学生、办公室职员和艺术家
-
但让我们保持乐观。在线互动社区将会是什么样子?在大多数领域中,它们将由地理上分散的成员组成,有时会以小群体的形式聚集,有时则单独工作。它们将是基于共同兴趣而非共同位置的社区。在每个领域中,整体的兴趣社区将足够大,以支持一个全面的领域导向的程序和数据系统。
-
在每个地理区域,用户的总数(涵盖所有感兴趣的领域)将足够大,以支持广泛的通用信息处理和存储设施。所有这些设施将通过电信渠道互相连接。整体将构成一个不稳定的网络网络——在内容和配置上不断变化。
-
作者设想创建一个互联的软件工具系统,该系统将提供“投资指导、税务咨询、在您专业领域内选择性的信息传播、符合您兴趣的文化、体育和娱乐活动公告等。在后者中将包括字典、百科全书、索引、目录、编辑程序、教学程序、测试程序、编程系统、数据库,以及——最重要的——通信、显示和建模程序。”他们可能是在描述十年后在 PARC 可用的设施。
-
首先,在线个体的生活将更加幸福,因为与之互动最密切的人将更多地根据共同的兴趣和目标选择,而不是因为地理上的偶然性。其次,交流将更加有效,因此也更令人愉快。第三,许多交流将与程序和编程模型进行,这些模型将(a)高度响应,(b)补充个人能力而非竞争,并且(c)能够逐步表达更复杂的想法,而不必同时展示结构的所有层次——因此既具有挑战性又有回报。第四,每个人(能负担得起控制台的人)将有充足的机会找到自己的使命,因为整个信息世界及其所有领域和学科都将向他开放——有程序准备好引导他或帮助他探索。
-
对于社会而言,影响是好是坏主要取决于一个问题:上网是特权还是权利?如果只有一部分受宠的人群有机会享受“智能增强”的优势,网络可能会加剧智力机会光谱中的不连续性。
-
另一方面,如果网络理念能够实现一些人所希望的那样为教育带来变革,即使没有具体的详细计划,并且如果所有人都对此做出积极响应,那么对人类的好处将是无法估量的。
-
奇怪的是,这种抒情且出人意料地浪漫的散文竟然出自五角大楼的两位计算机研究组织者之手
-
但到了 1971 年,当泰勒为 PARC 的计算机科学实验室招募了五六十名该领域的顶尖人才时,互动计算机设计师的精英们已经从分时和 ARPAnet 项目中积累了足够的工程和软件研究经验,使他们相信这样一个乌托邦式的场景可能实现——尤其是如果像施乐这样拥有资源的公司愿意进行高风险的赌注。
-
那些建造了第一台交互式多用户计算机、第一套智力增强系统和第一批分组交换计算机网络的人首次聚集在同一屋檐下,以便尽快将这些梦想变为原型。Butler Lampson、Chuck Thacker、Jim Mitchell、Ed McCreight、Bob Sproull、Jim Morris、Chuck Geschke、Alan Kay、Bob Metcalfe、Peter Deutsch、Bill English——对于那些了解计算机设计神秘世界的人来说,PARC 计算机科学的创始人们构成了一支前所未有的人才队伍。
-
这不是那种旧式等级制度和权力顺序能起作用的商店。你不能像管理那样去经营这样的团队,而是需要调解——这正是 Bob Taylor 的用武之地。他们正在构建的东西,以及构建它所需的人才,需要在愿景和实用主义之间取得平衡,这种平衡无法通过人为强加的权威来维持。
-
如果他们能够证明这些设备可以加快他们自己的工作进程,他们就能向全世界推广他们从分时系统时代起就持有的愿景。
-
因为他们知道视觉是人类感官中能够处理最复杂信息输入的能力,PARC 的计算机专家们知道他们需要一个复杂的图形屏幕来将计算机的强大功能带给用户。复杂、动态的视觉模型需要大量的计算机能力,因此强调视觉显示的决定意味着硬件将拥有比计算机领域中任何人之前为个人提供的更多的内存和速度。
-
我们在规划 Alto 时都明白,我们想要的主存储器在 1974 年生产时可能要花费 7000 美元,但十年后将降至大约 35 美元
-
“我们在讨论硬件和软件之前,先讨论了我们个人想用这个系统做什么,”泰勒回忆道。“我们知道有技术问题需要解决,并且会在适当的时候去挑战它们。首先,我们必须考虑我们想要增强的人类功能。例如,人们大量使用眼睛来获取信息,所以我们想要一种特别强大的显示屏。然后,所有分时系统的老手都坚持他们想要一台在夜间不会运行得更快的计算机。”
-
“人们通过视觉和指点比通过记忆和打字更快速、更容易地向计算机发出指令,所以我们采用并改进了鼠标,”泰勒补充道。“人们学习人工语言很困难,而机器学习自然语言则更难。现有的计算机语言无法让初次使用者和实验程序员与计算机进行同等程度的互动,因此我们创造了新型语言。”
-
我们将所有计算能力带给个人的目的不是让他们自我隔离。我们希望提供通往新交流空间的门户,提供在其中自由翱翔的方法,同时也提供一个社区创造的媒介。
-
PARC 的人们渴望拥有个人计算能力,但他们不想放弃在 ARPAnet 上刚刚开始了解的那个来之不易且能放大努力的社区
-
调制解调器,通过将计算机比特转换为公共电话系统用于传递信息的音调模式来工作。局域网使用另一种小盒子,将计算机数据转换为电信号,通过短电缆在计算机之间传输,而不是通过公共通信线路发送的音频信号。
-
当今的网络技术使用了在创建 ARPAnet 期间最初开发的分组交换技术——正是 Shannon 在 1948 年预测的信息编码方式。信息以信息包的形式传输和处理——即编码的开关脉冲——除了消息的核心数据外,还携带有关消息如何传输和接收的信息。如果你的计算机使用了正确类型的硬件和软件翻译器,你的数据将根据嵌入在数据包中的控制和路由信息自行找到通过网络的路径。
-
分布式系统中,许多人各自拥有功能强大的个人计算机,并共同组成更强大的计算社区,这与早期集中控制且高度受限的计算机完全不同。
-
PARC 开发的 Alto、以太网和 Smalltalk(一种同样先进的计算机语言)原型已经将交互式计算的水平远远推进到 ARPA 资助的分时项目所达到的水平之上
-
20 世纪 80 年代初,计算机行业的一个陈词滥调是:“如果施乐在 Star 技术准备就绪时就进行市场推广,他们就会从 IBM 和苹果手中抢走整个行业。”然而,事实是,当 1981 年 4 月 Star 8010 信息系统发布时,办公专业人士的大部分还没有意识到他们是信息工作者。施乐的市场管理层坚持认为,这款工作站不仅在为个人提供工具方面取得了突破,而且是一个集成办公系统的一部分,该系统由互联的组件组成,共享邮件、打印和文件服务。但除了少数特权测试点外,没有人知道这意味着什么。
-
他们创造了部分心理学、部分计算工程的用户界面。
-
在有意识的思考过程中,大脑利用了多个层次的记忆,其中最重要的是“短期记忆”。许多研究分析了短期记忆及其在思考中的作用。有两个结论尤为突出。(1)有意识的思考处理短期记忆中的概念……(2)短期记忆的容量是有限的……当计算机系统中处理的一切都是可见的时,显示屏通过充当一种“视觉缓存”来减轻短期记忆的负担。思考变得更容易且更有成效。一个设计良好的计算机系统实际上可以提高你的思考质量……
-
当一切都可见时,会发生一种微妙的变化:显示屏成为现实。用户模型与屏幕上的内容变得完全一致。物体可以仅通过其可见特征来理解。
-
当施乐未能成为行业中的领军者,而个人计算机的业余爱好者一方发展到某些原始爱好者开始招募 PARC 科学家并建立自己的个人计算机帝国时,首批高层 PARC 叛逃者开始将 Star 中体现的用户界面概念传播到整个行业。
-
1983 年,苹果推出了 Lisa——一台使用鼠标、位图屏幕、窗口以及其他基于 Star-Alto-Smalltalk 界面的功能的机器。该系统的价格约为 10,000 美元,比更强大的 Star 便宜 6,000 美元,但仍然不太适合消费市场。1984 年,苹果推出了 Lisa 的缩小版和更便宜的版本——Macintosh,具有相同的用户界面,彻底改变了个人计算机市场。
-
网络技术、图形、编程语言、用户界面以及廉价的大规模信息存储介质的进步意味着,第一代个人计算机设计者所梦想的基本功能可能会在世纪之交前广泛普及
第十一章:幻想放大器的诞生
-
成为另一个硅谷百万富翁或接受麻省理工学院的教职邀请,对他来说都不如将想象力的力量交到每一个被赶出教室的聪明孩子手中更有吸引力。
-
他几乎因不服从而被八年级开除
-
现在他的目标是建造一个“幻想放大器”,一个“动态的创造性思维工具”,它足够强大、足够小、足够易用且价格足够低廉,以至于世界上每个学生都能拥有一个。
-
作为他这样的人,接受教育对艾伦来说并不容易。起初,他比所有同学和大多数老师知道得更多,而且他不介意大声展示这一点——这种特质让他被赶出教室,并在操场上挨打。
-
他从未理解为什么他最喜欢的两样玩具——书籍和乐器——不能结合成一种能够同时处理声音和符号的媒介
-
他获得了生物学学位,但由于他只专注于自己感兴趣的事情,他的大学成绩一如既往地参差不齐。通过艾伦现在称之为“纯粹的运气”的方式,他引起了一个足够聪明的人注意,这个人能够真正教会像艾伦·凯这样的聪明人一些东西,并且大胆地接纳了一位本科成绩单看起来更像犯罪记录而非学术成绩的学生。
-
在学术界冒险接纳凯的多变历史的人是犹他大学计算机科学系的主任大卫·埃文斯
-
ARPA 资助的是人而不是项目,他们不会长时间干涉。Licklider 和 Bob Sproull 的天才之处在于,这种流动性促进了一个社区的成长
-
他凭借自己的麻省理工学院博士论文——现已成为传奇的程序“Sketchpad”——单枪匹马地创建了计算机图形学领域。
-
它为人类的模糊性和判断力留出了空间。它没有强迫用户将事物划分为明确的类别,也不要求数据从一开始就精确——所有那些人们所说的“计算机需要”的严格限制——而是让你可以随心所欲地调整事物。无论出于何种原因,你都可以重新排列,直到得到你想要的结果。
-
计算机屏幕的技术是通用的,适用于一切——但前提是你能将思维适应于计算机屏幕的方式。
-
埃文斯管理研究生项目的方式是,你不应该在校园里待太久或太多。你应该成为一名专业人士,并转向工业界的高级咨询工作。
-
Kay 首次发誓要确保他的个人计算机至少能部分地迎合使用者,并意识到软件设计是实现这一愿望的领域。
-
Alan Kay 已经开始考虑设计一种新的编程语言。他开始渴望的这种语言将成为一种工具,用于将计算机作为一种通用模拟器来使用。问题在于编程语言极其深奥难懂。Kay 断言:“有两种方式可以考虑构建一种工具。你可以制造像小提琴那样只有少数有才华的艺术家才能演奏的东西。或者你可以制造像铅笔那样可以快速轻松地用于从学习字母到绘画再到编写计算机程序的任何事情的东西。”他确信,要解决的真正可用的个人计算机程序的 99%的问题都是软件问题
-
我突然意识到 Simula 是一种编程语言,用来做 Sketchpad 所做的事情。我从未真正理解过 Sketchpad 是什么。现在想起来我都感到颤抖。它从不同的维度旋转了我的视角,从那时起一切都不再一样。我突然理解了高级语言的目的。
-
凯回忆道:“恩格尔巴特团队都是他们 NLS 系统的顶尖飞行员。”他们的反应几乎是瞬时的——就像一个非常好的电子游戏。你可以在庞大的信息领域中导航。不幸的是,对于我的目的来说,这是一种优雅而复杂的东西,这些专家已经学会了如何操作。对我来说,这太复杂了,我对将读写能力视为一种流利程度的概念不感兴趣。
-
在 20 世纪 60 年代末,Papert 特别是在做一些对 Alan 的目标产生不可逆影响的事情。Papert 正在为儿童创造一种新的计算机语言。
-
学习不仅仅是成年人通过教师和课堂强加给后代的东西,而是儿童天生反应世界的一种深层次方式的一部分,儿童在明确的阶段中,从他们可获得的材料中构建他们对世界运作方式的概念。
-
皮亚杰特别感兴趣的是儿童如何获得不同类型的知识,并得出结论认为儿童是科学家——他们进行实验,制定理论,并通过更多实验来检验他们的理论。对我们其他人来说,这个过程被称为“玩耍”,但对儿童而言,这是一种重要的研究形式。
-
帕珀特认识到,计算机的响应能力和表现能力可能使儿童能够在沙箱或黑板上无法实现的规模上进行研究
-
尽管其创造者知道 LOGO 实验可能在人工智能、计算机科学以及教育领域产生深远影响,但该项目主要旨在为儿童创造一种教授思维和解决问题技能的工具。其目的是赋予儿童权力,而不是压制他们以有趣和有益的方式解决问题的自然愿望。LOGO 小组的说法是:“目标不是让计算机来编程学生,而是让学生来编程计算机。”
-
这是将 LOGO 与之前的“计算机辅助教学”项目区分开来的关键元素。LOGO 的方法不是将教育视为从教师向学生传递知识的任务,而是帮助学生增强自己发现知识的能力。
-
例如,这些技能中最重要的之一是“错误”的概念——程序员用这个词来描述计算机程序中不可避免出现的小错误,这些错误必须在程序运行之前被追踪到。学习 LOGO 的任务不是让学生在寻找“正确”答案的过程中受挫,而是鼓励孩子们通过大胆尝试新方法来解决问题,然后调试这些方法直到它们有效。
-
LOGO 引入的第一个革命性学习工具是“海龟”,这是一种部分是机器、部分是隐喻的设备。最初的 LOGO 海龟是一个小型机器人,由计算机控制并由孩子编程,可以被指示移动,在移动过程中拖动一支笔,在纸上绘制出引人入胜的图案。Alan Kay 是几位软件设计师之一,他们意识到这个过程不仅仅是练习画图,因为操控符号的能力——无论这些符号是海龟图画、文字还是数学方程——都是增强人类思维的每种媒介的核心。
-
如今更先进的显示技术中的抽象海龟是一个三角形的图形,在显示屏上留下视频轨迹。无论它是由金属制成并在纸上绘图,还是由电子制成并在视频屏幕上绘图,海龟都是教育心理学家所称的过渡性对象——而 Papert 称之为“思考的对象”。
-
与其“编程计算机”来绘制图案,不如鼓励孩子们“教乌龟”如何绘制。他们首先“假装自己是乌龟”,尝试猜测乌龟如何画出一个正方形、三角形、圆形或螺旋形。然后,他们通过键盘输入一系列类似英语的命令,以“教乌龟一个新词”。
-
如果乌龟对输入命令的反应没有达到预期的图形效果,下一步就是系统地找出阻碍成功的“错误”。在这个过程中,对错误的恐惧被自己发现强大想法的即时反馈所取代。
-
任何工具的目的都应该是帮助人类变得更有人性
-
在我的愿景中,计算机充当一种过渡性对象,以调解最终在人与人之间的关系……
-
我谈论的是一种思想革命,这种革命无法简化为技术,就像物理学和分子生物学无法简化为实验室中使用的技术工具,或诗歌无法简化为印刷机。在我的设想中,技术有两个角色。一个是启发性的:计算机的存在催生了新思想的出现。另一个是工具性的:计算机将把这些思想带入一个比它们迄今为止孵化的研究中心更大的世界。
-
当他接触到 LOGO 项目时,正值他反思自己在 FLEX 机器上投入了两年时间,却发现它对尝试使用它的人不友好,艾伦·凯回忆说:“这就像我脑海中亮起了一盏灯。我知道我再也不会设计一个不为儿童设置的程序。”
-
他首先理解到的一件事是,儿童可以学习的程序或编程语言不一定是“玩具”。玩具也可以作为工具。但这种转变不会自然发生——它是通过设计语言的人大量工作实现的。Kay 已经知道,创造个人计算的最重要工具在于软件,但现在他意识到,这些工具所增强的力量将是学习的能力——无论用户是儿童、计算机系统设计师,还是人工智能程序。
-
这有点像是为儿童建造一个可以用来堆沙堡的工具,但同样对想要建造摩天大楼的建筑师有用。他心中设想的是一种全新的工艺品:如果他最终得到一个八岁小孩可以单手携带并用来交流音乐、文字、图片,以及查阅博物馆和图书馆的设备,这个设备会被视为工具还是玩具?
-
凯开始明白,他想要创造的是一种全新的媒介——一种与历史上所有静态媒介根本不同的媒介。这将是第一个动态媒介——一种可以表现、交流和动画化思想、梦想和幻想以及文字、图像和声音的手段
-
杜威发展了一种理论,后来皮亚杰对此进行了详细阐述——成年人常常误以为“无目的”的想象游戏实际上是了解世界的有力工具。凯希望将探索幻想的自然欲望与从实验中学习的天生能力联系起来,他知道计算机模拟任何可以清晰描述事物的能力是实现这一联系的关键之一。
-
Alan 想要创造一种既能放大幻想又能增强智力的媒介。首先,他必须设计一种比 LOGO 更适合他目的的语言,一种“新的编程系统,试图将简单性和易用性与专家级成人编程的质的提升相结合。
-
符号语言的特定结构很重要,因为它提供了一个上下文,在这个上下文中,某些概念比其他概念更容易思考。例如,数学符号最初是为了缩写那些只能用自然语言的笨拙迂回表达的概念。逐渐地,人们意识到表达式的形式和操作可以极大地帮助理解和操作表达式所代表的意义。
-
凯提到的“颠倒传统科学研究过程”是计算机模拟能力的来源。而将想法以可见形式模拟的能力,正是新编程语言需要包含的,以便将计算机用作想象力的放大器。如果皮亚杰是正确的,儿童既是科学家又是认识论者,那么用于模拟科学研究的工具可能对儿童和成年计算机程序员的学习速度和学习量产生巨大影响。
-
根据弗朗西斯·培根三百年前首次提出的科学归纳法则,科学知识及其赋予的力量是通过首先观察自然,记录从这些直接观察中出现的模式和关系,然后创建一个理论来解释这些观察而产生的。随着
-
帕普特称这些模拟的宇宙为“微世界”,并使用 LOGO 创建的微世界来教授十岁儿童逻辑、几何、微积分和问题解决。一个好的电子游戏的魅力部分在于其微世界表现的视觉冲击力,以及给予玩家的反应能力,从而学习如何控制它。在 Smalltalk 中,每个对象都被设计为一个微世界。
-
计算机科学家谈论计算机语言中的计算隐喻——关于编程实际作用的替代性思维框架。最广泛和最古老的隐喻是食谱,就像为一个非常愚蠢但听话的仆人创建的食谱——一系列明确的、逐步的指令,当由一个无意识的指令执行机制执行时,可以提供所需的结果。指令的顺序是计算机操作方式的一个准确但有限的隐喻。这反映了早期计算机被设计为一次只做一件事,但做得非常快,然后继续执行下一条指令的事实。
-
然而,这种模型并不适合未来的计算机,因为未来的计算机将同时执行许多过程(这种计算称为并行处理)。基于数值、串行过程这一主导隐喻的语言更适合于像算术这样的线性过程,而不太适合计算机需要执行的那些任务,如果计算机要作为表现媒介的话。并行处理也是人类大脑处理信息的更好模型。
-
从 LOGO 和 Simula 中提出的概念出发,Kay 开始设计一种新的隐喻,其中一条条指令的串行被一个由对象占据的多维环境所取代,这些对象通过互相发送消息进行通信。实际上,他开始构建一种计算机语言,使程序员能够将主机计算机视为成千上万个独立的计算机,每一个都能指挥整台机器的力量,而不是作为一个串行指令的执行者。
-
Alan Kay 已经在思考一种非常强大且便携的特殊个人计算机,后来他称之为“Dynabook”。
-
Kay 的学习研究小组,包括 Adele Goldberg、Dan Ingalls 和其他人,开始创建 Smalltalk,这个编程“环境”将为硬件注入计算生命力
-
预期硬件的一个最重要特征是显示屏的视觉分辨率。Alan 注意到,当孩子们学习 LOGO 时,他们对计算机的要求非常高,尤其是在高分辨率、彩色、动态显示方面。他们习惯于电视上的卡通片和 70 毫米宽银幕电影,而不是当时计算机显示屏上模糊的图像
-
Kay 认为,为了最有效地吸引和保持大量计算机用户的注意力,并赋予用户显著的计算机控制能力,所需的像素数量大约为一百万个点
-
Alto 实现其高分辨率屏幕的技术被称为“位图”,这个术语意味着显示屏上的每个图像元素、每个光点都与计算机内存中特定位置的一位信息相连接,从而在屏幕上创建了一种双向的信息地图。例如,如果计算机“内存地图”中的特定位被关闭,那么屏幕上的相应位置就不会有光点。相反,内存地图中某个坐标的“开启”位会在指定的屏幕位置产生一个光点。通过软件命令打开和关闭位图的部分,可以在屏幕上创建(并更改)可识别的图形图像。
-
与计算机内存直接连接的视觉显示的重要性与人类在大量信息中识别非常微妙的视觉模式的能力有关——这无疑是一种生存特性,早在我们的祖先爬树和在稀树草原上徘徊时就已经进化出来了。
-
屏幕是一种表示,但它也是一个控制面板——在位图屏幕上的绘图可以仅仅是一个绘图,但它也可以是一种命令,甚至是一个程序,用来控制计算机的操作。
-
例如,如果你使用鼠标在屏幕上移动视频指针,触碰文件夹或发件箱的视觉表示,你可以从计算机的内存中调用该文件夹,并通过指向它在屏幕上显示其中的文档,或者将计算机存储的发件箱内容发送到其他人的收件箱,那么即使一个人对计算机编程一无所知,也能够完成办公室中的工作。这毕竟是激励施乐管理层创建 PARC 并让他们的天才们自由发挥的潜在未来市场。
-
创建新型计算机输入和输出设备,以帮助人类模式识别与机械符号操作相结合,这被称为“设计人机界面”。这种艺术和科学必须在 20 世纪 70 年代创建,以实现 Licklider 和 Engelbart 在 20 世纪 60 年代设想的人机合作伙伴关系,并可能在 20 世纪 80 年代开始实现。Alan Kay 的 Smalltalk 项目在 Alto 界面的演变中发挥了关键作用
-
多元化的 PARC 团队一致认为,真正的个人计算机应该能够被立法者和图书管理员、教师和儿童使用。而一台可以通过在屏幕上查看图像并用鼠标指向它们来操作的计算机,显然比需要输入神秘键盘命令才能运行的计算机更具广泛的可用性。
-
像之前的 Bush、Licklider、Taylor 和 Engelbart 一样,Kay 和 Goldberg 谈论的不是电路或程序,而是媒体、知识和创造性的人类思维
-
在大部分有记录的历史中,人类与媒介的互动主要是非对话式的,因为纸上的符号、墙上的画,甚至“动态”影像和电视都不会根据观众的愿望而改变。一个数学公式——可能象征着整个宇宙的本质——一旦写在纸上,就保持静止,需要读者去扩展其可能性。
-
媒介的本质在很大程度上取决于信息的嵌入、变化和观看方式
-
尽管数字计算机最初是为进行算术计算而设计的,但模拟任何描述性模型细节的能力意味着,如果嵌入和观看方法足够完善,计算机作为一种媒介本身可以成为所有其他媒介。此外,这种新的“元媒介”是主动的——它可以对查询和实验作出回应——因此信息可能会让学习者参与到双向对话中。除了通过个人教师的媒介外,这种特性以前从未出现过。我们认为其影响是广泛而引人注目的。
-
一个用于创造性思维的动态媒介:Dynabook。想象一下,拥有一个便携式的自包含知识导航器,其大小和形状如同一本普通的笔记本。假设它有足够的能力超越你的视觉和听觉,有足够的容量存储成千上万页的参考资料、诗歌、信件、食谱、记录、图画、动画、乐谱、波形、动态模拟以及你想记住和改变的任何其他内容,以便日后检索。
-
处理器能够创建、编辑、存储和检索由文字、图形图像、声音、数字或这四种符号形式的组合构成的文档。
-
鼠标既可以用来绘图,也可以用来指点,而“图标编辑器”(Smalltalk 的另一项创新)使用符号,让那些还不识字的孩子也能编辑图形;例如,孩子可以指向画笔图标,而不是输入命令来调用图形光标。
-
“它不必被视为模拟的纸质书,因为这是一种具有新特性的媒介。可以进行动态搜索以找到特定的上下文。文件媒介的非顺序性质和动态操作的使用允许一个故事拥有许多可访问的视角;例如,杜雷尔的《亚历山大四重奏》可以是一本书,读者可以在其中通过叙述追寻多条路径,”
-
用户在熟悉用于绘图、编辑、查看和交流的工具包时,媒介的动态特性变得清晰可见。Smalltalk 不仅仅是一种语言,而 Alto 系统也不仅仅是一个个人计算机。硬件、软件以及用户学习软件的工具共同构成了一个环境——一个小型的象征性飞船,初次使用者学习如何控制和引导它穿越个人宇宙。
-
用户不仅能够以一种新的方式进行创作和编辑,而且一旦他们学会如何使用这种媒介,他们就能够自主选择如何查看指尖上的信息世界。
-
“动画、音乐和编程,”Kay 和 Goldberg 写道,“可以被视为动态过程的不同感官视图。它们之间的结构相似性在 Smalltalk 中显而易见,Smalltalk 提供了一个表达这些想法的通用框架。”
-
Kay 首先指出的一件事是,使用交互式图形工具与运用一种新的认知技能之间的联系——这种技能在于选择观察世界的新方式
-
教非专业人士与计算机交流的最佳方法之一是让他们探索图像可以被操作的抽象层次。
-
凯指出,当他将孩子们用作娱乐和进入 Smalltalk 编程的工具交给一位成年艺术家时,这位艺术家一开始创作了各种类似于他习惯在纸上制作的设计。最终,这位艺术家发现新媒介的特性,以及他对这些特性的日益熟练掌握,使他能够探索以前用旧媒介无法创造的图形世界。凯写道:“从使用计算机对现有媒介的贫乏模拟,他进步到发现计算机在人类表达方面的独特特性。”
-
在观察者语言中,活动被替换为“视角”,这些视角相互连接形成概念。例如,一只狗可以被抽象地看作(作为一种动物)、分析地看作(由器官、细胞和分子组成)、实用地看作(被孩子当作交通工具)、寓言地看作(童话中的人类)以及情境地看作(作为骨头给草坪施肥的方式)。观察者语言正在被制定中。它们及其后继者将成为 20 世纪 80 年代的交流工具。
-
Kay 提出了关于个人计算机作为人类表达新媒介组成部分的理论,并将个人计算机的近期和未来出现与过去媒介较慢的发展周期进行了比较。他还预测,伴随新的计算机化读写能力而可能出现的人类社会秩序的变化,将比以往的媒介革命带来的影响更加深远
-
在这个有读写能力的人群中,或许会有一些富有创造力的个人向我们展示可以实现的成就
-
我们不应仅仅因为个人电脑有可能促进教育革命就预测或期望它会这样做。本世纪的每一种新通信媒介——电话、电影、广播和电视——都曾引发过类似的预测,但这些预测并未实现。世界上有数百万未受教育的人可以在公共图书馆中轻松获取几世纪以来积累的文化,但他们并未利用这些资源。然而,一旦个人或社会决定教育是必不可少的,书籍以及现在的个人电脑就可以成为社会传递知识的主要工具之一。
-
然而,未来的 Dynabook 与过去所有图书馆之间的区别在于这种媒介的动态特性。图书馆是文化瑰宝的被动存储库。你必须自己进去挖掘意义。而 Dynabook 将结合优秀电子游戏的吸引力、图书馆和博物馆的文化资源、动画指画集的表现力以及合成乐团的力量。最重要的是,它会主动寻找适合当前任务的知识,并以最适合每个使用者的形式和语言进行交流。
-
此类设备的智能——即人工智能研究中的软件突破有朝一日必然要与个人计算机的发展相交——将影响它们为需要的人提供资源的能力。当机器足够聪明到可以与八岁儿童交流时,问题将从如何构建人们易于使用的计算机转变为我们如何利用这种能力。
-
如果图书馆能够发现你最感兴趣的内容和你最需要了解的知识,并向你展示如何找到你想要的东西,那会怎么样?如果你可以对图书馆说:“我想知道在哈里发时期的巴格达生活会是什么样子?”或者“我想知道成为一头鲸鱼是什么感觉?”并期待图书馆为你展示呢?你喜欢梵高吗?那模拟一下他家外面的田野怎么样?你想和路易斯·阿姆斯特朗或沃尔夫冈·莫扎特一起坐下来吗?如果我们都能看到其他人是如何生活的,并分享他们的文化,这会对世界产生什么影响?
-
如果即将到来的元媒介的第一个效果可能是创造一个共享使用符号的新自由并选择如何查看信息的有文化人口,那么第二个效果就在于这种媒介独特的力量——模拟的力量。模拟是看到你所想象的、创造服从你命令的世界的力量。计算机可以即时构建感官表现。用户/程序员探索一个会做出反应的宇宙,其中用户的力量程度取决于并随着对世界运作方式的理解而增长。
-
模拟的力量在于能够增强想象力,并赋予心中所见以形式,这使得这种设备成为“幻想放大器”。虽然有几条格言可以被称为“凯伊第一定律”,但他最常称之为“凯第二定律”的是:“任何时候你建造一个幻想放大器,你就赢了。”他的理由是,游戏和幻想是人们在世界上生存所需技能的隐喻。
-
“我们生活在自己设计的幻觉中,”凯伊常说。但我们的幻觉如此复杂,我们体验到的世界似乎超出了我们的控制,操作手册又难以找到,以至于我们都倾向于被家庭、社会和文化对世界的看法所束缚。凯断言:“我们无法在没有幻想的情况下存在,因为这是人类的一部分。幻想是一个更简单、更可控的世界。”
-
通过练习如何控制一个更简单版本的世界,我们常常能够弄清楚如何在幻想之外的世界中运作。游戏既可控又具有挑战性。它是通过替代的方式、有目的地进入,并对结果持开放态度。从这个意义上说,体育、科学和艺术都涉及替代性的、有目的的幻想。这就是为什么他认为电子游戏不是一时的潮流,而是某种更具深远力量的事物的前兆。这很可能是他加入雅达利公司的原因。
-
还有一些倾向是将计算机用于琐碎的事情(模拟纸张、颜料和文件柜可以完成的工作)
-
更严重的是人类倾向于信任并赋予一个未完全理解的代理更高的权力。事实上,许多组织实际上基于计算机模型做出决策——更糟的是,从计算机模型中获取决策——考虑到当前计算机技术的状态,这令人深感不安……
-
关于模拟应该和不应该用于何种目的的伦理问题才刚刚开始被制定。
-
尚未失去太多好奇心和乐趣的孩子们帮助我们找到了关于计算的伦理:不要自动化你所从事的工作,只自动化材料。如果你喜欢画画,不要自动化绘画;相反,编程你的个人电脑为你提供一套新的颜料。如果你喜欢演奏音乐,不要建造一个“自动钢琴”;而是为自己编程一种新型乐器。
-
我们对计算机的看法——作为机器、模仿人类能力的系统、工具、玩具、竞争者或合作伙伴——将在很大程度上决定它们在社会中的未来角色。
-
关于计算机的一个常见误解是它们是逻辑的。直率可能是一个更好的词。由于计算机可以包含任意的描述,任何可以想象的规则集合,无论是否一致,都可以执行。此外,计算机对符号的使用,就像语言和数学中的符号使用一样,与现实世界的联系足够松散,以至于它们能够创造出精彩的无稽之谈。尽管计算机的硬件受自然法则的约束(电子只能以某些物理定义的方式通过电路),但计算机可以执行的模拟范围仅受人类想象力的限制。在计算机中,航天器可以被设定为以超光速旅行,甚至逆向时间旅行。
-
历史对那些持这种观点的人并不友好
-
他在 ARPA 和犹他州、Sail 和 PARC、Atari 和 Apple 学到的一件事是,聚集一群人才并让他们独立工作,可能是实现他梦想所需突破的最重要因素。
第十二章:布伦达与未来小队
-
布伦达和她的朋友们对同样让我困惑的问题感兴趣:操作未来的心智增强信息载具会是什么感觉?
-
理想情况下,我们不会看到这些假想的未来计算机,因为它们将是隐形的,内置于环境之中。
-
试着想象一台看不见的计算机,它被设置为满足你所有的信息需求。你进入一个房间(或戴上一个头盔),房间(或头盔)会多感官地呈现任何你能想到的真实或虚构的事物。
-
但你不必只阅读关于鲸鱼的内容。你可以听它们的声音,观察它们,拜访它们。只需提出请求,你就会在水下,与它们一起游泳,或者在直升机上,在晶莹剔透的巴哈水域上空盘旋时观察它们。
-
自从凯离开施乐后,麻省理工学院、卢卡斯影业和埃文斯与萨瑟兰公司都在争夺他的服务,可以肯定的是,雅达利一定给他提供了更多的东西
-
“你需要硬件设计师?我们会给你找硬件设计师。”你可以想象他们这样说。雅达利为他找来了最优秀的人才——包括特德·霍夫,这位传奇的英特尔科学家是发明微处理器芯片的团队的领导者。凯组建了自己的软件研究团队。
-
媒体室是一个信息终端,人们可以在里面走动——一个可以直接与机器交流的地方,而不需要像键盘这样的显式输入设备。
-
这个创新小组由艾伦·凯的老朋友兼雅达利顾问尼克·尼葛洛庞帝领导
-
来自麻省理工学院小组的“空间数据管理”理念是为了应对如何在计算机开启的巨大新信息领域中导航的问题,通过采用信息空间的隐喻,让用户可以或多或少地“飞行”穿越其中。
-
软件设计中的主导隐喻是通过众所周知的“文件柜”隐喻来查看大量信息集合,其中每条信息被视为“文件夹”的一部分,用户通过传统的归档方法来定位。但如果信息集合可以以视觉方式显示并以空间方式排列,用户可以有“导航”其中的错觉呢?
-
在一个全尺寸的媒体室内,使用者将拥有某种 360 度的视觉显示——高分辨率视频或全息图像——由计算机生成和存档。
-
描述媒体室的方法之一是“没有界面的计算机”或“全是界面的计算机”
-
如何处理一个看不见的计算机?如果你不必担心如何告诉它该做什么,并且如果它的计算机表现能力大到无需担心,问题就从工具转向任务:“好吧,现在我可以去任何地方,包括不存在的地方,我想去哪里?”布伦达、埃里克和他们的同事想知道人们可能会采用什么新的沟通方式来应对这样的系统。最重要的是,他们想知道使用这样的系统会是什么感觉。
-
布伦达的想法是通过使用演员用来创造想象空间的同样技巧来规划这种未来技术的用途:“即兴创作可以让神奇的事情发生,”她告诉小组,“因为它可以诱使你揭示出前语言的想法。我们每个人带来的,是我们在实时中获得灵感的能力。”
-
最初的即兴创作是热身练习。布伦达的亚历山大图书馆之旅之后,是斯科特参观一个超镜子,它显示了他在红外线下的样子,并实时扫描了他的大脑代谢,以十六种颜色呈现。他在观看自己思维过程的颜色时,也在观看自己思维过程的颜色。
-
团队决定让 Eric 扮演使用系统的角色,而其他人则即兴扮演媒体室的各个组成部分——用户的视觉、移动、听觉、情感、思维的输入。在第一次尝试中,大家都非常投入地进入了自己的角色,以至于 Eric 被一群模仿他、给他建议、做鬼脸的人包围着
-
帮助代理通过说诸如“问她一个地方”或“问他——他知道该找什么”来为用户指引方向。这个想法是创建一种“信息管家”,观察用户和信息系统,记录该个人的偏好、优点和缺点,并积极干预以帮助用户找到或做用户想要找到或做的事情。
-
“认知科学的人在研究人机交互。自然,当讨论的主题是如何教秘书使用文件管理系统时,受雇的黑客们也参与了进来。一次员工会议上的一位程序员通过提问总结了这个问题:‘我们如何让一个秘书理解斜杠-单引号-DEL 会删除一个文件?’这就是他对人机界面的理解——即弄清楚如何让人类适应某个程序员在机器中构建的深奥通信协议。”
-
当涉及到计算机软件时,人类将工件视为工具的习惯可能会成为障碍。好的工具应该从一个人的意识中消失。
-
你不会试图说服锤子去钉钉子——你是用锤子来钉钉子。然而,目前的计算机软件迫使我们学习晦涩难懂的语言,以便与我们的工具对话,而不是直接完成任务。
-
“当工具的隐喻应用于包含人类操作员的更大系统时,它就会成为障碍,”布伦达解释道。即使你的程序员给你一个功能上像工具一样的文件管理系统,人类被迫以一种奇怪的方式行动以使用该工具,这种方式在人类需要执行的动作和工具的功能之间制造了不必要的距离。
-
孩子们不会因为练习手眼协调或其他任何原因而连续几个小时玩电子游戏,他们只是因为玩游戏本身的乐趣。另一方面,没有人因为享受使用程序而使用文字处理程序;他们使用文字处理程序是因为他们想写点东西。在文字处理程序的情况下,结果是最重要的。在电子游戏中,用户/玩家与游戏中表现的世界没有分离。在文字处理程序中,软件的命令语言在用户和任务之间创造了距离。
-
“我们的研究策略之一是找出如何消除让我们保持距离的部分。”布伦达解释道。“我想把手伸过屏幕,做我想做的事情。”
-
“我不想输入一堆命令,“布伦达坚持说。“如果我必须以不同于我平常说话的方式来说,我甚至可能不想说一堆命令。我想要第一人称互动。太好了。但首先我得去掉我和结果之间的所有这些东西。
-
“有哪些隐喻还没有被使用?也许界面就是障碍。我认为这不仅仅是一个技术问题。如果整个界面的概念是基于一个不完整的隐喻,你不能指望通过构建一个更好的界面来解决问题。用一个可能在仔细推敲下会崩溃的艺术隐喻,我喜欢把计算机看作是制造魔法入口的系统。就像《绿野仙踪》中多萝西打开门的那一刻,一切从黑白变成彩色。这就是我想要发生的事情——在感知、认知、情感上。对我来说,入口是一个临时的隐喻。我们需要更丰富的东西。我在寻找能契合并重新解释界面概念的东西。”
-
“我想创造一个我可以走进去的幻想。”
-
在这个我想要漫步的游戏中,我首先要做的就是观察它。也许屏幕上有一些图形。也许屏幕环绕在我周围。也许有一些文字可以阅读,或者有音轨为我朗读。所有这些都是重要的技术方面,但它们并不是我关注的核心。屏幕和扬声器所做的只是建立一个环境。然而,一旦我环顾这个环境,我就想与之互动。
-
在这个我想要漫步的游戏中,我首先要做的就是观察它。也许屏幕上有一些图形。也许屏幕环绕在我周围。也许有一些文字可以阅读,或者有音轨为我朗读。所有这些都是重要的技术方面,但它们并不是我关注的核心。屏幕和扬声器所做的只是建立一个环境。然而,一旦我环顾这个环境,我就想与之互动。
-
“什么样的系统能让我简单地向北移动并捡起那块该死的石头?我不认为这只是让环境栩栩如生的问题。这不仅仅是一个更高级投影仪可以解决的技术问题。这是一个关于世界在构建时如何建立的问题。作者如何建立人与之互动的方式。
-
“也许我可以环顾这个星球,直到找到一个向导。还记得媒体室即兴表演中的‘帮助代理’吗?这种在世界各地走动的描述听起来很像戏剧即兴表演
-
“我认为这就是计算机可以帮助我们的地方,”布伦达坚持道:“我仍然认为一个答案是将剧作家的智慧放入一个第一人称幻想创作系统中。
-
“这必须内置于虚构世界的构建方式中。在所有图形、语音识别和语音合成之上,是一个专家系统,它可以根据戏剧情境的潜力做出明智的决策,使用足够大的知识库来了解可能出现的情境,并有一套规则来筛选知识库。”
-
布伦达描述的假设版本能够从经验中学习——无论是与使用它的个人的经验,还是与所有曾经使用过它的人的经验。布伦达认为,这样的程序可以接近戏剧评论家的分析方式。“也许我们可以把亚里士多德关于优秀戏剧的规则放入系统作为起点。”
-
目前,已经存在一些专家系统可以帮助医生诊断疾病。这些系统能够将从人类医生那里获得的诊断规则应用于一个关于已知症状的大型数据库中。将疾病替换为戏剧,将戏剧元素(如普遍性和因果关系)替换为症状,我们幻想中的自动戏剧专家将能够挑选出玩家行为中最具戏剧性的反应和后果,并将其重新编织回幻想中。这一想法似乎比当今的娱乐软件要超前,就像 Alan Kay 的 Dynabook 比 1960 年代的计算机硬件要超前一样。
-
假设你可以模拟一个中世纪城堡,并让观众以第一人称的视角参与戏剧动作,这样每次你以霍拉旭、哈姆雷特或奥菲莉娅的身份进入哈姆雷特的世界时,你可以对结果做出不同的选择。人工智能研究告诉我们,如果你能以某种方式构建世界的表示,使其特征被表述为朝某些方向发展的倾向,那么你不必在一个巨大的数据库中专门存储所有可能发生的事件。例如,当你捡起一块石头时,你很可能会发现下面有爬行的东西。
-
布伦达描述的体验是在人机界面上的体验——即心灵与机器相遇的地方。界面硬件和软件是计算机人员所称的系统的“前端”。后端是系统所需的智能,以便结果能够极大地令人愉悦。
-
“你使用现有技术根据你的决定使场景分支,但这并不会以戏剧性的方式收敛,除非是最机械的方式。但你可以用相同的世界、相同的角色和相同的元素,加入这种戏剧感,最终得到的东西会更像是亲身体验一场戏剧。
-
“我所描述的这种系统必须能够通过记住我关注过的事物来了解我的需求。系统必须对我有足够好的模型,并记住我过去的行为,以便对我未来可能的行为做出准确的猜测。”
-
“我们可以将这样的系统不仅视为一种互动幻想的媒介,还可以视为一种与非幻想信息的接口。如果这个世界不是行星 X 或莎士比亚的丹麦,而是鲸鱼的世界或化学反应的世界呢?这是一个强大的想法,我们现在可以在当代最好的教育软件中看到它的运作。”
-
参与者在第一人称模拟中伴随而来的乐于暂时放弃怀疑,使其能够感受到拥有更大个人力量的感觉。
-
这样的世界向我们展示了没有我们在日常生活中认为存在的限制是什么样的。当我们看到孩子们通过玩简单的视频游戏学会预测简单轨迹和物体运动规则时,我认为很容易看到使用这些“虚构环境”作为通往信息世界的门的教育潜力,这些信息世界既有用又健康,学习起来也很有趣。
-
“人们想要的不是更多的无聊娱乐,而是能帮助他们心智成长的东西。最大的市场是个人力量的市场,是新的相当于对生物拇指的市场。”
第十三章:知识工程师与认识论企业家
-
“……追求智能机器的发展极为重要,因为人类的思维不仅在存储和处理能力上有限,而且还存在已知的缺陷:它容易被误导、顽固,甚至对真相视而不见,尤其是在被推到极限时。
-
未来的计算机是会成为扩展我们思维能力的工具,还是会演变成一种超越生物智能极限的新型智能物种?本章开头引用的声明的作者 Avron Barr 正在探索人机进化中最具潜力的领域之一——被称为“知识工程”的领域。
-
但对许多人来说,人工智能的概念似乎与增强截然不同,因为人工智能界似乎更感兴趣于替代人类智能,而不是扩展它。
-
他和他的同事们正试图构建能够将知识从专家转移到新手的系统,并利用转移的知识帮助人们对特定问题做出决策。
-
Barr 的专长似乎在于弥合那些将计算机的未来视为“思维工具”与那些将其视为“智能进化的下一步”的人之间的差距
-
为小女孩从数百种可能性中选择合适的抗生素是生死攸关的事情,全科医生和病理学家都不愿意仅凭猜测来决定年轻患者的生命。
-
专家系统与其他类型计算机程序之间的一个重要区别在于,程序不仅仅像计算器提供方程的解那样提供问题的答案。专家系统当然会建议答案,并最终会提供带有对答案“信心”数值的答案。但它们不仅仅如此。专家系统最重要的部分在于程序与使用它的人之间的互动。
-
当今存在的专家系统由三个部分组成——特定任务的知识库、一套用于对这些知识进行决策的规则,以及一个回答人们关于程序推荐理由的问题的手段
-
斯坦福医学院进行的一项实验开始时,将十名患有不同类型传染性脑膜炎的患者的病例提交给 MYCIN。同时,八名医生,包括五名传染病学科的教师专家、一名研究员和一名住院医师,也获得了与 MYCIN 相同的信息。MYCIN 的建议与人类医生的建议(未标明来源)以及患者实际接受的治疗记录一起被发送给八名非斯坦福的专家。外部专家给予 MYCIN 最高的评价。
-
人类化学家知道,构成任何化合物的分子可能的空间排列取决于关于不同原子如何相互结合的一些基本规则
-
基于传统计算机的系统未能提供一种工具来根据光谱数据发现分子结构。问题在于规则允许大量“接近但不完全符合”的可能结构,这些结构几乎符合所有数据,但并不完全匹配。
-
“知识工程”是观察人类专家、构建他们专业知识模型并不断完善模型直到人类专家认可其有效性的一门艺术、工艺和科学。
-
在将知识工程应用于人类医学时,最明显的潜在危险领域是由于误解而导致的误用。尽管构建该系统的人将其视为一个奇妙但完全可能出错的工具,许多人往往仅仅因为建议来自计算机就过于重视其建议。由于医疗建议通常涉及生死攸关的问题,当你试图构建一个向专家提供医疗建议的系统时,必须考虑这种“自动医生”可能带来的心理影响。
-
像所有复杂问题一样,医学知识工程的伦理也有另一面。来自非西方、非工业化或非城市文化的人可能会注意到,专业知识,尤其是医学专业知识,是一种极其稀缺的资源。那些为世界上最大的人道主义问题——流行病和饥荒——而奋斗的少数医学、卫生和农业专家,分布得过于稀疏,工作过于繁重,以至于难以跟上其领域内的科学进步。即使在主要的医学中心,某些重要专业的专业知识也是一种稀缺的商品。
-
尽管许多“现代医学”的装备——如 CAT 扫描仪和其他医学成像技术——昂贵到仅限于少数富裕或保险良好的患者使用,基于软件的系统的每位患者潜在成本却低得离谱,几乎低到足以在不久的将来为数亿重病患者提供帮助。
-
MYCIN 的推理引擎(程序中通过将一般规则应用于科学特定数据来做出决策的部分),被称为 E-MYCIN,被斯坦福大学和太平洋医疗中心的研究人员用于开发 PUFF,这是一种帮助诊断某些肺部疾病的专家系统。一个更为新颖的系统,CADUCEUS(以前称为 INTERNIST),使用人工智能技术来模拟匹兹堡大学医学院的 Jack Meyers 医生的诊断技能。Meyers 和他的合伙人,卡内基梅隆大学训练的人工智能专家 Harry Pople, Jr.,一直在存储 Meyers 的问题解决风格和他关于整个医学领域的知识,以及来自医学文献的大量信息。CADUCEUS 尚未完成,但在处理来自医学期刊的疑难病例时,已经能够表现出色。
-
人们告诉《The Computer Establishment》的作者 Katherine Fishman,他们的目标是提供“一种医生可以使用的工具,以代替去图书馆或咨询专家。即使在主要中心,也没有那么多专家可用。”对 CADUCEUS 表现出兴趣的赞助机构中包括 NASA,他们在载人太空任务中显然需要这样的医疗助手,还有海军,他们可以在核潜艇上使用类似的东西。为宇航员和核潜艇人员设计的特殊设备可能听起来与大多数人的日常生活相去甚远,但在近代历史中,晶体管收音机、手持计算器和许多其他新技术的例子在不到十年的时间里就从 NASA 的神秘领域走到了全世界青少年的胸前口袋中。
-
KAS(知识获取系统)和 TEIRESIAS 帮助知识工程师构建专家系统。
-
GUIDON 是一个教育专家系统,通过纠正技术问题的答案来教授学生。
-
当关于软件是否能够智能行动的争论在数学家称之为“存在性证明”的过程中逐渐平息时,计算机技术是否应该应用于医学、空中交通管制、核电站操作或核武器投送系统等领域的问题才刚刚开始。
-
一些批评者,其中包括人工智能领域的知名人士,一直在对过度依赖专家系统等电子工具进行决策的潜在伦理危险发出警告。Joseph Weizenbaum 担心,过度依赖一种擅长模仿实际上更深层次的人类思维过程的技术存在巨大风险。专家系统是 Weizenbaum 所反对的“工具理性帝国主义”的典型代表——这种思维方式认为所有问题都可以通过计算机使用的分析性、机械性过程来解决。
-
在 1983 年的一次采访中,Weizenbaum 说:“认为可以通过观察一位非常聪明的老师来捕捉这个人的本质到任何显著程度,这简直是荒谬的。我会说,有这种野心的人,认为这会很容易或可能实现的人,简直是被蒙蔽了。”
-
我在人工智能领域的中心地带——一家名为“晚点”的快餐店里遇到了 Avron Barr,这家店位于门洛帕克火车站旁边。如果有技术间谍的窃听目标名单,这家地震仪般的煎饼和芽菜餐馆肯定名列前五
-
编程恰好是他的一项市场技能
-
首先显而易见的一点是,计算机程序与我们在学校学习的大多数东西非常不同,因为程序员几乎从来不会在第一次尝试时就得到正确答案。编程就是调试。因此,犯错并不是必须不惜一切代价避免的事情,而应该被视为找到正确方法的线索。这就是为什么它实际上是一个环境,而不仅仅是一个教学程序。我们试图为教授 BASIC 语言构建一个课程,同时在 BASIC 语言解释器中加入人们在学习软件时似乎需要的指导帮助。
-
他们认为可以在夏末之前完成一本关于 AI 的通用手册。结果花了五年半的时间。
-
蛮力计算与人类知识之间的差异是硬核人工智能研究中缺失的环节(也是圣杯)。
-
个人知识是一个难以描述的事物,因此计算机很难模拟。知识不仅仅是一些事实的集合,被固定在某种理性编码的顺序中。当我们思考时,我们的大脑是如何在不自觉地思考如何去做的情况下完成所有事情的?在信息的海洋中,你如何知道哪些细节值得关注?例如,新手和专家之间的区别不仅仅是关于该专业领域中存储更多事实的数量问题;区别在于能够对该领域的新问题做出判断的能力。
-
人类大脑显然找到了绕过穷尽搜索规则的方法——一种在问题空间搜索中战胜数字的方法。这是一个至关重要的技巧,似乎从一开始就让人工智能程序设计者感到困惑。
-
当像 MYCIN 这样的系统展示出这种软件能够显著增强人类判断力时,机器能力和人类认知才能之间的新兴差异变得更加明显。使用 MYCIN 辅助诊断决策的医生比未使用该程序时更常做出准确的诊断。
-
Papert 在巴尔参加的 1972 年欧洲研讨会上表示:“想想人们是如何理解鸟类飞行的。我们当然观察了鸟类,但主要是为了识别某些现象。对鸟类飞行的真正理解来自于对飞行的理解,而不是对鸟类的理解。“
-
最早的人工航空设计者所面临的最困难障碍,不在于他们发明所遇到的环境障碍,也不在于他们所拥有的材料和技术的性质,而在于他们对飞行可能性和不可能性的观念。莱特兄弟所取得的最重要成就是无可辩驳地证明了一个简单但令人难以置信的想法:飞行不需要拍动翅膀。
-
在世纪之交,航空设计师面临的一个根本问题在于抛弃对事物实际状态的偏见,以便发现可能性。那些想要制造飞行器的人必须放弃对自然界如何进化出飞行动物的执着,以便超越鸟类去理解飞行的本质。同样,人工智能设计的一个根本问题在于能够超越大脑或计算机去理解智能的本质。
-
智力,就像飞行一样,是应对环境的一种方式。智力,同样如飞行,为拥有它的生物或物种提供了生存优势
-
发明者说他对电视的最终用途有一个非常清晰的想法:他设想医学院的学生在手术室的看台上,通过电视屏幕清晰地看到下面正在进行的手术。
-
巴尔意识到,利用专家之间这些自然分歧的关键在于建立一种“记忆经验”的机制,保留旧的决策,即使它们是错误的,并从分歧的结果中创建新规则。如果深入发展,这一系统的方面直接引向人工智能研究中最热门的问题之一——程序是否能够从经验中学习的问题。巴尔只对这个问题的一个特定方面感兴趣——创建一种跟踪决策并记录人类专家之间意见分歧的可能性。
-
而符号与世界有认知关系。我们需要这些中介信息来在我们的内部表征之间共享对世界的看法。
-
由 Alan Kay 和 Brenda Laurel 等人工作所体现的那种互动的、第一人称的幻想放大器
第十四章:Xanadu、网络文化及其未来
-
“如果这听起来很疯狂,那就说明你理解了”
-
比尔·盖茨和保罗·艾伦在为 Altair 编写 BASIC 版本时分别只有十九岁和二十二岁。他们前往新墨西哥州与 MITS 合作,为首批业余爱好者计算机开发软件。从一开始就很明显,很多人都想拥有自己的计算机
-
像许多其他计算机天才一样,Ted Nelson 在第一次意识到学校试图对他做什么时,开始了他那常常孤独且始终独特的智力旅程。“我一生都讨厌学校,”他声称,“从一年级到高中,每时每刻都毫不留情。我从未见过有人像我这样讨厌学校,尽管我认为其他辍学者也是如此。”
-
他们都希望能够以新的方式引导自己的思维路径。特别是泰德,他渴望拥有改变主意的特权。他希望能够自由地插入和删除文字,移动段落,但他也希望计算机能够记住他的决策路径。其中一个规格是他称之为“历史回溯”的功能,计算机可以快速显示他不断变化的文本的各种早期替代版本。
-
我们为什么要放弃任何想法呢?为什么不把所有事物的每个变体都存储起来,让计算机在我们想查看时负责筛选呢?
-
最初的基本笔记记录方案旨在建立一个系统来处理所有的回溯。下一步是扩展这一功能,以处理不同版本,并向用户显示不同版本中哪些部分相同,哪些不同。这种版本控制功能
-
Engelbart 认为他和 Nelson 只是在差不多同一时间偶然想出了类似的东西,尽管 Engelbart 拥有技术和能力来实际运行这样的系统。整个想法最初是一种计算机动态化的脚注——一种从文本的一部分跳转到当前文档主体之外的内容的方法。
-
用户不再需要看到星号后翻到页面底部查找脚注,或者可能需要在图书馆的其他地方查找另一份文件以验证参考文献,而是可以用光笔或鼠标指向电子版的星号,自动将附加或引用的材料显示在屏幕上。返回按钮可以让用户回到原文中链接符号出现的地方。道格·恩格尔巴特的早期 NLS 系统中就内置了一个非常相似的功能。
-
恩格尔巴特更关心的是构建解决问题的工具包和工作坊,而不是去猜测这种设施可能创造出什么样的文学形式。
-
他想知道可能会出现什么样的艺术形式和知识体系。从最简单的本质上来说,链接是一个提醒,表示“这里有东西可以跳转到”。链接意味着文学不再需要是顺序的。
-
Nelson 从一开始就坚持认为,链接功能提供的远不止是附加零碎信息的手段。一个具备回溯、版本控制和链接的系统将创造一种将思想组织成文字的新方式,这是一种在计算机出现之前从未可能实现的非线性写作形式,他称之为超文本(hypertext)。
-
实验通常是为了验证基于先前实验的假设而进行的。当科学家面临新的研究问题时,首先要做的就是“文献检索”。
-
这些链接的功能就像脚注,但可以立即访问被引用的材料,就好像每个脚注都是进入被引用文献的窗口或门一样。
-
一个具有链接、回溯和版本控制的系统只需一个经济结构就能成为一个出版系统。Nelson 基于他对版税和次级版税的构想,设想了一个无政府但自组织的系统。在一个类似 Xanadu 的系统中,版税由主机计算机网络自动监控,主要基于传输时间——即人们在线关注某个文档的时间长短。系统中的每个文档都有一个所有者,每当有人从内存中调用他们的文档并以文字、声音或图像形式显示时,每个所有者都会获得“一丝版税”。
-
每个人都可以创作他们想要的文本并将其放到系统上,从十四行诗到小册子再到教科书,每个人都可以引用或引述任何其他文档。文档可以由链接组成。汇编、导览、目录和索引将作为独立文档涌现;秩序将成为一种宝贵的商品。Nelson 声称:“结果是一个看似无政府状态的文档池,没错,但这本来就是文学的本质……它的有序性并不是由计算机或其管理员强加的,而是很久以前在文学的自然结构中产生的东西,我们只是保留了它。”正如文学评论家和图书管理员找到了组织和分类传统文学中看似混乱的流的方法,Nelson 声称人们将自发地发明方法来组织基于超文本的文学体。
-
尼尔森认为他对技术的最终关注是政治性的。大多数革命者将计算机视为极权主义压迫的工具,是集中权力和非人性化的象征,而尼尔森早就知道这些想法是基于一种过时的计算机。分布式网络中每台计算机都具有强大的个人能力,这与一个中央计算机加上许多扩展完全不同,尼尔森是最早指出这种技术潜力的人之一,这种潜力可以创造由个体成员引导的社会形式,而这些成员不受任何老式大型机型中央控制的指挥。他对能够随时获取可用信息形式所带来的个人力量感到兴奋——就像老黑客的苹果那样——并热衷于维护以自己的方式探索信息的自由:
-
一个包罗万象的图画书百科全书,喧嚣的涂鸦之地,完整的作品。
-
如果这一切听起来像是个疯狂的想法,那就说明你理解了。这是一个充满可能性的疯狂时代。在这个口袋计算器、避孕药、火箭氢弹和卫星肥皂剧的时代,我们可以尝试在我们的社会中创造任何我们想要的疯狂。
-
……我说这些世界很快就会成为可能。我们需要它们,而且它们将带来丰厚的利润。软件正在开发中。但真正缺乏的是那些能够看到可能性并帮助将这些想法变为现实的有远见的艺术家、作家、出版商和投资者。
-
在线互动社区正在全球范围内发展,这完全是通过拥有调制解调器的青少年、携带公文包电信电脑的商务旅行者、信息公用事业、计算机公告板系统以及各种形式的电信社区的自愿努力实现的。
-
通信技术与计算机技术的交汇将创造出一种具有巨大可能性的新型通信媒介。但他指出,向我们展示这些可能性的艺术可能属于另一类思维者,他们的动机和技能与发明这些技术的人不同。在古腾堡之后出现了塞万提斯。在活字印刷术之后出现了小说。正如艾伦·凯所指出的,文学是那个时代的软件。超文本的塞万提斯可能正在学习阅读。
-
他是一个典型的特立独行的天才,总是以不同的视角看待事物,并且像其他年轻、独立思考者一样,喜欢追随一个想法直到它的终点。
-
有一个简单称为“消息”的功能。任何接入系统的人都可以在一种计算机化的黑板上给其他人留言。就像黑板一样,你可以稍后查看你的消息,看看是否有人附加了备注。备注增长得如此之快,以至于人们开始开发程序来筛选这些备注。
-
两个系统早期出现的一个独特功能是能够与特定受众进行通信,即使你不知道受众是谁。例如,如果你向主机计算机指示希望将所有关于 AI 研究、民间舞蹈和 Spacewar 主题的未来消息发送到你的电子邮箱,那么任何有这些主题消息的人都可以在不知道你是谁的情况下联系到你。
-
从 ARPAnet 上活跃的电子邮件流量来看,一种新的对话形式显然正在进行。在技术层面,这些系统的用户能够共享计算机资源和研究成果,正如预期的那样。但事实证明,每当人们接触到计算机网络时,他们似乎都想用它来彼此交流。
-
他(Turoff)在 1976 年指出。“计算机作为一种设备,允许人类群体展现集体智能是一个相当新的概念。原则上,一个成功的群体将展现出比任何成员都高的智能。在接下来的几十年中,设计出允许群体用一个集体大脑来处理特定复杂问题的计算机化会议结构的尝试,可能会比迄今为止所有的人工智能工作为人类带来更多的益处。”
-
每当互动计算有新发展时,似乎都会发生这种情况——人们就是不愿停止对系统的实验,也不愿在实验结束后放弃实验工具。正如 Jim Fadiman 对 ARC 的观察,人们似乎对去增强的抵触程度与他们最初对增强的抵触程度一样。
-
使用所有通信功能的协议,如 Engelbart 的 NLS 系统,并不容易学习。需要对学习的价值有一定的承诺,这也是为什么研究社区是理想的实验室之一的原因。
-
他们认为,开发更易于使用的全民远程会议网络是一种减少人们思想和思维之间距离的方法,是一个进行智力交流和群体决策的论坛,是一种新型社区的模型,在这种社区中,一个人的年龄、性别、种族或外貌将不再像一个人所说的那样重要。
-
对于那些能够支付 100 美元入会费,以及每小时 7 到 22 美元连接费的人来说,The Source 及其较新的竞争对手 Compuserve 为计算机拥有者提供了进入一个正在形成的电子社区的机会。除了远程计算、电子邮件、通信、电话营销、软件交换、游戏、新闻收集、公告板和其他服务外,The Source 还提供一种称为“用户出版”的服务。
-
对于创意作家来说,这个挑战很有吸引力——只要你能让观众持续阅读,版税就会超过存储费用。艺术家现在可以成为出版商,直接面向观众。
-
所有订阅者都可以自费阅读他的言论
-
我采样的另一本电子杂志是 Floyd Flanagan 的《Mylar’s Warp》,一本电子连载,完全是虚构的。这个想法与任何连载背后的想法相同——作者必须保持有趣才能吸引读者的注意力。
-
计算机公告板系统,通常称为 CBBS,或简称为 BBS
-
要连接到 BBS,您需要一台个人电脑、一个调制解调器、电信软件和一部电话。将电话插入调制解调器,使用通信程序拨打 BBS 号码,然后当计算机连接后,主机系统会在您的屏幕上显示文字,并告诉您如何操作系统。
-
在我对 BBS 世界有限的抽样调查中,在几个月的时间里,我遇到了青少年哲学家、各个年龄和性别的自制讲师,他们愿意漫谈任何你想讨论的话题,我甚至偶然发现了几个在线宗教,包括控制论和异教。
-
虽然有些论坛专门为黑客、电脑爱好者、科幻迷、性狂热者或和平主义者而设,但 Sunrise 似乎更像是一个电子杂货店与公共厕所墙壁的结合体。
-
他们的电脑为任何想要加入的人提供了一个信息中介系统。Clyde Ghost Monster 是一个无政府主义的系统操作员,偏爱机智的规则。几周后我才知道,Clyde Ghost Monster 其实是一个十六岁的女孩。Tater Tot 是一个十七岁的男孩,就读于她的高中。他们不知道 Ivan Idea 是谁。
-
这个运动以“实践”为中心——你可以在日常生活中使用的行动,以建立有效的人际关系、社区的力量和自我意识。所有的实践都基于行动。没有任何需要特殊设备、环境、领导者、理论或社会地位的要求。普通的、日常的时刻和个人关系构成了这项训练的基础。
-
ORIGINS 没有领导者,没有官方存在,也没有任何东西出售。因为它始于一个开放的计算机会议,没有人知道所有创始者是谁。
-
希望是建立一些可以让世界变得更美好的东西。第一步是让自己的生活变得更好。
-
由于计算机程序可以像文字或数字一样轻松地通过电话线传输,一些论坛从事软件盗版活动——在未支付许可费用的情况下传播专有软件。
-
过去文化创新的形式可以帮助我们尝试预测未来——但过去的形式只能给我们一瞥,而不是未来的详细图景。
-
一旦某事看起来像是预测未来生活方式的好模型,意外就会发生。如果说有什么教训的话,那就是我们应该习惯于期待意外。
-
古腾堡是否考虑过公共图书馆的影响?
-
特别是 Joseph Weizenbaum,他表达了对将计算机误认为人类大脑或将人类视为机器的危险的担忧。
-
目前它们在更复杂的智力成就上能做的很少。即便如此,它们正在接管我们文明的管理。在我们开始将更多决策责任交给机器之前,Weizenbaum警告说,认为所有人类问题和人类生活的所有重要方面都是可计算的,这是一个严重的错误。
-
如果人类大脑最初可能是标准人科模型的投石变体,那么它也证明了能够创造《山上宝训》、《蒙娜丽莎》和《赋格的艺术》。如果个人计算机最初是作为弹道计算的辅助工具,那么配备低成本、高性能计算机并能访问自组织分布式网络的人群手中,也拥有了一种对抗任何集中组织的技术暴政的潜在强大防御手段。
-
当毛毛虫用丝线将自己包裹起来后,其体内开始发生非凡的变化。某些被生物学家称为“成像细胞”的细胞开始表现得与普通的毛毛虫细胞非常不同。很快,这些异常的细胞开始影响其周围的细胞。成像细胞开始在正在转变的蛹体内生长成群落。然后,随着毛毛虫细胞开始解体,这些新的群落连接起来,形成蝴蝶身体的结构。
-
信息航行者的飞行并不是由先驱者开始的旅程的终点,而是所有软件奥德赛中最具戏剧性的开端。我们需要决定计算机是成为我们的主人、仆人,还是伙伴。
-
我们需要决定人类的定义,以及它与机器的确切区别,以及哪些任务应该或不应该交给这两种符号处理系统中的任何一种。然而,有些决定必须尽快做出,因为技术仍然处于初期阶段。而且,这些决定必须由尽可能多的公民共同参与,而不仅仅是专家。从这个意义上说,二十一世纪我们是否能迎来一个人道、可持续的世界,最重要的因素将是我们如何处理这些由少数人构思、而将由多数人使用的机器
文章作者 种瓜
上次更新 2025-09-04