新闻资讯

基辛格生前最后一本书:人类要如何与人工智能共存?

【编者按】“如果被迫与机器妥协,我们的底线是什么?”外交家亨利·基辛格在其生前最后一本书《人工智能时代与人类价值》中,与两位合作者——谷歌前CEO埃里克·施密特及微软前首席研究和战略官克雷格·蒙迪,从高度战略性的角度对这一问题进行了审视。他们预见,随着时间推移,人工智能“将对历史、宇宙、人类本质以及智能机器的本质得出结论,并在这一过程中形成初步的自我意识”,进而变成“类人人工智能”。如何与之共存?两个“对齐问题”需要解决:一是人类价值观和意图与人工智能行动在技术层面的对齐,二是人与人之间在外交层面的对齐。本文摘自该书第八章第二小节《共存:类人人工智能》,已获出版社授权。

迈达斯国王——历史上小亚细亚王国的君主——曾许下一个著名的愿望,希望他所接触的一切都能变成黄金。希腊的酒神和享乐之神狄俄尼索斯满足了迈达斯的这个愿望,尽管他知道这个愿望并不会带来什么好事。不久,由于触碰到的佳肴和美酒都变成金子无法享用,迈达斯被迫在帕克托洛斯河中洗手,以摆脱他那被诅咒的手指。

在由迪士尼重述的叙利亚故事《阿拉丁》中,一个童工和一个有权有势的阿格拉巴王朝国师争夺对一盏神灯中无所不能的精灵的控制权。每个人都努力引导精灵实现自己的愿望。国师的最后一个愿望是让自己变得和精灵一样强大,但他没有意识到,拥有如此强大的力量意味着他也将被囚禁在神灯里,服侍其他人类主人,直到获得自由的那一天。

这两个故事都讲述了解封和运用一种我们凡人所无法理解或掌控的力量有多么困难。这场古老斗争在现代的寓意是,很难让人工智能与人类的价值观相一致,也很难让人类的期望与现实相一致。我们应该假定,人工智能会让我们大吃一惊,并且随着智能体或“规划型”人工智能的发展,它们在动态世界和数字世界中让我们为之惊讶的能力也会提升。如前文所述,未来几代人工智能将能够感知现实;它们可能不仅具有自我意识,还拥有自我利益。一个自利的人工智能可能会认为自己在与人类竞争一些东西,比如数字资源。在“递归自我完善”的过程中,一些人工智能可能会发展出设置自身目标函数的能力。人工智能可以操纵和颠覆人类,挫败我们限制其力量的任何尝试。人工智能已经能够欺骗人类,以实现自己的目标。

如今,我们几乎没有独立能力来验证人工智能模型的内部运作,更不用说它们的意图了。如果智能机器仍然像埃利泽·尤德科夫斯基所说的那样,是“巨大而不可捉摸的小数阵列”,那么随着它们变得越来越强大,我们也无法指望它们对我们来说是安全的。因此,最重要的是,我们在学会如何解读智能机器的同时,也要学会如何确保它们对我们安全,这两项使命要双管齐下。

鉴于人工智能目前展现的令人惊讶的能力,我们将如何设法未雨绸缪,而不仅仅是在人工智能的风险来临时兵来将挡?我们需要怎样的远见和效率预见未来发展的全部倾向和一系列可能采取的行动?要知道这不仅关乎我们自己的物种,还事关一个全新物种。我们不能在只有一次试验机会且容错率为零的情况下奉行试错策略。

要让人工智能不那么引人惊骇,加强人们对它的体验、参与和互动也许是无可替代的办法。早期的人工智能开发者曾担心过早地将人工智能暴露在世人面前,而最近的开发者则一直在释放早期模型,允许更多的公众尽可能快速、安全地对其进行试验。工程团队目前正在研究和微调不同的模型,并调整控制系统,而人工智能与全球范围内人口的互动也暴露出了新的担忧。

对人工智能的早期社会化可以通过对其进一步的教育来降低出现问题行为的风险,同时在人类之中,也可以提高对此的意识水平、应对力,并培养一种健康的怀疑精神。每天数以百万计的人机互动有助于测试人工智能可能遇到的最不可能的情况;反过来,公众对人工智能系统的使用,在发现新错误和新风险的同时,也可能有助于加快技术协调一致化的进度。因此,将这些远非完美的人工智能放任于世间,不仅有助于我们适应它们,更重要的是,它们的出现使得我们能够提出更完善的理论,以使它们适应我们。

不过,广泛部署和公开发布可能还不足以揭示与解决当今人工智能的所有风险,更不用说未来的风险了。

但值得庆幸的是,目前人们正在进行大量尝试,以创建一个集成的控制架构,并将其通过预训练注入最强大的人工智能,从而积极引导机器实现合法、无害和有益的用途。

迄今为止,实现这种人工智能与人类协调一致的 *** 大致分为两类:基于规则的系统和从人类反馈中“强化学习”。下面让我们逐一介绍。

基于规则的系统类似于预先编程的指令,是程序员管理人工智能行为的一种尝试。虽然这种 *** 对于简单的任务来说直截了当,但在复杂的场景中却经常会出现问题,因为系统无法进行实时适应。而强化学习就其本身而言则更适合复杂系统,它允许人工智能从与人类评估者的交互中学习,并灵活地适应特定环境。

当然,这种 *** 也有它的缺陷。为了指导学习,需要精心设计“奖励函数”;任何失误,无论是由于目光短浅、不可预见的情况,还是由于人工智能聪明过人,都可能导致“奖励黑客”的情况,即人工智能在解释模棱两可的指令时,虽在技术上取得了高分,却没有达到人类的实际期望。

今天的人工智能系统被灌输了各种类型的信息,却没有直接体验现实世界,而是通过由数万亿个概率判断组合而成的现实模型来观察这个世界。对它们来说,在这个宇宙中,从一开始就没有“规则”,也没有任何 *** 来区分科学事实和未经证实的观察。对人工智能来说,一切——甚至是物理定律——都仅仅存在于相对真理的范围之内。

不过,现在人工智能领域已经开始努力纳入人类规则和实例化事实。现在,人工智能模型已经有了一些成熟的机制,通过这些机制,这些模型可以吸收某些实在性的“基本真实”常量,将其标记为最终常量,并将其映射到自己的嵌入空间中。此外,这些信息还可以很容易地进行全局更新。通过这种 *** ,人工智能模型就能将两个部分——更广泛的概率判断和更狭义的事实真相评估——融合在一起,从而做出合理准确的反应。

但这项任务还远远没有结束,问题仍层出不穷。比如,我们人类该如何为人工智能区分真理的必要属性,并在此过程中为我们自己也做一番区分?毕竟,在人工智能时代,即使是基本原理也会不断被修正和失效。然而,恰恰是这一点,为我们提供了纠正先前错误并开辟新天地的机会。我们知道,我们对现实的概念也可能发生变化,因此,我们不应该把人工智能禁锢在可能错误的“真理”中,这样会阻碍它们重新考虑自己的终极“真理”。

不过,这已是很久之后的事情了。目前,人工智能仍然需要一棵初级的确定的知识树,这些知识代表人类迄今为止推断出的“真理”。让我们的机器拥有这些知识,将使我们能够可靠地强化它们的世界观。特别是,如果我们现在可以根据宇宙法则来调整早期的人工智能系统,那么我们也有可能参照人类天性的法则来依葫芦画瓢。既然我们可以确保人工智能模型以我们所理解的物理定律为出发点,同样,我们也应该防止人工智能模型违反任何人类政体的法律。

在一个人工智能的“法典”中,可能存在不同治理级别的层次:地方、地区、州、联邦、国际。法律先例、法理、学术评论——或许还有其他不太偏重法律的著作——可以同时被人工智能纳入考量。与基于规则的一致化系统一样,预定义的法律和行为准则可以成为有用的约束,尽管它们往往也不那么灵活,设计时考虑的范围也不如实际的人类行为不可避免地要求的那样广泛。

幸运的是,新技术正在接受考验,我们感到乐观的原因之一,在于一些非常新颖,同时又非常古老的事物的存在。

有种东西比任何通过惩罚强制执行的规则更有力、更一致,那便是我们更基本、更本能、更普遍的人类理解。法国社会学家皮埃尔·布迪厄将这些基础称为“共识”(doxa,古希腊语,意为普遍接受的信仰):这是规范、制度、激励机制和奖惩机制的重叠 *** ,当它们结合在一起时,就会潜移默化地教导人们如何区分善与恶、对与错。共识构成了人类真理的准则,它是人类的典型特征,但没有人工制品对其加以固化呈现。它只是在人类生活中被观察到,并被纳入生活本身。虽然其中一些真理可能是某些社会或文化所特有的,但不同社会在这一方面的重叠性也是很大的;数十亿计的人类,来自不同的文化,有着不同的兴趣爱好,他们作为一个普遍稳定且高度互联的系统而存在。

在书面规则无法平息混乱的情况下,未加定义的文化基础却可以做到,这一观点构成了人工智能领域一些最新 *** 的基石。“共识”的法典无法表述,更无法翻译成机器可以理解的格式。必须教会机器自己完成这项工作——迫使它们从观察中建立起对人类做什么和不做什么的原生理解,吸收它们所看到的一切,并相应地更新它们的内部治理。

在这一灌输“共识”的技术过程中,我们不需要,甚至不希望就人类道德和文化的正确表述达成先验一致。如果大语言模型能够以未经整理的方式吸收整个互联网的内容,并从中找出尽可能多的意义(正如它们已经做到的那样),那么机器——尤其是那些已经发展出接地性(也就是反映人类现实的输入与大语言模型输出之间的可靠关系)和因果推理能力的机器——在吸收连我们自己都一直难以明确表达的内容时,或许也能达到同样的效果。

当然,机器的训练不应只包括“共识”。相反,人工智能可能会吸收一整套层层递进的金字塔级联规则:从国际协议到国家法律,再到地 *** 律和社区规范等。在任何特定情况下,人工智能都会参考其层级中的每一层,从人类定义的抽象戒律转化到人工智能为自己创造的,对世界信息的具体却无定形的认知。只有当人工智能穷尽了整个程序,却找不到任何一层法律能充分适用于指导、支持或禁止某种行为时,它才会参考自己从观察到的人类行为的早期互动和模仿中得出的结论。这样,即使在不存在成文法律或规范的情况下,它也能按照人类的价值观行事。

几乎可以肯定的是,要建立并确保这套规则和价值观的实施,我们必须依靠人工智能本身。迄今为止,人类还无法全面阐述和商定我们自己的规则。而且,面对人工智能系统很快便有能力做出的数以十亿计的内部和外部判断,没有任何一个人或一组人能够达到对此加以监督所需的规模和速度。

最终的协调机制必须在几个方面做到尽善尽美。首先,这些保障措施不能被移除或以其他方式规避。其次,在控制上必须允许适用规则的可变性,这种可变性基于环境、地理位置和用户的个人情况而定,例如,一套特定的社会或宗教习俗和规范。控制系统必须足够强大,能够实时处理大量的问题和应用;也要足够全面,能够在全球范围内,在各种可以想见的情况下,以权威且可接受的方式进行处理;并且足够灵活,能够随着时间的推移进行学习、再学习和调整。最后,对于机器的不良行为,无论是由于意外失误、意想不到的系统交互,还是有意滥用,都不仅要禁止,而且要完全防患于未然。无论何种事后惩罚都只会是为时晚矣。

作者:亨利·基辛格(Henry Kissinger)  埃里克·施密特(Eric Schmidt) 
克雷格·蒙迪(Craig Mundie)
译者:胡利平 风君
出版品牌:中信出版·方舟工作室

(文章仅代表作者观点。)

  • 视觉周刊|《信心从何而来》一线经济微调研启动
  • 三大悖论让特朗普经济新政反噬美国
  • 周二热门中概股多数上涨 台积电涨2.48%,阿里巴巴涨5.25%
  • 九大年度文旅出圈热点,开辟旅行新玩法
  • 外国人购物退税“即买即退”在全国推行一周,谁吃到了红利?
  • 东北三省,十年少了一个“哈尔滨”
  • 从高铁到住房:“富足议程”能否拯救美国的进步主义?
  • 万元单价失守,产能空置三成,LED显示龙头艾比森增长失速
  • 吉贝尔:核心产品持续放量 加码新药研发构建长期竞争力
  • 金科股份:持有的金科服务5468万股将进行第二次拍卖
  • 叶国富:永辉今年的核心是减亏,明年全面完成调改
  • 滕泰:尽快推出万亿元级别的消费繁荣计划,把选择权交给消费者和市场
  • 上海徐汇探索AI赋能城市治理,面向全球招募量子城市解决方案
  • 德国国债扩大涨幅 2年期国债收益率跌至2022年以来最低
  • 【讲习所·中国与世界】习近平:构建中越命运共同体具有重要世界意义
  • 七国集团央行将对美国关税乱象做出初步回应
  • 海拔四百公里的救赎
  • 《莫扎特!》《大状王》等多部作品首次赴京演出
  • 隔夜要闻:美股收跌 分析师狠砍苹果目标价 哈佛大学起诉特朗普政府 美一客机在机场发动机起火
  • 候补天数越长成功率越低?临发车会放票?12306客服回应
  • 支持企业保持战略定力、坚定发展信心、增强战略敏捷!陈吉宁龚正走访调研外贸外资企业
  • 消息称特朗普任命的负责监督解散美国国际开发署的官员已离职
  • 十大机构看后市:大冲击下新格局 A股短期的“筹码底”已经见到 大门敞开、奉陪到底
  • 郑州银行行长李红:2024年高管薪酬总额压降超10% 同时将调整出来的薪酬资源配置到基层员工
  • 西班牙首相提醒:关税是暂停90天,不是取消
  • 5连跌,再创新低!多晶硅市场怎么了?
  • 伊朗外长:伊美第三轮会谈将于26日在阿曼举行
  • 河南项城工厂爆炸事故通报:共致6死3伤,存在转包非法生产情况
  • 分析师:欧元或续涨 资金轮动助推欧元区收支数据受关注
  • 一语道粕:供应压力VS成本支撑 市场呈现近弱远强格局
  • 高位跳水!“黄金巨震”冲上热搜第一
  • “世界那么大,我想去看看”十年后,辞职女教师后悔了吗?
  • 澳大利亚人对美国信任度降至20年低点 但澳总理称信任特朗普
  • 券商一季度ETF格局落定:海通证券做市业务清零,其他三大指标排名或有变动
  • 手机租赁“陷阱”:低价租换来高价买、租机贷变高利贷
  • 家长抵制黑童话,童书应该绝对“安全”吗?|世界儿童图书日专访
  • 以军空袭加沙城医院和学校
  • 无锡访古行纪:名邑之冠、工贸重镇与孝义之乡
  • 张又侠董军分别与印尼国防部长会见会谈
  • 猪价近期超预期上涨,分析师称或难改后期下跌趋势
  • 福耀玻璃去年业绩再创新高,拟增资4亿美元扩建在美产能
  • 山西“订婚强奸案”审判长答问
  • 【盘前三分钟】4月17日ETF早知道
  • 1男2女将举办3人婚礼,酒店:取消
  • 在高水平开放中共享发展机遇(和音)
  • 新沣集团获主席兼首席执行官郑盾尼增持150万股 每股作价0.84港元
  • 年收入创三年新高后,阅文增长更依赖影视爆款
  • 酒后冲动杀人终落网,内蒙古警方破获30年前命案
  • 津上机床中国发盈喜 预期年度股东应占溢利约7.82亿元同比增加约60%
  • 上海:去年民营经济贡献了3/4的新增就业,将助力民企国际化发展
  • 受极端大风天气影响,多地航班取消、高速限行
  • 美股早盘升势强劲 华尔街恢复脆弱的平静
  • 加密货币相关股票攀升 因比特币延续涨势
  • 上海专家首创用人工智能模型预测乳腺癌新药疗效
  • 解码“幸福密钥”:“旅游+”的跨界共融
  • 诺斯罗普格鲁曼一季度利润腰斩股价暴跌 B-21成本超支拖累业绩
  • 丘钛科技委任德勤为新核数师
  • 董宇辉回应直播间不卖黄金:价格波动大,且难保证质量
  • 白宫新闻秘书:美政府将在法庭上回应哈佛大学诉讼
  • 我在迪拜做科创
  • 再不买周大福,可能就要买不起了
  • 字节跳动2024企业社会责任报告:抖音电商累计销售农特产品71亿单
  • 对话|棋后居文君:创造历史之后,还有继续追梦的心
  • 综述|美关税政策拖累增长前景欧洲央行宣布再度降息
  • 探访原阳“最牛高速服务区”:登记后享20项免费服务,已十多年
  • 特朗普政府内政部长为其部门削减开支辩护
  • 万人说新疆|“人文之光”
  • 直击杭州银行业绩会:正积极寻求大股东可转债转股等方面支持
  • 征关税就不要在议会讲话,英国议员计划阻止特朗普演讲
  • 白宫防爆门图与万人共享、防长向亲友泄密,美国政府再曝漏洞
  • 阿斯麦、超威半导体、英伟达、台积电集体大跌!发生了什么?
  • 年收入创三年新高后,阅文增长更依赖影视爆款
  • 贝莱德在关税暂缓后看好美股 仍回避长期美债
  • 4月17日美股成交额前20:联合健康大砍财测,股价重挫22%
  • 沃尔沃卡车第一季度营业利润低于预期
  • 时隔半月,成都土拍楼面成交价再创纪录,首破4万元/平方米
  • 观察|如何推动再保险交易规模上量增加话语权,行业在临港新片区共倡议
  • 2024年全球AI投资猛增至1100亿美元,中国表现突出居第二
  • 被控15年受贿3.43亿,西藏自治区原党委书记吴英杰当庭认罪悔罪
  • “中概股回流”推演,机遇还是挑战?!港股市场如何“来得了、接得住、发展得好”
  • 一语道粕:供应压力VS成本支撑 市场呈现近弱远强格局
  • 武契奇称“颜色革命”已结束,外国势力攻击不会得逞
  • 日本方面排除将美债作为谈判筹码的可能性
  • 澳门世界杯“中日对决”,蒯曼击败伊藤美诚晋级女单决赛
  • 德国美妆企业拜尔斯道夫“跑”出上海速度
  • 纽约联储行长Williams:美国经济增长或放缓 通胀料升温
  • 收评:烧碱、SC原油涨超2% 焦煤、菜粕跌超2%
  • “棉花糖爸爸”陈生梨:女儿将落户到贵州纳雍
  • 三河“广告牌禁色风波”曾在廊坊固安县上演
  • 收单外包备案名单更新 242家机构通过备案
  • 华安基金金拓:AI应用迎产业化元年 深挖应用端机会
  • “体制内”出身的张亚东辞任绿城掌门人
  • 邦达亚洲:英国经济数据表现强劲 英镑冲击1.3100关口
  • 同比增长5.4% 一季度中国经济开局良好
  • 恒安集团创始人许连捷逝世
  • 消息人士:墨西哥政府已停止通过公路向该国进口美国燃料 以打击非法交易
  • 高盛:予中国联通“买入”评级 目标价10.0港元
  • 成都艾滋病患者已达十万?公安部网安局再公布10起网络谣言案
  • 全美首例,加州起诉特朗普政府滥用关税政策“违法”
  • 我爱我家发布2024年财报,全年营收同比增长3.7%
  • 昨夜今晨国际外盘头条一览_2025年4月16日_财经新闻
  • 芒果TV下调新会员权益,同时使用设备数由2台降为1台
  • 视频丨远东控股蒋锡培:女人每顺产一个孩子,寿命至少增加10年
  • 危机情境下,人类的优势思考模式
  • 关键词: