大模型与智能社会:基于历史唯物主义的探察(1)
肖峰:大模型与智能社会:基于历史唯物主义的探察(1)
摘 要:大模型具有“大智能”“大应用”“大参与”的技术特征及功能效应,或成为智能社会来临的重要标志。基于历史唯物主义的技术—社会观、生产力观、生产方式观、社会有机体论和技术社会形态论,可以透视大模型可能带来的智能生产力、智能生产工具、“以言行事”的生产方式和智能文明新形态,以及由这些变革所联动会聚而成的总体效应:智能社会来临并由此对历史进程产生重大影响。而在这种历史唯物主义分析框架下的透彻把握中,历史唯物主义自身也将得到丰富和发展。
目前,以GPT为代表的大模型被普遍视为人工智能发展的重要技术突破,开启了人工智能新的发展阶段,并在全球范围内引发了新的技术浪潮和产业革命,其社会意义备受关注。其中,大模型的短期意义(如在知识生产领域中的降本增效)备受重视,但长期价值(如对社会形态演变的深远影响)尚未充分挖掘,尤其是与智能社会的关系尚未充分揭示,所以大模型的社会意义有待深究。
随着人工智能对社会的影响日益广泛和深入,人类从工业社会转入智能社会成为一个重要议题。直到今天,我们也不能说这一转变已经完成。而以GPT为代表的大模型的出现,对这一转变带来了强劲的推动,尤其是对社会的智能化产生了重要影响——广泛应用于各领域从而在整体上对社会带来改变,以至于被视为“人工智能引发的第一次重大社会实验”,甚至“将在塑造人类命运方面发挥重要作用”。大模型的技术特征和应用潜能,有可能将人类带入智能社会,由此具有巨大的社会意义。因此,不能仅将大模型作为知识生产工具来看待,而要将它纳入以社会整体为研究对象的历史唯物主义视野,以充分而深入地揭示它对社会的全面影响和深远价值。
一、“大智能”“大应用”“大参与”
马克思恩格斯在创立历史唯物主义时十分重视技术在社会中的作用,他们“曾多次阐明了技术对社会历史发展有决定性意义的观点”,由此形成“技术—社会观”主张:技术是人类生存的必要条件,是人类进行社会生产所必不可少的生产资料,尤其是在生产资料中充当生产工具,而工具形态的技术决定着社会的性质和面貌。技术发展必然造成社会的变化,这是因为作为工具的技术能够应用于生产过程、渗透在生产力诸基本要素之中而转化为实际生产力,所以技术作为生产工具的进步可以直接促进生产力的发展,而生产力的发展则会带来社会的全面变化,甚至带来社会形态的更替,这就是社会的巨变或划时代的革命。所以,技术是历史的火车头,是推动社会变革的关键力量,如历史上曾经发生的“手推磨产生的是封建主的社会,蒸汽磨产生的是工业资本家的社会”,换句话说,“每个历史时期里具有策略决定性的技术,相当程度地塑造了社会的命运”。这就是历史进程中的技术—社会逻辑。反过来,能够带来社会巨变甚至改写历史的技术,必然且必须是历史唯物主义关注和阐释的对象。可以说,当前的大模型就有成为这样一种技术的潜力——它有可能将智能社会带入现实。
智能社会是社会的智能化,即人工智能在社会中得到充分而普遍的应用,因此,智能社会是由人工智能来定义的。尽管如此,并非人工智能一问世或取得了初步的发展,就意味着人类进入了智能社会。“人工智能”概念被首次提出的1956年通常被视为“人工智能元年”,当时作为人工智能最初形态的符号人工智能(Symbolic AI)和感知器模型也已出现,但并不能说人类在当时就进入了智能社会。正如蒸汽机的发明和应用是工业革命的重要标志,但工业社会并不是在1690年第一台活塞式蒸汽机诞生时就来临,而是在18世纪中叶蒸汽机得到改进后可以在生产系统中广泛使用时才到来。由于人工智能在发展初期并不足够“智能”,还无法成为可以使工作智能化的有效工具,更不可能被社会广泛使用,从而与社会的智能化相去甚远。在大模型问世之前,即使也出现过几次人工智能发展浪潮,但都没有出现具有使社会普遍智能化意义的技术。直至大模型的问世,才在使人工智能更接近真正智能化的同时,还出现了为社会普遍使用从而使社会智能化的可能,由此才具有了使人类迈入智能社会的独特价值。
要理解大模型的这种独特贡献,可以从大模型之“大”的角度进行把握。除了惯常从研发过程中体现的技术指标之“大”(如大参数、大数据、大算力),还可以从这些技术指标集合后形成的能力和效应上延伸地把握大模型之“大”,即“大智能”“大应用”“大参与”效应,这也是历史唯物主义侧重于考察技术影响社会的视角。
(一)大模型与“大智能”
所谓“大智能”即大模型相较于先前的人工智能具有更高水平从而更强大的智能。大模型或引领一场新的智能革命,带来人工智能技术的突破——从基于程序的人工智能到基于数据的人工智能。大模型之前的人工智能由于采用程序驱动的工作模式,其智能水平受限于预定义的规则和算法,从而只能在封闭条件下执行目标明确、边界清晰、计算步骤有限的单一任务,而在那些需要灵活应对的复杂任务面前则往往表现出智能的不足甚至缺乏,所以常常被谑称为“人工智障”或“人工愚蠢”,这样的技术显然不能构建起真正的智能社会。但大模型的出现改变了这一状况,其底层技术逻辑的奠基(网络结构的不断优化、注意力机制的引入、预训练与微调策略的应用以及混合架构的探索等方面的进展,共同推动了深度学习等技术的发展),让人工智能在一些方面具有了“大智能”,再结合智能设备的普及、物联网的发展、自动化系统的应用等条件,为智能社会的到来奠定了一定的基础。
其一,大模型使人工智能更接近于真正具有智能。在某些角度上可以说,大模型体现了人工智能发展的一次质变,这种质变的重要表现之一,就是从智能不足到更接近于真正具有智能。目前,大模型通过将深度学习、自然语言处理等多个领域的技术突破整合在一起,能够在海量数据中自主学习并不断调整、改进与优化(也可称进化),实现了对一些复杂语言信息的处理,具备了一定的分析、预测、推理乃至创造能力,在多种任务、多个领域展示出卓越性能,拓宽了人工智能的应用领域和想象空间。所以,在一些方面可以说,大模型使人工智能成为更接近于真正具有智能的技术。在这个意义上,只有当社会全面使用大模型水平的人工智能后,社会的智能化才具有了实现的可能——大模型或为构建智能社会提供核心技术支撑。
其二,大模型集合了几乎是人类级别的“群体智能”。大模型常以全网数据或知识为语料进行训练,这些语料以数据的形式被大模型所吸纳和储存,以编码了人类知识的参数模型而存在,成为容量巨大的“人类知识压缩器”。这形同于几乎被投喂了全人类知识后形成的“世界大脑”,集合为几乎是人类级别的群体“大智能”。由于“大模型将包含所有可在网上免费获取的人类知识,这将使它们比我们任何人都聪明”,从而展现出前所未有的“大智能”。另外,在训练过程中,大模型所使用的图形处理器(GPU)也是互联为集群的,这为群体智能的运作提供了硬件基础。当个体使用大模型时,可以说是在与几乎等价于人类级别的群体“大智能”相联通,并使它转化为个体知识劳动的能力。正是因为凝聚了几乎是人类级别的群体“大智能”,所以大模型的智能水平才得到了空前的提升,能够为使用者带来强大的赋智效应,并使他们有机会成为智能社会的主体。
其三,大模型具有“智能涌现”的特征。人工智能具有规模效应,即模型的性能与模型的规模(如模型的参数量、训练数据量和训练时长等)存在某种规律性关系,通常会随着规模指数的增加而线性提高,即使不改进架构和算法,只是通过规模的扩展,模型的性能(智能水平)也可能得到显著提升。当模型的规模扩大为大模型后,便有可能出现一些在小模型中无法预见的高级、复杂甚至是类人的智能行为,甚至在一些特定任务上的性能突然出现显著的跃升,这就是所谓的“智能涌现”。智能涌现改变了过去的人工智能“教什么才会什么”的能力形成机制,大模型通过涌现可以学会或具有没有教过它的能力,从而展现出较强的解决问题的能力、学习能力、泛化能力乃至创造力,甚至还被有些人认为可能与通用人工智能相贯通,这可以说是量变引起质变的生动写照。智能涌现进一步展现了大模型与“大智能”之间的通达性。
(二)大模型与“大应用”
大模型带来了人工智能研发和应用的飞速增长,因此大模型的“大”也体现为应用场景广大,即具有“大应用”(几乎所有领域都可以应用)的社会效能。“大应用”源自支撑大模型的Transformer所具有的强大泛化能力,以及大模型多基于人类的通识性知识训练而成,这使它在一定程度上具备了处理多场景、多对象问题的能力。
当然,经预训练出来的大模型(也可称“基础大模型”)由于训练数据和知识的“广而不专”,所以模型的能力也往往“全而不精”,在应用到具体行业或领域时还需要结合专门的数据和知识进行微调,使它实现知识迁移和技能习得,优化为符合具体行业或领域需要的“行业大模型”或“专用大模型”。预训练所形成的基座模型,可以说是提供了具有一定通用性的智能平台或智能生态,通过微调便能够“生长”出各种应用,从而实现模型的轻量化、本地化和产品化,使人工智能展现出无限的应用可能。在这里,微调是将大模型的一般能力落地到特殊应用的桥梁,是大模型走向“大应用”的具体路径。在大模型的运行机理中,包含了走向“大应用”的内在根据(泛化力强)和实现路径(微调),这使其一般能力与特殊应用得到贯通,成为体现普遍原理与具体实践相结合的历史唯物主义方法论的范例。
另外,随着技术的发展和使用规模的扩大,大模型的单位使用成本将不断下降,具体应用领域的降本增效就会日益显著,对大模型的应用需求也会随之增长。与此同时,大模型研发的高昂投入也需要具体应用来分摊成本,这就需要不断扩大的应用市场来合理化大规模投入。来自社会和研发机构的双重需求显示,历史唯物主义的技术—社会观是一种技术与社会双向作用的关系,在新技术应用改变社会的同时,社会对技术的需求也成为技术发展的强大动力。这种双向作用也是大模型与“大应用”相关联的“粘合剂”,将驱动“大模型+硬件”的广泛应用,促进智能化在各个领域、各类产品的实现,由此使人类迈向全面智能化的智能社会。
(三)大模型与“大参与”
一种技术只有达到人民群众广泛使用的程度,才有相应的“××社会”到来。大模型极大改善了人机交互体验,逐渐发展为一种人人都能使用并从中获益的智能生产工具。这种大众化、平民化发展,使大模型及人工智能成为多数人甚至全民都能使用的“大参与”技术,从而构成智能社会到来的又一个重要标志。
语言是人类智能的重要体现,自然语言处理是人工智能的核心功能之一。大模型在人工智能的这一核心功能上取得了突破性进展,已能够在一定程度上理解和生成自然语言,并与使用者进行相对流畅、自然的对话。使用者只要通过自然语言提出问题和要求,就可以使用大模型来实现多种目标,其便捷和“亲民”使人工智能对于公众而言成为一种实操手段,其应用由此也获得了爆炸式增长。由此,大模型开启了人工智能全面融入日常生活与工作的时代,使人工智能在人群中以“大参与”的方式普及开来,也使社会的智能化从生产领域进一步走向生活世界,从而在用户层面广泛实现社会的智能化。随之而来的是,人类正在从“数字化生存”进阶为“智能化生存”,标志着人类整体而不是部分人群迈向了智能社会。
大模型通过“大智能”“大应用”“大参与”效应,对社会产生重塑产品和业务的“大影响”或“大结果”,由此不断将智能社会带入现实。可以说,没有大模型的技术突破,人工智能对社会的影响就不会如此深刻和广泛。鉴于此,可以说正是大模型的诞生和走向泛在化,为智能社会的到来提供了可能。
二、智能生产力与智能生产工具
大模型已在一定程度上具有了“基底技术”的特质,作为基底技术的大模型将构建出智能生产力,并演化出智能生产工具,这为智能社会的到来奠定了基础。
(一)表征当代人工智能的大模型与智能社会的基底技术
生产力是历史唯物主义的核心范畴,而技术与生产力之间存在密切联系,一个时代的生产力水平取决于当时的技术形态,更准确地说是取决于当时的基底技术形态。
大模型本身的基座或基底是Transformer算法架构。Transformer是一种深度神经网络架构,当前几乎全部大模型都基于Transformer架构,它通过大规模数据训练自动学习语言的模式和规律,由此形成理解和生成语言的能力。大模型具有良好的可扩展性,能够拓展到百亿、千亿甚至万亿参数规模,这开创了自然语言处理的新范式。基于Transformer的大模型能够进行预测和分类,生成丰富、风格类人的自然语言文本,还能够进行创造性内容生成,如生成文章、画作、歌曲、视频等,在自然语言处理以及计算机视觉、音视频处理等多个领域实现了令人瞩目的性能提升。
可以说,大模型是多种智能技术的一次会聚,是围绕Transformer的“大算力+大数据+强算法”的多要素集置,由此使得大模型具有基于系统复杂性而涌现出的智能属性。如果说Transformer是大模型的基底技术,那么将视线上移可以看到,作为人工智能当今代表的大模型有可能成为智能社会的基底技术。
从历史唯物主义的技术—社会观来看,可以说一切社会形态都有自己的基底技术,这是一个社会不可或缺的基础设施,就像建筑物的地基一样支撑着整个社会结构,规定着社会运行的框架和方式,也设定了该社会发展的天花板。新的基底技术的出现往往标志着社会进入了一个新的发展阶段,基底技术的革命将带来社会形态的嬗变。大模型作为人工智能的一次重要突破,有望发展为一种新的关键基础设施,也意味着有可能成为一种新的基底技术,从而预示着新的技术社会形态——智能社会的到来。
基底技术具有元技术的性质,是开发其他技术的技术,能够造就一种技术生态,使其他技术受其影响、获其滋养、得其赋能和增强,所以是一种“使能”的技术。大模型有潜力成为这样一种“使能”的技术,可以重塑千行百业,成为推动各领域深刻变革的动力源泉。目前,无论是科学研究还是技术发明或是产业实践领域,大模型作为一种强有力的手段都发挥了重要的驱动作用,并不断涌现大量应用,可以在管理创新、生产效率提升、社会运行优化等方面形成联动增强效应。
基底技术还具有将核心技术、关键技术、前沿技术集于一身的特征,由此能够产生引领技术与社会发展的整体效应。大模型通过自身的强大功能和普适性,促使各种智能技术得以整合与发展,或形成以大模型为核心支撑的智能生态系统,并由此定义智能社会的技术标准和应用模式。大模型能够在不同领域发挥实质作用,或作为关键技术引领其他技术发展,渗入和影响社会存在的各个领域,从而成为智能社会实现的重要标志。
基底技术的突破或革命,能够带来技术发展的整体质变,造成技术社会形态的更新。例如,曾经的蒸汽革命、电力革命和信息革命就是基于相关基底技术的革命,进而导致了从第一次到第三次工业革命的发生。目前的大模型或作为新的基底技术,引领第四次工业革命并将人类带入智能社会。
基底技术也使历史唯物主义的技术—社会观得到了新的丰富。在看待技术决定社会的特征和发展阶段时,要区分基底技术与非基底技术的不同功能:一般技术可以影响社会的局部现象,但只有基底技术才能决定社会的全局性质。由此对发展战略带来的启示是,要通过占领基底技术的战略高地来从根本上增强国家的技术实力,通过基底技术的领先实现技术上的总体优势。
(二)智能生产力:大模型介导的生产力革命
历史唯物主义认为,生产力作为生产物质资料的能力,是人类社会存在和发展的基础,是推动历史前进的决定性力量。生产力与技术密切相关,根据上述分析可以看到:一个时代的生产力水平由基底技术决定,不同的基底技术意味着不同的生产力时代,所以基于生产力视角区分的社会形态也被称为不同的“生产力社会形态”,这与本文讨论的“技术社会形态”同义。
技术革命的直接后果是生产力革命,如蒸汽磨代替手推磨的“蒸汽革命”带来了以大机器为生产工具的生产力革命,造就了工业化的生产方式,人类由此进入了工业社会。当前的“智能革命”是由智能技术所介导的又一场生产力革命,即智能生产力革命,而大模型作为可泛在的智能技术,是能够带来生产力革命的技术,正在成为重要的生产力,也是科学技术作为“第一生产力”的新展现。对大模型的历史唯物主义探察,要指向可能蕴含的生产力革命效应。
智能社会将由智能生产力奠基。智能生产力是得到智能技术加持、增强和提升的生产力,是生产力要素智能化变革的结果,是智能技术与生产力中“人”和“物”的深度融合,表征了生产主体使用智能技术进行生产的能力,是智能技术向生产技术全面渗透时引发的质变,是生产力演进的新形态。在物的层面,智能生产力主要体现为智能技术被生产工具所吸收,转化为新形态的生产工具,由此对生产力产生颠覆性变革。所以,智能生产力是作为基底技术的智能技术被工具化进而生产力化的产物,是智能技术起决定作用的生产力,是人类进入智能社会在生产力维度上的展现,也是历史唯物主义生产力范畴的时代化表述。
当智能社会主要由大模型来标志时,智能生产力就会以大模型在生产领域中的应用为标志。大模型在生产领域中的应用,或使智能生产力真正形成。智能技术的出现和智能生产力的形成是不同步的,人工智能刚诞生时并未同步地造就智能生产力。大模型出现之前的几次人工智能浪潮,虽然包含了衍生为智能生产力的可能与潜力,但并未现实地造就智能生产力。这是因为,技术成为生产力往往有一个过程或滞后期,智能技术需要积累过去的发展经验而不断走向成熟。而这种积累发展出的大模型,将成为智能技术转化为生产力的桥梁或平台。大模型通过垂直化应用走向生产领域,可以“变现”为实在的生产力。
人工智能是人类智能的对象化,所以大模型所承载的智能是人类智能与机器智能的系统集成,其中凝结或积淀了对象化即物化的人类智能和科技力量,由此生成的智能生产力或成为智能社会的主流生产力。在以大模型为基底的智能生产力中,技术的生产力化就体现为大模型的生产力化,抑或说智能生产力就具体体现为大模型所蕴含的生产力。
由于大模型通过内容生成的方式进行工作,所以从一定意义上说,大模型的生产力就是内容生成能力,即作为生成式人工智能的生成能力,生成的内容就是生产的产品(文本及多模态内容)。大模型的生产力由大算力、大数据和强算法构成。算力是决定大模型智能生产力的核心要素,大数据是重要的生产资料,强算法则是协同算力和数据的结构配置。三者的结合将与大模型的使用者(人)有机融合为智能生产力。
智能生产力从总体上由知识生产力和物质生产力构成。在智能社会,知识生产力起决定作用,大模型或直接呈现为知识生产力,它所生成的多模态内容就是各种形式的知识产品。但大模型并非仅停留在作为知识生产力的范围内,而是可能进一步走向或迁移为物质生产力,形成智能生产力从信息世界到物理空间的泛化,生成实在的动作和物质产品,由此带来物质生产力的巨变,从而导致全部生产力的跃迁。目前,大模型泛化到制造、能源、电力、化工、交通等多个产业,就是大模型垂直应用于“造物”或“变物”领域,由此衍生出种种领域大模型,使得生产领域被“大模型化”或“智能化”,即大模型转化为物质生产力。通过参数规模的增加、算力的增强、算法和训练方式的改善,大模型的性能可以不断提高,所代表的生产力也会随之提高,从而提升人类以及人均的知识生产力和物质生产力水平,甚至引发生产力的质变。所以,基于大模型的智能生产力或带来一次重要的生产力革命。
智能生产力是智能技术所具有的生产力品性,已日益由大模型主导。大模型是当前先进生产力的产物及代表,它所表征的智能生产力不断得到强化和放大,或成为智能社会重要的生产力基础。
内容来自网友分享,若违规或者侵犯您的权益,请联系我们
所有跟帖: ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )
楼主前期社区热帖:
>>>>查看更多楼主社区动态...