科学揭示信息定义和发展规律
2016-12-07
本文作者杨学山同志曾担任国家信息中心总经济师、国务院信息化工作办公室副主任、工业和信息化部副部长等重要职务。 本文根据作者为其最近公开出版的《论信息》一书所作前言整理而成,并经作者修改确认。
信息,平凡而又神秘。说其平凡,是因为几乎所有人都在用信息这个词;说其神秘,是因为居然到现在还没有一个具有共识的定义,还没有形成体系化的、揭示其发生发展规律的知识体系。然而,人类社会正在走向信息社会。依据物理学发现的材料和能源技术推动了工业革命数百年的发展,同样的科学理论能否解释信息发生发展的规律并推动信息社会可持续发展呢?
信息是什么,让太多的研究者困惑了太长时间。不是因为认知的复杂性,而是因为信息与物质、能量和生命全然相异的特殊性,破解这个特殊性,信息这种宇宙中唯一的特殊存在就跃然纸上。《论信息》所定义的信息就是所有客观存在的含义,这里,物理空间、生命空间和信息空间都是客观存在的。如此定义的信息没有质量、没有能量、没有固定形态,如此定义的信息必须依托载体与/或外壳存在,如此定义的信息可以在不同的形态间转换,如此定义的信息借助不同的载体与/或外壳逐步走向自主发展,最终成为独立的自我发展的与物理空间、生命空间并列的信息空间。如此定义的信息以自在态、自有态和记录态三种模式存在,可以解释几乎所有今天在使用的信息概念。信息由载体、外壳、含义三要素构成;具有三种截然不同的存在形态,含义可以在这三种形态中不断转换;含义本身不受时空和物理定律、生命定律的约束,跨越时空和物质、能量、生命,实现非连续的连续进化,这是信息区别于物质、能量、生命的三个最重要的特殊性,是信息的一系列特殊属性产生的根源,也是认识信息、理解信息的入门钥匙。
区分信息的形与义是认识信息及信息发生发展规律的关键。信息的载体和外壳是形,含义是义。承载信息的光、声、电、纸张、核苷酸、神经元是形,文字、语言、图表、概念是外壳,核苷酸、神经元、非生物主体存储处理的外壳既是载体又是外壳。载体和外壳都是形,而可以为认知主体利用的含义才是义。载体及与载体结合在一起的外壳运动或遵循物理空间定律,或遵循生命空间定律,而含义的运动和发展不遵循这两类定律,因此,无论是信息的运动、结构、增长、逻辑和空间,都需要区分这两者,作为分析和讨论的基础。
信息的运动既有以形为主的,也有以义为主的,还有形与义同时运动的。信息运动从三态转换开始,这是信息发生发展的基础,从自在态信息到遗传信息、从遗传信息到认知信息、从认知信息到记录信息,这几个关键的转换环节在几十亿年时间内逐一突破,为最终形成独立、自主发展的信息空间奠定了基础。而信息形与义的移动、处理则揭示了不同形态信息移动和处理的同异之处,载体和外壳遵循各自所属形态的规律,而含义的移动和处理都是朝着特定的目的,遗传、认知、记录信息的处理具有相同的模式,今天计算机信息处理能力与遗传和认知信息的处理相比,在形的处理上超出很多,但在义的处理上还有很大的差距。记录态信息的积累及与记录态信息发展连接在一起的符号、概念体系演进是信息空间演进过程中的基础性、标志性环节。
在不同的信息形态和不同发展阶段,保持信息自身持续增长的基础是信息结构。没有结构的自在态信息无论数量多少、形态如何均是一盘散沙,不能发挥作用,更不能实现有效的基于含义的增长。信息结构是理解信息、把握信息发生和发展规律的钥匙。信息结构的基础是信息单元,如同生命空间的细胞和物理空间的分子,既由更基本的组成部分构成,又具有独立的功能。信息结构有两类,隐性信息结构和显性信息结构。隐性信息结构只能为拥有该信息集合的主体所利用,显性信息结构可以为多个主体利用。当自有信息产生之日起,隐性信息结构就存在,并不断发展,记录信息产生之日起,显性信息结构就开始产生,记录信息本身就是带有信息结构的。随着记录信息的不断增长和信息处理技术的不断发展,显性信息结构在逐步显示其特征和作用,从互联网大数据到不同类型的智能系统,显性信息结构都是其主要的构成因素。然而,所有这一切都没有被称为显性信息结构,而是被称为索引、目录、知识表示等。正如遗传信息编码和大脑认知信息存储和利用结构没有破解之前,没有认识到隐性信息结构一样。正如隐形信息结构才使遗传信息和认知信息成为生命和认知持续发展的基础,显性信息结构是记录信息自我发展的基础。
信息的增长经历了六个发展阶段。信息增长既是信息的量和质的增长过程,更是信息空间功能逐步完善直至自我发展的过程。第一阶段到第三阶段是漫长的借态演进过程,使信息空间从没有生机的无限沉寂状态,跨越到生成不依赖物理和生命空间独立存在的记录态信息。这个过程以物理空间和生命空间的定律为基础,完成了信息空间进化最为关键的两步:遗传基因的进化并通过遗传基因,使智人的进化达到了10万年前高度完备的认知功能,为成熟的体系化的语言和文字、符号和概念体系的诞生奠定了不可逆的雄厚基础。相比于第一到第三阶段的40多亿年时间(仅从地球看),第四、第五两个阶段只有不足一万年时间,但实现了信息空间功能增长的另一个飞跃,认知能力和基于认知能力的记录信息增长,从串行进化发展到大规模并行进化。此前关于信息的演进都是基于个体,数量众多的个体按照生命进化规律发展,值得特别关注的是,关于认知能力的生命进化似乎就以智人为终点。极其大量的生命个体经历数十亿年时间,完成了认知能力功能的进化,这是生命规律的约束。一旦摆脱了生命进化规律,记录信息诞生之后,生命规律和社会发展规律同时发挥作用,使信息空间在短短几千年时间内发生了三个重大的变化,一是记录信息载体与/或外壳的处理工具不断进化,远远超出了人的处理能力;二是借助记录信息处理工具,人类认知能力的进化并行发展规模越来越大,从开始的数十、数百到现在的几十亿在一个共享的认知信息平台上发展;三是正因为快速地并行认知进化,很快就耗尽了生命空间赋予人类的认知能力,人类认知能力极限已经触及,半个世纪以来人们称之为“科学的沉寂”现象,在很大程度上是人类认知能力的极限,逐步完备的显性信息结构一定程度上可以缓解这一进程,但极限的到来是必然的。显性信息结构的诞生和逐步完备、信息处理技术体系的发展和人类认知能力的极限三个因素促使信息发展进入第六阶段,尽管这个阶段还没有到来,但轮廓已经显现,就是一个独立于物理和生命空间,自我发展完善的信息空间的产生,并与物理和生命空间一起成为三足鼎立的宇宙发展新格局。
理解信息增长和信息空间的核心是显性信息结构。显性信息结构的基础是隐性信息结构,显性信息结构只是将隐性信息结构外化,成为不同主体可以共享,并能在一定条件下重现客观存在的信息空间基础构成要素。一个显性信息结构对应于一个客观存在,包括这个客观存在的属性和功能。当第六阶段信息空间认知主体的能力不断提升,显性信息结构完备的理论、方法和工具不断完善,越来越多的隐性信息结构将转换为显性信息结构,物理空间和生命空间未知的规则将逐一被认知,信息发展第六阶段将进入成熟期。
信息运动的规律及规律蕴含的逻辑是什么?信息逻辑的讨论有感知、连接、计算和进化这四个含义,以运动为主要领域展开。感知与转换是一个将一个(或多个)主体的外部信息转换为内部信息,成为隐性或显性信息结构的一个组成部分的信息运动过程。这个运动过程按感知的主体和载体的不同,分别遵循物理或生命规律,但决定感知什么、取舍什么、含义如何组织,进入主体什么信息集合或结构则遵循信息的规律。连接是信息运动最重要的组成部分,连接的实现遵循物理或生命定律,连接的目的和结果基于信息规律。按照信息空间的划分,信息的连接分成内连接和外连接,按照连接建立的性质,分为实连接、虚连接和任意连接三类。这三类连接构成了基于含义的信息空间连接场,根据一定的规则实现不同目的和节点间的连接。信息的处理与信息的连接一样无时无处不在。对于含义的处理与外壳或载体的处理性质截然不同,因为客观存在本身是由一个个基本构件组成的,每个基本构件都有其特定的处理功能,以信息结构为基础的处理也应该是从最基本的构建开始。因此,处理的逻辑由一组微处理、短逻辑起始,以内计算、泛包容、多中心为规则构成信息空间的处理模式。以信息结构内成的功能系列为基础,以多中心计算模式,可以形成大任务、泛分解的处理模式。通过感知转换功能和任意连接、内计算、泛包容的规则,使以显性信息结构为基础的信息空间的计算,成为一个以内部完善为主的计算体系,为信息空间的自我完善奠定了动力基础。关于集合计算和多维计算的规则提供了信息空间,另一类计算对象新的处理能力。按照物理和生命空间的思维逻辑看信息空间的增长,被割裂为一个个不同的没有任何逻辑关系的片段,从而成为物理或生命空间的一个附属现象。换一个思维模式,从信息含义在不同性质的空间中,在物理和生命定律的作用下,形成自身的发展路径和规律,可以看到这种非连续的连续进化的必然性和规律性。
总体来看,信息空间主要包含三个部分,一是信息空间的构成及其存在、消亡与扩展,二是信息空间与认知能力发展的关系,三是信息空间与物理和生命空间的关系。信息空间的发展还没有完成一个循环,总结其规律还为时过早,但迄今为止的发展,至少可以得出三条规律性的总结:一是在一个独立信息空间中,转换主体的数量、延续的时长、协同平台的质量是该信息空间规模增长和进化速度决定了该空间增长的速度,称之为延续协同定律。二是信息空间的发展呈台阶式跃迁,每一个台阶呈现长期渐进积累后跃迁到一个新台阶规律,称之为积累跃迁定律。三是信息空间构成的非组合规律,一对一地反映相应的客观存在,一对一地在隐形或显性信息结构中体现,一对一地复制、处理。这正是信息空间的构成特征,也是信息空间的增长特征。
信息发展六个阶段是信息空间形成和完善的过程,理解信息空间,必须摆脱物质世界和生命世界延续性的定式,这一种不同于物质和生命的规律主导着信息空间的延续。物理空间定律必然产生自在态信息并与生物体发生交互,生命空间定律必然导致遗传基因的产生进化并达到生物体认知功能的极限,却诞生了独立于物理和生命空间,不遵循物理和生命定律而发生发展的信息空间。
一个重要的假设:如果信息是物理空间的组成部分,是物质基本粒子的构成部分,则将在信息空间产生第二类自在态信息,改变物理、生命、信息空间相互的关系。物理学既没有证明这种状态的存在,也没有证明这种可能不存在,所以只能是一种假设。如果这个假设成立,信息是物理空间物质的组成部分,而不仅是反映客观存在的。分子生物学的研究成果已经证明,信息是生命空间的必要组成部分。信息由载体、外壳和含义构成,有三种存在形态,在信息进化过程中,生命空间是其关键阶段的必要条件,信息空间依赖物理和生命空间而存在。
三个空间相互依存,相互影响,形成新的宇宙观。从宇宙演进的维度看,物理空间的逻辑是能量、质量的守恒、力的作用和统一,在物理空间多变的现象中寻找不变的规律;生命空间的逻辑是在物理空间逻辑的约束下,在不变中寻找可变的生存和发展;信息空间的逻辑是在物理空间和生命空间逻辑的约束下,寻找改变物理空间和生命空间运行轨迹的路径。这里有两个关键的环节,一是是否存在通过信息影响物质的微观构成和宏观进程的可能,二是物理、生命、信息三个空间谁能主导认知能力。对于第一个环节,今天的物理学还不能给出答案,但直接否定是不成立的。对于第二个环节,物理空间不能主导认知,主流的意见认为人类是认知的主体,至少人类是主导认知能力的主体。但是,认知所要揭示的客观规律的复杂性与认知能力的提升同步增加、人类生理极限的矛盾和信息空间自主认知能力的加速成长,如果找不到恰当的解决办法,非生物体超越人的认知能力的时间已经不会很长。
本书试图将信息这个客观存在清晰定义,并在此基础上揭示其发生发展的规律,并以信息空间的发展及其与物理、生命空间的关系,重新诠释宇宙的发展规律。30多年的研究历程,无数次的推翻和肯定,最终形成了这一书稿。它还不成熟,还有很多可以推敲和完善的地方,甚至可能存在错误的结论,但我还是把它出版了,目的就是得到读者的批评,以完善这一理论体系。(本文刊登于《中国信息安全》2016年第4期)