数据的确权、流通、入表与监管研究(一):数据与确权(上)

2024-01-01 12:37:21

?

关注WX公众号: commindtech77, 获得数据资产相关白皮书下载地址

1. 回复关键字:数据资源入表白皮书
下载 《2023数据资源入表白皮书》
2. 回复关键字:光大银行
下载 光大银行-《商业银行数据资产会计核算研究报告》
3. 回复关键字:数据资产估值
下载 《商业银行数据资产估值白皮书》
4. 回复关键字:上海银行
下载 上海银行《商业银行数据资产体系白皮书》
5. 回复关键字:商业银行数据资产管理
下载 《商业银行数据资产管理体系建设实践报告》

2022年12月发布的《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”)提出了需要“构建数据基础制度”,而数据确权、价值评估、流通监管是建立数据制度的三个基本问题。为分析这三个问题,需要建立一个理论模型和分析方法,并在此基础上,提出基本的确权规则、流通规则、入表规则和监管方法,目的是为前述三个问题的分析和解决提供一种在法律、经济和技术上逻辑清晰的架构和方法,推动相关问题的落地解决。

本文是系列文章的第一篇——数据与确权。

先说结论:按照现代信息系统的基本工作机理,数据是指有一定结构和含义的二进制数字集合;数据可以分为指令类数据和非指令类数据;非指令类数据可以进一步分为:原始数据(次原始数据),模型数据,结论类数据,自动执行类数据。依据数据的分类和数据处理的特点,对非指令类数据提出数据所有权确权的4条规则:

确权规则一:原始数据(次原始数据)中完全取决于实体本身的属性、状态,逻辑上不依赖特定数值化活动的数据属于对应的主体(被数值化的主体或物的拥有者);原始数据中依赖于特定数值化活动的数据,属于对应主体和实施数值化活动的主体,数据可以去关联后分属相关主体。

确权规则二:主体(人或机构)的原始数据(及次原始数据)的所有权无法改变,但可以设置类似“用益物权”的权利;物的原始数据(次原始数据)的所有权随物的所有权变化而变化;数据集按照“按份共有”的原理确定权属。

确权规则三:结果数据的权属在遵守规则一、二的前提下,可依照《民法典》“添附”规定确定权属(或权益)的归属,默认属于输入数据所有者和处理者共同。

确权规则四:新产生的模型数据、统计/推测/预测结论、研判/决策结论、自动执行数据按照规则三确权,后续可以改变。

一、数据与数据分类

现代信息系统都是基于现代数字计算机技术构建的,因此计算机体系的特点决定信息系统中数据的特点,因此后面的讨论中不在区分信息系统和计算机系统。

在现代计算机系统中只有二进制的数。人们设计这些系统时,赋予了这些二进制数一定的结构(即:数的排列方式)和含义(即:编码规则),这些有结构和含义的二进制数字集构成为数据。

数据基本可以分为两大类,即:指令类数据和非指令类数据。

指令类数据就是直接控制电子开关工作的数据。计算机系统就是通过指令实现基本的四则运算、逻辑判断的。

计算机里面除了指令类数据之外都是非指令类数据。

编程人员按照一定的处理逻辑,编排计算机的各种指令,就构成为“计算机程序”。计算机程序是“指令类数据”最主要的形式。

现代信息系统与现实世界的关系可以抽象为如下模型:

数据存在于“赛博空间”中,“赛博空间”是一个“人造”空间,现实空间与赛博空间的交互,本质仍是人与世界的交互作用,这一特性决定了赛博空间的所有规律都与现实空间有着本质和联系,这也是数据相关问题研究和分析的最基本原则。

现实空间主要由人、组织和物所构成。

现实空间和赛博空间有三个非常重要的作用点,即:编程、数值化、现实化。

人通过“编程”活动,在赛博空间形成指令类数据集,用于对赛博空间内的数据进行处理。

赛博空间的非指令类数据主要分为“原始数据”和“衍生数据”两大类。“原始数据”是现实空间对象在赛博空间的最初始“映射“,”衍生数据“则是”原始数据“和其他数据在赛博空间内处理后生成的数据。

考虑到数据“处理”过程的特点,上述模型可以进一步细化为如下图:

现实空间的实体对象可以分为:人、组织、物(包括:自然物和人造物)。人和组织又被称为主体对象,简称为主体。

现实空间的实体通过数值化过程,其状态、属性等会被赛博空间的数据所表示和记录,这些最原始的数据就构成为“原始数据”。数值化的手段一般有两种,一种是人工输入的方式实现原始数据的采集,另一种是使用工具完成原始数据的采集(如:各种数字传感器)。原始数据一般会涉及实体的当前状态、属性、关联关系等,也包括原始数据产生(或采集)的时间、地点等。数值化活动一般会发生在两种情况下,一种是在基于信息系统的业务活动中,另一种则是专门的数据采集活动。

原始数据可能因为各种原因,需要进一步的清洗、整理、校准、汇集等,才能形成对现实对象更为真实、全面的反应,这些经过进一步处理的后形成的、对现实实体反映的数据称为“次原始数据”。理论上,对同一现实对象,按照时间顺序排列的原始数据和次原始数据就构成为该对象的“历史数据”,再结合对应的空间信息,就构成该现实对象在赛博空间的“完整反应“。

原始数据和次原始数据与现实空间对象的固有关联关系是不可改变和消除的,这是赛博空间所有数据处理的基础。后面关于原始数据和次原始数据的确权规则就是根据这一特点制定的。

人们为了发现规律、分析问题,会汇集各类原始和次原始数据,对其进行分析和处理——即:建模过程,从而可以形成用于分析各种规格和模型的模型数据。模型类数据往往承载了人们发现的现实世界的事实或变化规律与规则。

使用模型数据,可以对原始和次原始数据进行各种处理,主要有两类:一是分析,包括:统计类分析、推测预测类分析,其结果则为各类统计类数据,对未来的推测类数据;二是决策,使用模型,针对原始数据或次原始数据所反应的现实情况,做出某些方面的决策,结果即为:结论类数据。

在很多场景下(如自控控制、自动驾驶),结论类数据会被进一步处理成可以自动执行的数据。

现实化环节是赛博空间数据作用于现实世界的关键环节。数据主要通过两种途径影响现实世界,一是通过影响人的行为,人们根据主动或被动接收到的、由数据转化而来的、可理解的信息或指令,做出行为或直接执行决策;二是可自动执行数据被输入到各类自动执行装置中,触发形成各种可以影响现实世界的物理、化学过程。

小结一下本节的结论:赛博空间数据可以分为指令类数据和非指令类数据,非指令类数据可以进一步分为原始数据、次原始数据、模型类数据、统计预测类数据、决策结论类数据、自动执行类数据。各类数据有与现实实体有着特有的关联关系,这些关系决定了其所有权确权的规则(见第二节)。现实空间和赛博空间的三个交互点,这些节点以及赛博空间内的处理过程构成数据所有者数据相关的基础权利(见第三节)。

文章来源:https://blog.csdn.net/shenxiaoming77/article/details/135323373
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。