央財智庫数字经济专题研究:发展数据要素,壮大数字经济算法云计算物联网数据量数据包

1.我国数据资源丰富,数据要素改革加速推进

信息化时代,我国数据资源优势明显。截至 2020 年末,我国网民数量达 9.89 亿人,世界银行统计显示,我国互联网普及 率超过 70%。根据 IDC 测算,2018 年中国拥有数据量为 7.6ZB,占全球数据量的 23.4%,预计未来随着通讯设备、物联网设备接入数量和承载能力进一步提高,中国的数据量将在 2025 年达到 48.6ZB,占全球数据量的 27.8%,远高于美国的 17.5%, 成为全球最大的数据中心。

1.1 数据要素是数字经济时代的核心生产要素

当前关于数字的概念较多,主要包括数据要素,数据要素市场,大数据产业,数 字经济等。从概念间的逻辑来看,数据要素是基础资产,数据要素市场是促进数据要素市场化配置的主要方式,大数据产业是数据要素发展的主要载体,数据要素是数字 经济时代的核心生产要素。

(1)数据要素:能够产生使用价值和经济效益的数据

按照中国信息通讯研究院定义,数据是对客观事务的数字化记录或描述,是无序 的、未经加工处理的原始材料。数据首先要先通过采集、整理、聚合、分析,成为具备使用价值的数据资源。数据资源参与到社会生产经济活动、为使用者带来经济效益, 则形成数据要素。也即数据形成数据要素,需要在原始数据的基础上,形成使用价值 和经济效益。

数据要素的经济效益主要体现在两方面。一是数据要素是生产力的重要组成部分, 催生新产业、新业态、新模式。二是数据要素能够与其他传统生产要素相配合,形成 乘数效应,放大劳动力、资本等要素价值。如数字和劳动力要素相结合,提升劳动力 要素产出效益;数字与技术要素相结合,催生“人工智能”等新技术。

(2)数据要素市场:促进数据要素提升配置效率的市场

数据要素市场是指数据要素在交换或流通中形成的市场,包括数据交易行为以及 数据交易场所两重含义。通过数据要素市场的配置机制,促进未市场化配置的数据要素向更加市场化的方向发展。根据国家工信安全发展研究中心测算,当前我国数据要 素市场规模约为 500 亿元,“十四五”期间有望突破 1700 亿元,进入高速发展阶段。

(3)大数据产业:是数据要素发挥潜能的主要载体

根据工信部《“十四五”大数据产业发展规划》定义,大数据产业是以数据生成、 采集、存储、加工、分析、服务为主的战略性新兴产业,是激活数据要素潜能的关键 支撑。通过大数据产业发展,能够打通数据要素市场和产业内部要素配置的通道,让 要素市场的定价和交易功能转化为产业内部的优化资源配置的功能,推动产业高质量发展。根据工信部“十四五”大数据产业发展规划, 2020 年底我国大数据产业规模 已超过 1 万亿元,“十四五”期间大数据产业测算规模将突破 3 万亿元。

(4)数字经济:以数据要素作为核心生产要素的经济形态

根据统计局定义,数字经济是指以数据资源作为关键生产要素、以现代信息网络 作为重要载体、以信息通信技术的有效使用作为效率提升和经济结构优化的重要推动 力的一系列经济活动。数字经济是继农业经济、工业经济后最为核心的经济形态变革, 数字经济下,生产要素组合为数字、技术、资本、劳动力、土地,其中数字作为核心 要素起到关键变革作用。

在数字经济的界定方面,当前关注的重心主要集中在“数字产业化”和“产业数 字化”两大类,前者主要围绕提供数字技术、产品、服务、基础设施和解决方案,以及完全依赖于数字技术、数据要素的各类经济活动,后者指应用数字技术和数据资源 为传统产业带来的产出增加和效率提升,是数字技术与实体经济的融合。

2021 年 6 月,国家统计局发布《数字经济及其核心产业统计分类(2021)》,明确数字经济 产业范围,分为“01 数字产品制造业”、“02 数字产品服务业”、“03 数字技术 应用业”、“04 数字要素驱动业”、“05 数字化效率提升业”等 5 个大类,其中前 4 类基本对应“数字产业化”,第五类对应“产业数字化”。根据中国信通院测算, 2005 年—2020 年,我国数字经济增加值规模由 2.6 万亿元扩张至 39.2 万亿元,数 字经济占 GDP 比重由 14.2%快速提升至 38.6%,是支撑经济增长的重要力量。

1.2 改革重心从发展大数据产业扩展至全面构建数据要素市场

近年来我国持续推进数据要素的市场改革。2014 年,“大数据”概念第一次写入政府工作报告;2017年中共中央政治局就实施国家大数据战略进行第二次集体学 习,明确要推动大数据技术产业创新发展,构建以数据为关键要素的数字经济,运用 大数据提升国家治理现代化水平,运用大数据促进保障和改善民生,保障国家数据安全。2019 年,十九届四中全会《中共中央关于坚持和完善中国特色社会主义制度 推 进国家治理体系和治理能力现代化若干重大问题的决定》中,首次明确将数据作为生 产要素参与社会分配。2020 年 4 月中共中央、国务院发布的《关于构建更加完善的 要素市场化配置体制机制的意见》将数据要素确认为五大要素之一,并要求加快培育 数据要素市场。

从政策侧重点来看,政策由推动大数据技术创新、产业发展,到全面加强数据要素市场化配置,构建数据要素市场。早期针对数据相关政策侧重于大数据技术,发展 大数据产业等领域,2015-2016 年的相关发展规划及纲要主要围绕“强化大数据技术产品研发”、“发展核心技术”、“加快大数据产业主体培育”、“推动产业创新 发展”等方面。随着我国数字经济快速发展、产业不断壮大,数据作为生产要素的重 要性逐步凸显。

2017年以来,政策在支持产业发展、技术创新的基础上,更加突出 数据要素市场的培育和建设,明确构建以数据为关键要素的数字经济。2021 年 11 月出台的《“十四五”大数据发展规划》中,工信部明确提出要加快培育数据要素市场。在标准规范上,提出按照数据性质完善产权性质,建立数据资源产权、交易流通、 跨境传输和安全等基础制度和标准规范。在定价方面,制定数据要素价值评估框架和 评估指南,包括价值核算的基本准则、方法和评估流程等。

在交易方面,推动建立市场定价、政府监管的数据要素市场机制,发展数据资产评估、登记结算、交易撮合、 争议仲裁等市场运营体系,培育大数据交易市场,鼓励各类所有制企业参与要素交易 平台建设,探索多种形式的数据交易模式,提升数据要素配置作用。2022 年 1月国 务院出台的《“十四五”数字经济发展规划》,进一步提出要充分发挥数据要素作用, 强化高质量数据要素供给,加快数据要素市场化流通,创新数据要素开发利用机制。

2.要素层面:数据要素市场化配置仍需进一步完善基础制度建设

现代要素市场发展的重点是建立要素确权、确立要素交易单位、要素定价和要素 交易四个方面的制度,以及建立统一的监管体系和监管标准。从数据要素来看,目前 交易单位相对比较清晰,但在数据确权、流通方式、定价及监管等方面都面临诸多挑 战。

2.1 确权:有原则性规定,但缺乏清晰产权规则

根据数据主体的不同,数据可以分为个人数据、企业数据和社会数据三大类。个 人数据来源于个人的特征以及行为两部分,前者包括姓名、电话、住址等个人特征数 据,后者主要来源于个人的衣食住行产生的行为数据。企业数据同样来源于两部分, 一是个人数据中,经个人同意让渡给企业进行整理、储存、分析、开发利用的部分, 二是企业在日常经营中产生的数据。社会数据囊括范围最为广泛,既包括政府依法采 集的个人、企业数据,也包含自然资源、经济社会等多方面数据。

按照数据分类,数据的来源实际存在分级关系,应对数据权益进行多层次区分和 对应保护。从数据来源看,同一条个人数据,既属于个人数据,经授权后也属于企业 数据,经政府采集后也属于社会数据,因此对数据的确权应当存在分级,即存在个人 对数据的基础所有权、企业和政府部门对数据的经授权的相关权益,同时对于数据收 益权也应当进行合理的安排。

当前我国针对数据确权主要为原则性规定,缺乏清晰的产权规则。当前数据确权 框架方面,在政策制定方向上,已形成“个人数据具有人格权属性”“企业对其投入 大量智力劳动成果形成的数据产品和服务具有财产性权益”的共识,但仍有待建立基础制度和更加清晰的产权规则。

从地区探索层面,深圳曾在 2020 年 7 月发布《深圳 经济特区数据条例(征求意见稿)》,提出“数据权”概念,明确自然人对其个人数据依法享有数据权;公共数据属于新型国有资产,其数据权归国家所有;数据要素市 场主体对其合法收集的数据和自身生成的数据享有数据权。然而由于对数据权问题仍 未形成统一认识,在正式条例中删除数据权表述。2021 年 11 月,上海通过《上海 市数据条例》,明确自然人对其个人信息享有的人格权益,自然人、法人和非法人组织在使用、加工等数据处理活动中拥有法定或者约定的财产权益。

2.2 流通:缺乏交易标准及完善的流通体系

从数据的流通方式来看,主要分两大类,一是数据共享体系,二是数据市场化交 易体系。其中,数据共享体系主要以社会数据为主,重点在提升政府数据利用效率, 包括提升政府治理能力、提升风险防控水平。数据市场化交易体系则采用市场化方式, 探索个人数据、企业数据以及社会数据的市场化利用机制,主要交易方式包括撮合交 易,以及综合数据服务交易。

2.2.1 数据共享:政府数据共享持续深化,但利用效率仍不足

政策持续推动政府数据开放共享。2015 年 8 月,国务院《促进大数据发展行动 纲要》明确提出,“要加快政府数据开放共享,推动资源整合,提升治理能力”。2020 年 3 月中共中央、国务院《关于构建更加完善的要素市场化配置体制机制的意见》, 进一步提出要推进政府数据开放共享。2021 年 6 月通过的《数据安全法》,明确了 政务数据以公开为原则,不公开为例外的基本理念,要求在国家层面制定政务数据开 放目录,构建统一规范、互联互通、安全可控的政务数据开放平台,推动政务数据的 开发利用。

政府层面数据共享快速推进,已取得一定成效。从政府内部数据共享来看,据国 家工业信息安全发展研究中心统计,以“国家电子政务网站”为平台,当前已有共 162 家中央部门和相关单位接入,共计 25.2 万家全国政务部门接入。31 个国务院部 门在国家共享平台注册发布实时数据共享接口 1153 个,约 1.1 万个数据项,涵盖个 人身份、出生、教育、婚姻、社保等自然人相关信息,企业信息、信用信息、资质信 息等法人相关信息。国家共享平台累计为生态环境部、商务部、税务总局等 27 个国务院部门、31 个省市区提供查询核验服务 9.12 亿次,有力支持网上身份核验、不动 产登记、人才引进、企业开办等业务。

从政府对外数据共享来看, 截至 2020 年 4 月底,我国已有 130 个省级、副省级和地级政府上线了数据开放平 台,其中省级平台 17 个,副省级和地级平台 113 个。在开放共享数据范围方面,由 政务数据扩展至企事业单位所涉及的公共数据资源,开放平台具备数据检索、数据申 请、数据获取和数据探索等基本能力,提升数据开放能力。

但当前政府数据共享仍存在数据权责不清、数据质量不高、开放程度不高等问题。一是由于数据权责不清,职责分工模糊,政府数据开放共享过程中,各个部委之间数 据共享主观意愿有限,数据资源共享壁垒仍难打破,共享渠道不畅,因此导致共享的 数据权威性、规范性不足,数据质量不高。二是推动政府数据开放的政策大多以倡导 性为主,缺乏清晰的路径及时间表,缺乏统一标准和全面监管,导致各地、各部门推 进节奏不统一,重复建设问题存在,难以形成整体合力。三是政府开放的数据涉及的 领域较为单一,多为公益类数据,一些垂直领域数据及跨部门数据的开放数量和质量 较低,政府数据的利用价值尚未完全激活。

2.2.2 数据交易:缺乏流通标准和权威可信数据流通环境

当前我国数据交易主要为两种形式,一是通过交易中介形成的撮合型交易,二是 通过数据服务商进行的数据综合交易。从主要交易的产品来看,包括数据包、数据分 析产品及数据分析服务等。

(1)撮合型交易:缺乏有公信力的平台,技术水平难以保证数据安全交易

撮合型交易主要是指,由各地大数据交易中心作为中介提供平台,将可供交易的 数据商品信息列示,促进买卖双方达成的数据交易。在此前无大数据交易中心的情况 下,买方有数据需求难以找到卖方对接,而卖方有数据资源难以找到合适买家。2014 年起,我国地方大数据交易中心陆续成立,通过撮合平台,为买卖双方的供给及需求 提供公开窗口,促进数据交易达成。撮合型交易的主要产品为数据以及数据衍生品。

从我国地方大数据交易中心的历史案例来看,数据来源一般是卖方通过收集政府 公开数据、互联网信息或自身经营中形成的数据产品,数据买方包括企业、互联网金 融公司、媒体、金融机构等。如东湖大数据交易中心曾上架“基于政府公开数据和互 联网信息的中小企业综合评估”数据商品,由武大吉奥信息技术有限公司卖出数据, 北京拉卡拉网络技术有限公司用 8.6 万元购买。再如上海数据交易所,曾撮合国网向 工商银行出售数据产品,由国网负责对企业用电数据进行脱敏、清洗和深度加工,再 经模型与算法,形成综合评估报告,作为银行对企业客户授信前的“背书”或旁证, 并在信贷反欺诈、贷后预警方面对银行进行辅助。

当前撮合型数据交易面临较多问题。一是交易前,政府数据开放共享不足,平台 缺乏广泛、高质量数据来源。虽地方大数据交易平台都是地方政府指导设立的,但是 早期成立的大数据交易中心,多为地方政府为迎合大数据战略成立的象征性意义的平 台,甚至武汉一度存在三个大数据交易平台,与政府的数据合作机制未完全畅通。一 方面大量政府数据并未向大数据交易中心开放,真正的数据联通并未实现,另一方面 开放的数据多为常规的政务数据,能够真正为企业所利用的数据较少、质量不高。因 此交易的数据多为会员企业的数据,整体较为分散、零碎。

二是交易中,缺乏统一的数据交易标准、高水平的隐私交易技术。2022 年 1 月 国办发布的《要素市场化配置综合改革试点总体方案》明确提出“建立健全数据流通 交易规则”。过去我国大数据交易平台交易规则多为平台自身建立,标准参差不齐, 平台缺乏公信力,难以保证数据及交易质量。此外,过去平台整体数据技术水平有限, 在保证隐私和安全方面的技术达不到要求,难以形成交易双方互信机制和数据安全流 通。新成立的数据交易所致力于改善业务模式,打造有公信力的数据中介平台,通过 隐私技术,保证交易安全,提高交易效率。新成立的北、上、深数据交易所,一是提 供数据产品的合规评估、资产评估和质量评估,提高交易双方的互信度,二是在交易 模式上探索采用隐私计算、区块链、人工智能等技术,将数据要素解构为可见的“具 体信息”和可用的“计算价值”,对计算价值进行确权、交易,实现数据“可用不可 见”,绕过当前尚未明确的数据确权问题,交易“计算价值”,提高交易效率,保证 交易安全。

三是交易后,数据“买定离手”,平台缺乏深度挖掘及后续合作机制。过去地方 大数据交易中心业务主要围绕撮合交易,数据交易后双方买定离手,一是平台对于数 据的脱敏、深度挖掘、及后续的数据相关业务合作切入程度不足。二是纯中介的定位 导致用户粘性较低,部分供需双方在平台接触后,转而绕过平台进行直接交易,平台 业务开展困难。三是数据“买定离手”后,卖家难以控制买家对数据的利用情况,若 买家对数据进行二次或三次利用、在黑市进行流通,则会显著影响数据价值及数据安 全性。

(2)数据综合服务交易:“采产销”型综合模式,侧重于数据服务交易

数据综合服务交易,是指数据服务商采用的“采产销”型增值服务模式,通过上 游环节的数据采集获取数据,然后对数据进行加工和分析,最后提供数据产品及数据 服务。当前我国数据服务商主要包括两方面主体,一是第三方专门进行数据服务的机 构,如聚合数据、数据堂、天元数据等,二是头部互联网企业,基于自身数据进行的 相关数据交易。

从数据来源看,主要为数据服务商获取的政府公开数据、互联网公开数据、股东 提供的数据,以及通过与政府合作,获得政府机构、银联、电网等授权使用的数据。从数据买方看,数据服务商面向所有有数据需求的个人、企业、APP 开发者、小程序商家等。比如聚合数据基于政府数据的授权,与相应需要调用身份证件信息的公司 合作,向其提供身份证识别 API 接口,当公司收到用户拍摄的证件照片时,直接调用 该接口进行证件信息的识别,提高效率。例如阿里生意参谋,通过分析阿里旗下如阿 里旅行、天猫、淘宝、1688、菜鸟、闲鱼等系列用户行为数据,一方面可以提供给 店铺运营人员,即时调用包括流量、曝光、咨询、成交、售后等整个生命周期的多维 数据,另一方面可以将一些脱敏数据对外服务媒体、研究机构、合作方等。

当前数据综合服务模式同样存在问题。

一是交易前,数据来源具有局限性。无论 是第三方数据服务商,还是头部互联网平台,所能接触到的数据均较为受限。第三方 数据服务商仅能通过爬虫搜集获取政府及企业公开数据,或者需与政府合作,获得定 点数据授权。而互联网企业提供的数据则更为受限,主要为旗下平台及店铺经营数据, 对于合作方、媒体或研究机构有一定帮助,但较难满足其他数据需求。

二是交易中,缺乏第三方平台及标准,数据质量及隐私难以保障。由于缺乏统一 的数据质量评估体系,同时缺乏类似大数据交易中心的第三方监督平台,数据服务商 相关数据交易难以保证数据质量,包括数据的全面性、完整性、真实性、准确性及安 全性等,数据交易双方信任机制存在一定难度。

2.3 定价:难以使用传统定价模型,缺乏统一定价标准

传统的定价模型中,资产定价主要遵循市场法、收益法、成本法。然而对于数据 资产来说,传统定价方法均存在局限性。市场法下,资产价值由市场供需决定,然而 当前全球范围内,对于数据交易都缺乏明确有效的交易市场,数据交易量较小、相似 数据交易频率较低,市场法难以形成有效参考。收益法下,资产价值根据预期收益进 行评估,然而数据资产价值会随着交易主体和应用场景的变化而变化,收益法缺乏评 估标准。成本法下,资产价值根据资产形成的成本进行评估,然而数据资产部分成本 难以分离,且与实际价值差异较大,成本法也难以利用。

从海外数据交易定价来看,多数采用固定定价或协议定价,具体定价水平缺乏公 开可参考的交易数据。考察海外数据主要交易平台 Quandl、Foursquare 以及 Data Plaza。针对数据产品的交易,主要采取的定价方式为三种。一是固定价格,即平台 将调用、下载数据的价格预先定好,比如 Foursquare 地理位置数据包价格为 5-12 美元/次。二是创设 VIP 会员制,如客户想从 Data Plaza 下载用户社交媒体的使用 数据,则首先需付 1800 美元会员费,后续每月续交 800 美元会费,则可获得无限次 调用权限。三是协议价格,如 Quandl 要求数据买家在购买数据之前,与其协商,确 定数据需求及价格。针对数据服务的交易,则主要采取协议定价。如 Foursquare 基 于数据做出的客流量测算、消费者行为分析等数据分析服务,都需与其协商确定价格。

从我国数据交易的定价模式来看,基本参考国外定价策略。针对撮合型交易,主 要采用协议定价及固定价格。协议定价方面,如上海数据交易所撮合的国网与工商银 行的企业用电数据综合评估报告交易,其价格是基于双方协商后达成,且对外保密。固定定价方面,如贵州省数据流通交易平台在官网上挂出的北京帝测科技股份有限公 司形成的“贵阳市城区倾斜摄影数据产品”,固定价格标价 225 万元。

针对数据及数据产品的交易,除固定定价及 VIP 会员制定价外,还衍生出差别 定价方式。一是固定定价,如友盟+对不同数据定价不同,客户可以按需付费使用。二是 VIP 会员制,如聚合数据创设“黑钻会员””黑钻 Plus”制度,会员费一年为999-3999 元,在会员期间可以无限次下载数据。三是差别定价,如天元数据针对企 业基本信息数据包的定价,按次数收费,购买的次数越多越优惠。

针对数据分析及数据相关服务的交易,则主要为固定定价及协议定价。一是固定 产品定价,如天元数据一份关于方便速食网络零售数据的分析,定价为 399 元。二是协议定价,如友盟+按照买方需求,可定制数据解决方案,具体价格由双方协议确 定。

整体而言,当前数据的固定定价主要运用于偏公有性质的数据,如政府、地理位置相关数据等。而协议定价则需具体看供需双方需求,定价范围较大。从数据交易定 价的难点及存在的问题来看,主要有三方面:

一是数据定价天然难度较大。首先数据的了解和使用过程重叠,数据可用性无法 事先确定,其次数据价值会随着交易主体和应用场景而变化,难以形成统一的定价规 则,最后当前数据还存在产权不清、来源多样和管理复杂的问题。

二是缺乏权威的第三方专业定价平台。数据定价应基于数据量、数据种类、数据 完整性、数据时间跨度、数据实时性、数据深度、数据覆盖度、数据稀缺性等给出定 价结果。然而当前我国缺乏较为权威的第三方专业平台给出评价结果及合理价格区间, 大量零散的数据交易定价均针对应用场景,定价跨度较大。

三是协议定价缺乏标准规范,部分机构可能存在“看人下菜”、“漫天要价”的 行为。协议定价方式与供需双方需求、业务体量关系较强,在缺乏标准规范的情况下, 针对体量较小的需求方,部分机构可能存在要价随意度高的问题,可能会使整个协议 过程形成一个漫长的博弈过程,增加时间成本。

2.4 监管:职能重叠,行业及地区规则差异大

监管部门方面,当前我国各地已陆续成立大数据管理局,但涉及数据流通交易的 监管部门依然较多,监管职能有所重叠。据中国信息通信研究院统计,当前全国省级 层面已有 14 个地区设立省级大数据管理机构,省级以下各市、区大数据管理局也达 到 12 个,如广州市大数据管理局、贵阳市大数据发展管理委员会等,负责统筹本地 区内数据监督管理工作。但除大数据管理局外,当前我国涉及大数据流通交易的管理 部门较多,包括发改委、市场监管管理局、网信办、金融监督管理局等,监管职能分 工有待进一步清晰化。

我国针对信息及数据安全领域的“三驾马车”法律框架基本搭建完成,但侧重于原则性,缺乏可操作性;不同行业的数据立法“各司其职”;省级层面针对数据管理 办法陆续出台,但规则不统一。整体框架方面,2021 年 9 月 1日《数据安全法》 正式施行,规范数据处理活动,保障数据安全,促进数据开发利用。2021 年 11 月 1日《个人信息保护法》正式施行,强调处理个人信息应当用合法、正当的方式,处理 信息应遵循公开、透明的原则。加之此前出台的《网络安全法》,我国信息及数据安全领域的法律框架基本搭建完成。

然而立法整体偏原则性,如《数据安全法》只是对 从事数据交易中介机构的原则性规定,缺乏可操作性。行业方面,针对工业、电信、 金融、汽车等行业的数据基础性规范和指导性文件出台,如工信部 2021 年 9 月发布 《工业和信息化领域数据安全管理办法(试行)(征求意见稿)》;在汽车行业,网 信办会同四部委发布了《汽车数据安全管理若干规定(试行)》;在金融行业,央行 于 2021 年 9 月发布《征信业务管理办法》。省级层面,天津发布《天津市数据交易 管理暂行办法》,是我国第一部专门对数据交易进行规范的地方性立法,深圳颁布《深 圳经济特区数据条例》,上海颁布《上海市数据条例》,规范数据处理活动,各地分 散式探索,缺乏统一框架。

3.运营机构层面:数据要素市场化配置的六大环节

数据要素产业链涵盖数据从产生到流通交易的重要环节,根据国家工业信息安全 发展研究中心的概括,主要包括数据采集、数据存储与管理、数据加工、数据分析、 数据流通、基础设施保障六个环节。前三个环节大致对应数据的资源化,即把原始数 据整理成有序、有使用价值的数据资源,后三个环节大致对应数据的资产化,即数据 通过市场流通交易为使用者带来经济利益。在每个环节中,需要不同的市场主体参与, 形成数据要素产业链。

3.1 数据要素产业链初步形成体系

3.1.1 数据采集是数据要素产业链的前提和基础

数据采集机构主要分两类,一是采集企业自身运营数据的机构。包括互联网巨头、 通信运营商、以及以可穿戴厂商为代表的各种新兴硬件设备企业,均在运营中能够产 生大量基于个人用户的原始数据,这类公司既有数据资源,也有大数据思维,能够较 好的将数据进行原始采集。二是各类软件供应商,通过服务企业采集数据。部分企业 拥有大量的数据,但是由于自身缺乏利用能力,需要通过软件供应商进行采集。比如在企业端,企业内部软件服务商能够采集企业运行过程中产生的经营数据,在生产端, 能够通过物联网设备,采集生产相关数据,此外还可以通过摄像头、麦克风、激光雷 达等工具采集各类文本、语音、图像等数据。

我国已在数据采集产业初步形成了产业体系,包括企业端的用友软件,生产端的树根互联,定制化数据采集的海天瑞声等。“十四五”大数据产业发展规划也提出了数据采集业的发展方向,要求“在数据生成采集环节,着重提升产品的异构数据源兼 容性、大规模数据集采集与加工效率”,未来数据采集技术有望更上一个台阶。

3.1.2 数据存储与管理为充分发挥数据价值提供硬件保障

随着人工智能、机器学习领域技术的持续进步,我国数据量呈几何级增长,多样化已经成为数据信息的一项显著特点,因此海量数据的有效存储和管理重要性提升。

存储服务器可以分为传统服务器和云存储服务器两种。传统服务器方面,购买者 需自主搭建服务器运营平台,企业前期投入成本较高,但随着数据量增长速度加快, 传统服务器应用范围逐步缩小。云储存方面主要包括三类,一是公有云,数据存储能 力较强、规模大,无需用户投入建设成本,数据访问及利用的便捷性较高。二是私有云,即企业自行搭建及使用的内部数据储存系统,数据存储安全性较高,数据传输速 度更快,主要使用机构包括政府、大型企业和高新科技企业等机构。三是混合云,即 组合公有云和私有云两个方式,满足对核心数据的安全性保护,以及对数据存储量的要求。

我国在数据云存储产业,头部企业优势明显。2021 年上半年中国公有云服务整体市场规模达 到 123.1 亿美元。阿里云排名第一,市场份额为 37.9%,腾讯云和华为云分列第二、 第三,三巨头共占据中国云市场逾六成份额。

隐私保护是未来数据存储产业重点发展方向。目前,各“云”企业正在加快技术创新,致力于将提高数据隐私保护力度作为未来的发展方向。阿里云深耕区块链技术, 推出蚂蚁链摩斯多方安全计算平台解决方案,旨在基于多方安全计算、隐私保护、区 块链等技术,实现数据的可用不可见,解决企业数据协同计算过程中的数据安全和隐 私保护问题。

3.1.3 数据加工提高数据可用性

数据加工主要包括数据清洗、数据标注、数据审核等环节。数据清洗主要侧重于删除重复信息、纠正错误,提升数据质量,如百度 EasyData 智能数据服务平台。数据标注主要是用人工方式,把数据打上特征标签,使得计算机能够学习带有特征标签的数据,培养自主识别能力,如数据堂等。数据审核主要对数据中涉及欺诈、反动等 非法内容进行审核,一般通过机器和人工双重过滤,对于机器审核,主要通过算法、 计算机视觉等技术进行数据敏感性审查,如图谱科技等。

数据加工领域中,数据标注已经形成较完整产业体系。当 前我国数据标注产业已经形成以北京为增长极辐射带动三大产业集聚区的格局。数据标注龙头聚集在北京,产业聚集区包括“环京产业群”、“环长三角产业群”和“环 成渝产业群”,人工标注聚集在劳动力资源密集省市的小城镇和农村,孵化出新疆和田、河南平顶山、山东菏泽鄄城县等数据标注村。

数据标注专业化、智能化、集聚化是未来重点发展方面。未来随着数据标注市场 逐步精细化,数据标注产业发展将会更加专业化、集聚化,数据标注质量和精度也会 越来越高。并且随着人工智能的发展和技术的进一步拓展,AI 智能数据标注也将成 为数据标注的新业态,并逐步解决当前数据预加工中效率低、耗时长且伴有隐私泄露 风险的问题,进一步降低成本、提高效率、提高数据加工的安全性。

3.1.4 数据分析挖掘数据价值

数据分析是提升数据价值的关键一环。数据分析与挖掘的能力直接决定了数据的应用推广程度和范围,是大数据产业的核心。数据分析主要分内部数据分析和外部数 据分析。内部数据分析主要针对企业内部经营分析,离线数据分析用于处理复杂和耗 时的数据处理,在线数据分析主要处理简单的数据,应用于微博、短视频、电商等,如阿里生意参谋等。外部数据分析,主要通过抓取各个行业的数据,形成行业数据库, 并对数据库产品进行分析,为客户提供咨询服务,如艾瑞、易观数据等。

数据分析产业避免同质化、寻求差异性是未来重点发展方向。随着数据时代的来 临及人工智能、云计算技术的发展进步,数据分析越来越受到各行各业的青睐,以此 为主营业务的公司也如雨后春笋般涌现。因此如何避免同质化、寻求不可复制性成为 未来数据分析行业的主要发展方向,迎合越来越复杂的客户群体的个性化需求也将成 为数据分析环节的重点。

3.1.5 数据流通使数据的市场价值得以实现

发挥数据价值的关键在于数据流通,数据流通提升数据的利用效率。从参与数据 交易流通的主体来看,主要分三大类,分别是地方指导的大数据交易中心,数据服务商,以及头部互联网企业建立的数据交易平台。

大数据中心是我国数据交易方面较早的参与主体,主要作为平台撮合数据供需双方,实现数据交易。据统计,截至目前,约有共 19 家数据交易中心成立。从成立节 奏来看,主要分两个阶段,第一阶段为 2014-2016 年,自大数据写入政府工作报告后,我国政府主导的大数据交易中心快速发展,其中 2014-2016 年共有数 10 家大 数据交易中心陆续成立,此后 2017-2019 年陷入停滞。

数据服务商是参与我国数据交易市场的重要主体,主要通过“采产销”模式提供 综合数据服务。从成立时间来看,多数第三方数据服务商成立于 2010-2016 年,比较具有代表性的包括聚合数据、天元数据、数据堂、数据宝、友盟+等。从产品形式来看,基本均采用“采产销”型增值服务模式,首先进行数据汇集,数据来源包括网络爬虫、互联网开放数据、企业内部数据、其他合作数据网站、政府数据等,其次对数据进行清洗、处理、储存和分析,提升数据价值,然后向客户提供相应的数据产品、 数据服务以及相关数据衍生品。

从经营情况来看,数据服务商相比政府引导的大数据交易平台,交易量更大、活跃度更高、盈利性更强。如聚合数据已稳定运行超过 10 年,服务京东、今日头条、 拼多多等头部企业,日访问次数超过 3 亿次。数据堂公司市值超 25 亿,拥有超 1000 家合作伙伴,45000 套数据量,2000TB 的数据规模。天元数据收录 22 亿条商品零 售类数据、2 亿条生活服务类数据、500 万条原材料进出口有关的数据等。

互联网企业构建的大数据平台侧重于数据分析及定制服务。近年来,国内头部互联网企业在满足自身的数据需求之外,均逐步构建自己的数据交易平台。但头部互联 网企业的数据交易平台不局限于简单数据集的供给,其更关注由原始数据派生而来的 各类衍生产品,通过逐步普及“云”的概念,实现对数据的存储、收集、分析处理, 为客户提供数据分析、个性化定制解决方案、融合大数据的人工智能软硬件应用等。比较有代表性的包括阿里云、腾讯云、百度云等。

从三类主体的发展态势来看,未来大数据交易中心、数据服务商及头部互联网平 台与政府部门的合作或将更为密切。通过在数据来源、数字技术方面的融合,一是有利于全面拓展数据来源广度,二是有利于提升数字交易技术,如更广泛的普及区块链 技术,利用区块链技术具有中心化、难以篡改、可溯源的特点,更好地实现交易双方 的互信,三是完善数字交易规则,四是提升数字价值挖掘能力和数字应用能力。

3.1.6 基础设施保障主要包括资产评估、登记结算、争议仲裁等

资产评估主要是第三方评估机构对数据的价值进行评估,为数据流通提供基础性参考。登记结算是指为数据所有者及采购方提供名册建立与维护、数据交易结算等服 务,规避数据交易风险。争议仲裁是指当数据交易双方对数据交易过程和结果产生民 事争议时,对数据交易争议进行裁决并协调双方矛盾。当前我国在相关领域的探索均 处于初级阶段。

3.2 数据要素产业链发展面临多重难题

一是我国数据资源规模庞大,但数据资源开发不足,价值潜力还没有充分释放。根据 IDC 测算,预计未来随着通讯设备、物联网设备接入数量和承载能力进一步提高,中国的数据量将在 2025 年达到 48.6ZB,占全球数据量的 27.8%,成为全球最 大的数据中心。然而当前我国数据资源利用程度仍有限。政府数据利用方面,我国政 务开放数据集规模仅为美国的约 11%,企业生产经营数据中来自政府的仅占 7%(王 璟璇等,2021)。企业数据利用方面,美国希捷科技于 2020 年发布的有关各国企 业数据利用情况的调查结果显示,中国企业的有效数据利用率为 33%,与欧美发达 国家(美国为 37%)相比,仍有一定差距。

二是纵观数据要素产业链的六个关键环节,数据安全问题贯穿始终,数据要素产 业链安全问题挑战日益严峻。近年来,数据泄露事件频发,影响广泛,且数据泄露的 途径多样化,内部、外部、外包人员、数据共享方、黑客等多种渠道,均对数据安全 形成严重威胁,对涉事企业、个人均造成重大影响。例如在新冠疫情散点爆发期,新增病例流调信息泄露,对受害者带来极大负面影响。随着未来数据量持续提升、数据要素产业链发展不断深化,对数据存储和访问的安全性要求越来越高,如何在数据流 通的环节中保护数据价值不泄露、信息不丢失,保护所有站点的安全是数据要素产业链发展面对的重大挑战,加强数据安全防护将是未来数据产业链发展的重点。

三是当前我国数字要素产业链的基础设施保障机制仍较为不足,缺乏权威的资产 评估、登记结算、交易撮合及争议仲裁机构。国务院《“十四五”数字经济发展规划》 提出,要建立健全数据资产评估、登记结算、交易撮合、争议仲裁等市场运营体系, 提升数据交易效率,未来相关领域建设有望加速。

4.产业层面:数字经济将成为重要驱动力

近年来,我国数字经济发展势头整体强劲。国务院《“十四五”数字经济发展规划》提到,2020 年,我国数字经济核心产业增加值占国内生产总值比重已达到 7.8%, 数字经济为经济社会持续健康发展提供了强大动力。从更广阔的数字经济概念来看, 根据中国信通院测算,2020 年我国数字经济发展呈现两个“39”态势,一是 2020 年数字经济规模达到 39.2 万亿元,同比增速达 9.7%,远高于同期 GDP 名义增速, 二是数字经济规模占 GDP 比重达 38.6%,同比提升 2.4 个百分点。

从数字经济构成来看,主要包括数字产业化、产业数字化、数字化治理以及数据价值化四个部分,其中以数字产业化和产业数字化作为主要表现形式。从两者占比结构来看,中国信通院数据显示,2020 年,数字产业化规模约为 7.5 万亿元,占数字经济比重约为 19.1%,产业数字化规模约为 31.7 万亿元,占数字经济比重达 80.9%。

4.1 数字产业化发展有赖于核心技术的突破

4.1.1 数字产业化发展整体平稳,在数字经济中占比有所下降

数字产业化,主要指围绕提供数字技术、产品、服务、基础设施和解决方案,以 及完全依赖于数字技术、数据要素的各类经济活动,以电信业、电子信息制造业、软件和信息技术服务业、互联网行业为主。根据信通院数据,2020 年,数字产业化规 模达到 7.5 亿元,占 GDP 的比重为 7.3%,同比增长 5.3%,在数字经济的比重由 2015 年的 25.7%下降至 2020 年的 19.1%。从四大重点行业来看:

(1)电信业务总量快速提升,新兴业务收入增长迅猛。工信部数据显示,2021 年 1-11 月,我国电信业务总量为 1.5 万亿元,同比增长 27.7%,累计收入 1.3 万亿 元,同比增长 8.1%。其中与 IPTV、互联网数据中心、大数据、云计算相关的新兴业 务增长迅猛,前 11 月收入同比增长达 28.4%,其中云计算和大数据收入同比增速达 89%和 31.2%。从用户发展情况来看,移动电话用户规模稳中有增,截至 11 月份末, 三家基础电信企业的移动电话用户总数达 16.42 亿户,比上年末净增 4792 万户。其 中 5G 用户数快速扩大,三家基础电信企业 5G 手机终端连接数达 4.97 亿户,比上 年末净增 2.98 亿户。

(2)电子信息制造业生产、利润及固定资产投资均延续增长态势。工信部数据显示,2021 年 1-11 月,规模以上电子信息制造业增加值同比增长 16.2%,增速比上年同期提高 9 个百分点。营业收入同比增长 14.7%,增速同比提高 6.9 个百分点;利润总额同比增长 29.8%,增速同比提高 14.1 个百分点。电子信息制造业增加值增速基本保持高于工业增加值增速态势。

(3)软件和信息技术服务业平稳发展。工信部数据显示,2021 年 1-11 月,我 国软件和信息技术服务业发展态势平稳,软件业务收入平稳较快增长,利润总额保持 增长。2021 年 1-11 月,我国软件业务收入 8.5 万亿元,同比增长 18.3%,利润总额 10153 亿元,同比增长 8.2%。

(4)互联网和相关服务业增速有所回升。工信部数据显示,2021 年 1-11 月, 我国规模以上互联网和相关服务企业完成业务收入 1.4 万亿元,同比增长 22.3%,增 速呈现一定触底回升态势。从细分领域来看,音视频服务保持高速增长,新闻和内容 服务类企业快速增长,互联网数据服务持续快速发展。

4.1.2 数字产业化发展面临关键领域“卡脖子”等问题

一是关键领域“卡脖子”问题仍突出,产业链、供应链仍在一定程度上受制于人。目前,我国数字技术在应用方面较为广泛,但在核心技术领域还存在一些短板,存在“重商业模式、轻技术创新”的问题。2019 年工信部报告指出,我国高端芯片、工 业控制软件、核心元器件、基本算法等 300 多项与数字产业相关的关键技术仍然受 制于人,核心关键技术对外依存度高。

二是龙头效应明显,部分领域存在垄断和妨碍公平竞争的问题。数字产业化聚焦 5G、人工智能、工业互联网、高端芯片、高端工业软件、云计算等关键领域,而这 部分关键领域的核心技术仍掌握在行业龙头手中。在市场准入、公平竞争机制尚不健 全的情况下,数字产业化部分领域存在损害群众利益、妨碍公平竞争的行为和做法。

4.2 产业数字化受疫情影响整体提速

4.2.1 产业数字化发展加速,在数字经济中占比提升

产业数字化指应用数字技术和数据资源为传统产业带来的产出增加和效率提升, 是数字技术与实体经济的融合,包括智慧农业、智能制造、智能交通、智能物流、数 字金融等融合型新产业新模式新业态。根据信通院数据,2020 年产业数字化规模达 31.7 万亿元,占 GDP 比重为 31.2%,同比名义增长 10.3%,占数字经济比重由 2015 年的 74.3%提升至 2020 年的 80.9%,是数字经济发展的重要动力。

从产业数字渗透率来看,各产业数字经济增加值占比逐步提升,但产业间差异显 著。根据信通院数据,2020 年我国服务业、工业、农业数字经济占行业增加值比重 为 40.7%、21.0%和 8.9%,较 2019 年提高 2.9、1.5、0.7 个百分点。从产业差异 来说,服务业数字渗透率存量及增量均显著高于工业及农业,工业数字渗透率提升速 度持续加快,但农业数字渗透率变化持续低位徘徊。

2020 年受新冠疫情影响,服务业及工业数字渗透率均较此前有所提升。从需求 来看,疫情导致全社会经济活动向线上迁移,包括在线购物、在线教育、远程办公等 需求均迅速扩大,催生各个行业的数字化应用进一步升级。在企业层面,信通院报告 指出,疫情中,各地企业在复工复产过程中面临销售下滑、产业链中断、资金不足等 问题,工业互联网、大数据等手段可实现产业供需对接、产业链协同、资金融通等, 进而催生出产业资源在线调配、协同制造、产能共享、跨域协作的数字化生产新模式, 极大缓解企业发展中的痛点和难点。从供给来看,随着近年以来“新基建”建设加速, 包括5G、数据中心、工业互联网等新型数字基础设施加速启动建设,为各个产业的数字化转型提供了更加先进的技术、工具、资源及基础设施支持,促进各行业加速产 业数字化升级。

4.2.2 产业数字化发展存在不平衡不充分问题

一是不同产业在数字化进程中存在发展不平衡、不充分的问题。从产业比较来看, 服务业在数字化转型中进展较快,工业次之,但农业领域数字化研究与应用还明显滞 后。一方面,农业数字化基础设施建设相对滞后,涉及农业生产经营的数字化设施便 捷性、可操作性仍不足。另一方面,涉农数字化应用场景集中在销售端的电商环节, 农业生产过程的数字化转型进展较慢。从国际比较来看,当前我国三大产业数字化渗 透率均低于国际水平,根据中国信息通信研究院发布的《全球数字经济新图景(2020 年)》报告,2019 年我国农业数字经济渗透率达8.2%,与英国的 27.5%和德国的 23.1%相差较大,工业数字经济渗透率为19.5%,与英国的 32.0%和德国的 45.3% 同样存在差距,服务业数字经济渗透率为37.8%,与英国的 58.1%和德国的 60.4% 相比仍有一定的差距。

二是产业数字化转型需统一的标准规范及多种类市场主体。目前我国传统产业数字化转型,仍有待形成统一的规范标准及行业配套标准体系,不确定性造成部分主体 参与意愿不足。要培育多种类市场主体,以标准引领,为非数字原生企业数字化转型 提供指导和综合解决方案。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

THE END
0.朋新宇:用好数据技术人才三要素,驾驭数字浪潮  数据要素是数字经济的核心要素   从应用层面,今天的人工智能其实也是数据与算力及算法的结合。算力的背后是数字技术要素,算法背后是数字人才要素,二者与数据要素结合。   数实融合是数字化与工作、商业、组织多元融合和多元聚合的立体式升级 jvzq<84yyy4ykwmwcpku0lto1vkdj87245643=446e6c2=;hcf<5:@fche953Bhd8fh:ho;1e0nuou
1.数字媒体技术论文通用12篇其与传统价值链形态相比,更加注重在数字化背景下的存在意义,希望带动观众参与,使得既有价值链更加多元。其次,涉及各个链接结构实际上保留相互联系特征,组合模式特同步维持动态效应。最后,数字媒体技术发展历程不具备顺序特征,主要是围绕核心价值系统进行专业化品牌改进,确保在市场竞争中保留宣传优势。jvzquC41zz~uil3zwgyiw7hqo1nbq€jp19?27?3jvor
2.极精微▎ERP上云,三大要素共筑SaaS赛道壁垒软件新浪财经图34 数字中台三大组成部分:业务、数据和技术 总结如下: 三个难题:产品难做(产品少)、产品难卖(客户少)、产品难用(续约少)。 三个核心要素:研发力、销售力、服务力。 三大竞争壁垒: ①产品(研发) 是否可以研发出业务支撑度、场景匹配度达到要求的应用?(管理经验壁垒) jvzq<84hkpgoen3ukpg/exr0ep5nqwj{1uskl8724232465:1fud/rn|pezlg>9538<30|mvon
3.企业数字化转型的技术范式与关键举措企业可以通过数字化转型创造新的价值增长点。学界现有研究非常重视数字经济的技术属性,探讨技术进步对价值创造的贡献。何帆和刘红霞(2019)认为,数字化转型要求推动数字技术与实体企业深度融合,形成以数据为驱动要素的新经济形态[16]。数字化企业的本质是以“数据”为生产要素,将数据收集和处理作为核心竞争力(戚聿东和蔡呈jvzq<84ilu4dc|x0ep5l{my1m{juat~ei1814:641v814:6438e65A766:4tj}rn
4.开智|周凯:数字时代下文化科技产业的转型与升级——在2022中国三、数字文化经济的三大核心特点 文化的要素化生产:文化作为生产要素进入更多行业,“文化+”成为行业标配,文化要素化作为数字文化经济最为显著的特征,主要是指数字技术、数字创意手段、数字传播工具等方式助力文化资源转化为数据资产形态的生产要素,注入更多行业的生产要素之中,成为更多行业的标准配置。 jvzquC41yy}/ewfeu0tfv7hp1:532;7331:43B3jvor
5.安筱鹏:新生产力的崛起——数字生产力的兴起与本质|《产业转型数据要素成为核心要素 新技术基础 数据+算力+算法 数字生产力的本质是人类重新构建一套认识和改造世界的方法论,基于“数据+算力+算法”,通过在比特的世界中构建物质世界的运行框架和体系,在比特的汪洋中重构原子的运行轨道,推动生产力的变革从局部走向全局、从初级走向高级、从单机走向系统。这一变革推动劳动者成为知识jvzquC41yy}/krn0vuooiqzc0gjv0ls1kplp1:6431918@3jvo
6.尚俊杰李秀晗教育数字化转型的困难和应对策略教育数字化转型过程中的困难层出不穷,这些困难本质上是技术对于教育的可供性障碍和挑战,可以总结为功能障碍、行动障碍和共生融合障碍三大维度,体现了制约数字技术对教育可供的相关要素。这些要素的参与使得各种各样的困难处于表面或是深层,因此,本文从表层、深层和核心三个层面论述教育数字化转型中的典型困难(如图1所示)jvzquC41kv4zpwz0gf{/ew4kphu039:614=:87mvo
7.重磅:《中国文化遗产数字化研究报告》(全文)当前文博机构数字化资金投入有限,跨学科、数字化人才培养不足,技术内容开发浅层化、市场转化弱等问题成为核心掣肘。根据对“探元计划”2022项目征集产业主体的调研显示,22%企业认为存在科技支撑问题,15%认为存在内容创新不足问题,背后体现着市场开发和转化问题(13%)。围绕资金、人才和技术三大核心要素提升的解决方案是jvzq<84yyy4ptmtuyj4dqv4ctvodnn4Kphu0kwigz1oe/>795
8.E/E架构研究:从供应链部署,来看区域EEA如何演进和落地1.1.5 建立下一代E/E架构的关键技术要素 1.1.6 建立下一代E/E架构的核心要素和特点(1) 1.1.7 建立下一代E/E架构的核心要素和特点(2) 1.1.8 下一代Zonal EEA演进的三个阶段 1.1.9 下一代Zonal EEA演进面临的挑战 1.2 汽车电子电气架构标准化进程 1.2.1 汽车EEA 标准:标准化需求框架 1.2.2 jvzquC41yy}/fxsiejkek7hqo1{he8ftvkimg8<497755<739::37>534
9.深桑达A2023年年度董事会经营评述数据资源是数字中国建设的核心要素,近年来我国数据资源规模稳步提升,公共数据资源流通共享能力加强,推动数据要素价值充分释放。根据2024年全国数据工作会议信息,经初步测算,2023年我国数据生产总量预计超32ZB。这表明我国已是全球数据大国,让流动的数据创造更多价值是未来方向。 jvzq<84{wctdj~fpi071lzpc0eun0ls142852=6:1e<6995697=/uqyon
10.紫光股份2023年半年度董事会经营评述从技术进程来看,AIGC多模态与大模型的交互功能持续演进,奠定了多场景商用的基础。同时,算力、算法和数据是人工智能产业发展的三个核心要素,在三大要素中,算力是承载和推动人工智能走向实际应用的关键力量。为满足数据量增加和算法参数膨胀带来的算力需求,AI算力中心需要配备大量高性能的服务器、GPU加速器和存储系统以jvzq<84pgyy/39osmc4dqv3ep1814<5:465d8>5245:7;7xjvor
11.高等教育数字化的现实挑战与核心关切高等教育数字化是世界各国高等教育领域的关注焦点,是影响我国高等教育高质量发展的重大命题,但在数字思维与胜任力、数字基础设施、教学范式、技术伦理等方面面临诸多现实挑战,需要从按需提升师生的数字胜任力、场景驱动智联环境建设与应用、强化数字教学法的研究与实践等角度回应各方核心关切。 jvzquC41uz4xj~0gf{/ew4kphu0396;13=297mvo