产业链是多企业联合发展的一种产物。随着制造业专业化和细分化的不断发展,现如今的制造业已经从原来一个企业独自生产一个产品逐渐演化成为以一个产品为主体,各类配件与主体总装相互配合的模式,其中产业链的稳定性则变得较为重要。
产业链分析主要数据要素及其作用
以芯片制造产业链为例,产业链中包括了芯片的品牌方如Intel、AMD、高通、龙芯、华为等半导体产品的品牌方,这些企业均为产业链的链长企业,而整个产业链中还包括芯片研发企业、流片制造商、光刻机生产企业(生产设备制造商)、芯片制造企业、芯片的营销企业、芯片的物流服务企业、原材料供应商及芯片的使用企业等等,每一家企业都在芯片的产业链中处于一个环节,而每一个环节的产业链中存在一个或多个龙头企业及大量的配套厂商,最终所有的企业为整个链长企业服务。
基于大数据的产业链分析主要数据包括对于整个产业链内所有企业数据、宏观数据、知识产权数据、科研机构、专家/人才、传媒等信息的采集、分析与服务,从而通过大数据的手段为链长提供运行过程决策和未来的发展决策。
其中企业数据包括企业工商数据、企业经营数据(营收、研发投入)、企业投融资数据、企业知识产权数据、企业风险数据、企业招聘数据以及国外企业经营数据(营收、研发投入)。以德系汽车芯片断芯事件为例,当时受到新冠病毒影响,某国际芯片供应商公司的产能受到严重影响,而直观反映的就是当年的企业经营数据出现收窄。在此之后企业分析在全球范围内打破该生产瓶颈,通过在马来西亚投资构建前端厂的方式提高产能,从而逐渐解决产能不足问题,修正产业链中的短板,保证了产业链的稳定性发展。
宏观数据 包括平台基地实验室、行业报告、科技项目、政策数据、技术封锁与涉诉纠纷数据以及统计局数据;知识产权数据包括专利数据和论文数据。以高通绞杀华为为例,高通通过各类行业数据分析的方式,逐渐发现出华为作为产业链长企业在其科技方面的优势,从而联合政府制定相应的反制性政策措施和禁止台积电进行代工等措施压制华为的产能,从而实现了高通芯片在5G通信领域的战略性发展,从宏观层面实现对于华为的绞杀。
科研机构数据 主要包括产业链内科研机构发布的相关发展报告、研究报告、专著、论文、专利、会议讲座及其他学术成果物内容数据。主要为产业链进行科研学术能力评估评价方面的数据支撑。以比亚迪汽车芯片为例,比亚迪通过各类在科研机构发布的专利、论文专利等方面的内容,分析汽车芯片产业尤其是新能源汽车芯片产业中的科技短板,并重点进行科技攻关,最终在过去的三年逆袭其他汽车新品厂商,最终成为世界汽车芯片产业的新的领军企业。
专家/人才数据 一方面通过产业链的相关协会或学会组织为引导,构建行业内的专家与人才团队,形成整体的能力资源库。一方面通过相应的人力资源机构,构建相应的企业人力与岗位需求库,为后期与高校和企业进行人才培养提供支撑。以龙芯为例,通过分析中国芯片领域的专家人才现状,构建龙芯博士后工作站,定位于进一步为国家自主创新“卡脖子”行业培养紧缺人才,培养敢于迎接挑战、有志于从事应用、基础研究的核心人才。从而为龙芯源源不断输送各类顶尖人才,保障龙芯在科研方面的领先地位。
新闻资讯和网址库 主要是通过采集网络上的相关新闻资讯和自媒体信息形成相应的数据库。该种方式更多程度上为产业链提供了营销服务,如之前的芯片涨价潮,就是通过发掘舆论和制造舆论的方式,制造一种芯片产能不足,芯片资源稀缺等假象,从而为各类链长企业对本品牌芯片提价提供舆论支撑。
产业链分析的主要构建路径
基于大数据的产业链分析模式构建主要包括资源构建、知识处理、成果库、产业图谱、区域监测、技术发现、风险指标预测共七个部分。通过该步骤一方面实现对于产业链内各种信息的知识化过程,构建起产业链发展的总体路线。
资源构建
资源构建通过数据报表向用户直观展示各项数据指标的情况。资源中心主要包含企业数据、投融资数据、专利数据、论文数据、政策数据、报告数据、财报数据等。该部分主要是对不同来源的数据根据不同的主题进行归类、标记和存储的过程。最终以数据资源库形式呈现。
在这过程中最大程度上将处于碎片化的知识进行采集、存储和分析,主要目的在于构建基础性的产业资源信息数据仓库,为后面的知识细化处理提供支撑。
知识处理
知识处理用于对整个产业链中产生的内部数据(通常是非结构化数据,例如文本、文档、图片等)进行知识抽取与数据处理。该过程主要是通过知识图谱技术,在资源中心的基础上将数据资源向知识资源转换的主要过程。
知识处理是对于完成知识库归类的数据进行特定分析,找出相应的关键词,关键元素,形成知识抽取,并将所有碎片数据进行知识化的过程。
成果库
成果库主要是完成知识处理后的内容,通过构建知识图的方式将碎片化的结构化数据知识进行串联与处理,并在此基础上进行相应展示,即知识图谱。
成果库所表达的是对于完成知识处理的数据进行深层语义分析与串联,形成知识梳理的过程。在这过程里,知识内容将被逐渐的体系化,形成带有一定条理性的集合,如在产业链中,所有与某项发明创造相关的所有技术内容将在成果库中进行集中展现,而这个发明则会被清洗指向到某个产品的核心设计内容。
产业图谱
产业图谱则是聚焦在知识图谱的内容,将与产业相关的知识图谱进行展示。通过直观可视的方式将产业内容的所有信息按照一定的逻辑结构进行展现。
在展示中根据对于产业链分析的侧重点定制出不同的展示指标和内容,如产业的领军企业、产业的主导企业、产业企业分布等内容。该展示偏于宏观,主要用于产业经济与产业组织等方面的宏观分析。
区域监测
区域监测主要是围绕区域经济学展示与分析区域监测相关指标,包括国家产业竞争力指数、国家科技创新竞争力、技术创新指数。表现出某个产业与某个区域之间的关系,从而说明该区域内的产业聚集效应。
技术发现
技术发现则是从科研技术突破角度展示前沿技术和卡脖子技术的技术发现和技术画像,从而能够更加清晰展示出目前产业链条中的科技突破能力和国产化替代能力,并辅助判断出该产业发展趋势和未来需要发力的方向。
风险指标预测
风险指标预测在数据资源构建的基础上通过构建风险指标库的方式对于数据资源内容进行计算和评判,得出当前产业存在风险情况进行分析,并以此为基础进行展示。该方式最大程度上向产业集群展示出其出现的问题和关联的其他产业链的变动情况。
基于大数据的产业链分析模式可通过大数据中多元异构数据处理技术对论文、专利、企业、科研机构等多来源的包括Excel、word、txt等多种数据格式的数据进行识别、清洗,形成结构化数据,并形成元数据库。
在此基础上基于知识图谱技术对于元数据进行关联、挖掘,按技术集的应用场景或行业领域划分形成产业发展知识图谱,并实现可视化分析展示,构建资源中心、知识处理中心、风险监测等面向业务分析的场景管理模型,从而达到对于产业链上存在的断点、堵点、盲点实现多维识别的目的,为产业链在发展布局、运行监测、问题诊断等方面实现全方面支撑。(作者:刘娜 耿玲玲 赵京鹤)