网络结构及演化研究
+王玮玉,李佳慧,王怡然,何喜军(北京工业大学 经济与管理学院)
[摘  要]  采集Incopat专利数据库2015-2016年专利转让数据,构建31个省际间专利转让有向加权无自环网络,研究网络结构特征及变化趋势。在此基础上构建复杂网络指数随机图(ERGM)截面模型和时序模型
(tERGM),研究影响区域间专利技术转让网络结构形成动因及其演化动因,得出:网络节点间互惠性、连通性、传递性、省际间经济圈邻近性、R&D占GDP比重、性别比例和高校数量等变量对区域间专利技术转让网络形成和演化具有促进作用,但是连通性和传递性在网络演化中的结构特征并不明显;同时省份自身规模以上工业企业新产品项目数和新产品研发经费对促进转让网络演化的作用不明显且不太显著。本研究为促进区域间专利技术转让网络演化与发展提供决策支持。
[关键词]  区域间专利转让网络、随机指数图模型、结构演化
一、引言
区域间专利技术转让与流动对提升区域间技术知识共享、提高区域创新能力以及促进技术成果快速转化具有重要意义。伴随区域间科技资源加速流动与协同创新战略的实施,区域间专利技术转移活动越发频繁,并形成了复杂网络形态。目前,现有成果多基于复杂网络理论与方法研究区域间技术合作与转让网络的结构特征,并通过多个时间段的网络结构对比探讨网络演化趋势,而对网络结构形成与演化的动因较少关注。
本文将尝试将统计学与复杂网络相结合,利用ERGM 模型探讨区域间专利技术转让网络形成及演化的动因,为网络健康有序发展提供对策建议。
二、文献综述
(一)区域间专利技术转让网络结构研究
目前区域间专利技术转让网络研究主要是用传统统计学和社会网络分析相结合的方式。赵尚梅等[1]基于2001至2011年万条跨地区转移数据,构建跨地区技术转移网络,得出发达省市形成技术转移中心;控制技术资源,中部起到中介作用;地区间技术输出、引进的能力差距越来越大,导致技术差距不断扩大。温芳芳[2]综合采用专利计量、社会网络分析及可视化等方法,以2012年度SIPO专利实施许可登记备案信息作为样本数据,从时间和空间两个维度入手,定量描述我国区域间技术转移现状,得出专利技术分布不均;其市场价值成老化规律;技术转移分布格局受多种因素影响等结论。徐庆富等[3]利用数理统计和社会网络分析方法,使用Pajek软件,从网络整体和省份个体两个视角对中国大陆跨地区技术转移特征进行研究,得出技术转移强度低;东部六省是技术转让中心;省份整体输出能力弱;大部分省份技术转移比较封闭的;西部比东部更依赖引进的结论。
(二)影响区域间专利转让的因素研究
目前针对于区域间专利转让的影响因素研究,纯结构效应影响因素目前主要关注三类:扩张性、闭合性和中介性[4]。个体属性因素主要集中于研发费用(R&D)[5] 占生产总值(GDP)的比例、经济差异、空间距离和产业结构相似度等。已经形成的共识为:专利转让往往从高R&D投入的省市转让到低投入的省市,并且R&D投入结构对于转让规模有很大的影响[6]。此外,由于东西部的激烈竞争,导致重复投资
和相似化的产业结构,成为技术转让的一大壁垒。在经济圈方面,专家认为某一空间单元的经济特征与邻近地区的经济特征是相关的,在技术创新的空间格局变化过程中,相邻地区之间存在着显著的相互影响[4]。此外,区域性别比例、高校数量等对科技创新及专利转让的影响也被关注[5][7]。根据研究发现男女比例对于科技领域发展也有关系[8],这是以往文献没有研究考虑到的因素。因此本研究将在已有的影响因素基础上扩展研究已有文献没有考虑且富有意义的因素。
(三)基于ERGM的复杂网络形成及演化研究
复杂网络指数随机图模型[9](ERGM,Exponential
Random Graph Model)是专门针对网络的统计建模工具,可以综合考虑网络内生结构和网络中行动者关系等外生因素,多用于网络形成与演化动因的研究。何喜军等[10]通过构建科技主体间的专利转让网络,并基于ERGM模型对科技主体间交易机会进行预测,通过与传统的复杂网络链路预测方法进行比较,得出了ERGM模型预测精度有所提高。此外,何喜军等[11]还以2012至2016的专利转让数据构建网络,基于ERGM时序模型去探究决定区域间专利转移的影响因素。吴硕默[12]以区域合作治理理论为基础,以制度性集体行动(ICA)理论为分析框架,以社会网络分析方法(SNA)以及指数随机图模型(ERGM)为主要方法,从宏观和微观的角度,探究对长三角跨区域环境合作治理路径的演化。陈泉[13]通过用ERGM模型,研究了R软件知识结构和开发者合作结构的内生演化机制以及两种结构的共演机制。Tyler
A. Scott [14]用ERGM建立合作组织在地区网络中的作用模型。由此可见,ERGM更适合研究区域间专利转让网络形成动因及演化动因的影响机制。
综上,本文构建区域间专利技术转让网络,提出影响网络结构形成与演化的多维因素,构建ERGM截面模型和时序模型,研究多维因素对网络形成与演化的显著性和重要性。
三、区域间专利技术转让网络构建及结构特征
(一)数据采集、处理及统计分析
基于Incopat专利数据库,检索2015-2016年中国有效发明专利的转让数据,通过对一条专利转让记录中存在多主体的情形进行拆分、转受让主体区域映射及区域间转让频次统计,构建有向加权无自环网络。网络共涉及31个省份节点,其中2015年各省份间专利转让(含省份内部转让)频次为28794次,2016年为39408次,增长幅度为:36.9%,说明省份间专利转让更加频繁。统计去掉省份内转让的频次,筛选出省份间专利转让频次,2015年12218条,占总转让频次的42.4%,2016年15019条,占总转让频次的38.1%,说明省份间的专利技术转让50%以上为省份内部转让,即跨省份专利转让不频繁。
(二)区域间专利技术转让网络构建
区域间专利技术转让网络可以抽象为三个集合,即节点集V,边集E,权重集W,网络表示见公式(1)。
G =(V,E,W)(1)
式中,V:网络的节点集合,即参与专利技术转让中所有省份的集合;E:连接节点的边的集合,即省市之间所有专利技术转让关系的集合,若节点i和节点j之间存在关系,则有一条边连接i和j,表示为a ij=1,否则a ij=0,a ij表示省市i对省市j的专利技术转让,a ji反之。W ij网络中边的权重集合,即省市之间专利转让次数的集合,W ij表示i省市对j省市的专利技术转让量,W ji反之。本文考察的是区域间的专利技术转让,不考虑省市对自身的技术输出与技术输入(上述中i≠j)。综上,本文构建的区域专利技术转让网络是有向加权无自环网络。
(三)区域间专利技术转让网络结构分析
将区域间专利转让矩阵及省市地理信息导入Gephi,绘制出2015、2016年的专利转让网络图,如下图1及图2所示。
通过网络的聚类系数、密度、平均度、平均路径长度、直径等多个指标刻画区域间专利技术转让网络拓扑结构特征。2015-2016年技术转让网络整体指标如下表1所示
表1  2015-2016 年技术转让网络整体指标
图1:2015 年专利转让网络结构图
图2:2016 年专利转让网络结构图
综合2015和2016年网络结构特征,得出:区域间专利技术转让网络密度变化不大,聚类系数有所上升,平均路径长度有所降低,反映出网络的小世界特征逐渐增强,存在富人俱乐部现象,技术转让路径变短,直径扩大,说明网络节点辐射范围变广,技术转让速度有所提升。
四、基于ERGM的区域间专利技术转让网络结构形成及演化动因
(一)ERGM模型引入
(1)基于ERGM的形成动因模型
ERGM模型是通过把统计量用参数加权求和对图指派的一个概率其主要用来研究网络形成的来源与原因,一般形式为:
(2)
其中
,是观测网络中A型结构或属性的参数估计,通过模型拟合获得
;是对应结构A的网络统计量;k是常量,它保证随机变量Y的样本空间发生的概率总和为1。本文应用马尔可夫链蒙特卡罗极大似然估计法(Markov chain Monte Carlo maximum likelihood estimation,MCMC-MLE)估计模型参数,通过比较相应随机图与观测图的分布来修正参数值,不断迭代直到最终模型收敛停止。
构建区域间技术转让权重矩阵。设X为随机网络的条件集合,x为真实技术转让网络的统计量。ERGM 模型中第t年在X=x条件下Y拟合真实技术转让网络中y的概率为:
(3)为衡量各自变量的相对重要性
,设为第t年内生变量的估计参数,m为内生变量个数,
为每个内生变量的结构统计量;βt为第t年外生变量的估计
参数集合
;,q为外生变量个数。
(2)基于tERGM的演化动因模型
ERGM时序模型用于研究影响网络演化的动因。考虑任意时间点t,较短时间增量dt>0和X(t)=x的任意图。动态化过程可以通过设定建立和终止任意一条单个关系的概率来定义。若x ij=0(时刻t从节点i到节点j没有关系),那么关系(i,j)在这个短时间内的建立的概率就可以近似的表达为:
(4)
若xij=1(时刻t从节点i到节点j有关系存在),那么这种关系在很短时间内的建立的概率就可以近似的表达为:
(5)其中X(t)定义为一个变化过程
,为内生变量的估计参数,β为率参数。在构建ERGM时序模型后,马尔可夫链蒙特卡罗极大似然估计
法(MCMCMLE)用来估计变量参数。使用Statnet获得重要内生及外生变量的参数估计值,并用此分析区域间专利技术转让网络。
(二)ERGM及tERGM假设
基于现有文献研究结果[3],[4],[5],[6],[7],[8],[9],,本文提出如下七个假设,构建ERGM模型。假设-变量表如表2所示。
假设一:区域间技术转让关系倾向于互惠性。
假设二:区域之间技术转让更倾向于封闭在传递形式中(形成三角形)与网络中存在连通性。
假设三:地区研发经费支出R&D占GDP比重对区域间技术转让网络演化产生影响。第t年省份i的R&D投入强度:
假设四:经济圈临近性对区域间转让产生推动作用。
同属经济圈的省份间更易发生技术转让,若技术转让双方省份i与j同属一个经济圈,则取值为1,否则为0,构建省份间经济圈矩阵。
假设五:规模以上工业企业新产品项目数和新产品研发经费对区域间专利技术转让具有推动作用。考虑到研究区域间专利转让网络,故将2015、2016年该两项指标采集的数据处理成区域间差值矩阵的形式,考虑方向。
假设六:省市性别比例对区域间技术转让网络演化产生影响。
第t年省份i的省市性别比例为该省市男性数量Men i,t与女性数量Women i,t的比值:
假设七:省市高校数量对区域间技术转让网络演化产生影响。
第t年省份i的高校数量为Schnum i,t。
(三)基准模型选择
一个好的模型应该能够聚合且能够和观察值拟合。为了到理想的模型,本文采用逐步添加变量的方式进行模型优化,以2016年的数据为基础进行了多次试验,最终确定了基准模型,如表3所示。
表2  假设-变量表
表3  基准模型
(四)ERGM模型拟合
1、ERGM截面模型拟合结果
根据上文基准模型已经确定的内生变量及外生协变量,对2015年区域间专利技术转让网络进行拟合估计,其结果如下表4所示。
由表4结果分析出:结合显著性指标和权度指标,发现:2015年,弧、互惠性、多重-2-路径、三角形趋势、R&D比重、经济圈邻近性、性别比例和高校数量这些变量对于该网络结构形成的影响效果显著。2016年相比2015年,互惠性估计值升高,说明区域间更可能进行互惠性交流;多重2-路径估计值为正值且升高说明多连通结构趋于明显;三角形趋势估计值为正值且升高,说明网络中高度闭合及多个三角形聚类增加;R&D比重、经济圈邻近性和高校数量估计值升高均说明其对网络演化的影响增强。性别比例估计值不变,说明其对网络演化影响无大变化。特别地,2015年的弧为显著正值,2016年的弧为显著的负值,结合2015年区域间专利转让占比高于2016年且2015年的专利转让网络密度较大,可知2015年的专利转让网络不属于稀疏网络,因此弧的值为正。
2.tERGM模型拟合结果
王伊锋
依据基准模型进行2015-2016年区域间专利技术转让网络tERGM 模型拟合,其估计结果如表5所示。
由表5可知:
(1)弧:该估计值为正且显著性高(0.1%水平),说明区域间建立转让关系的代价大。
(2)互惠性:该估计值显著性高(0.1%水平)但为较小正值,说明区域之间目前较少相互转让,但可能进行互惠性交流,假设一成立。
(3)多重2-路径:该变量显著性较高,说明对网络结构演化的影响比较显著,但该估计值为负,说明演化过程中,多连通的结构并不明显
。(4)三角形趋势:该估计值为为负显示网络中没有高度闭合及多个三角形聚类,但该变量对网络结构演化的影响比较显著。(2)和(3)证实假设二不成立。
(5)R &D 比重:其估计值为正值且显著性很强(0.1%水平),说明R&D 比重对专利技术转让网络演化产生影响,并且其上升促进区域间专利技术转让,假设三成立。
(6)经济圈邻近性:其估计值的显著性很强(0.1%水平),说明经济圈临近对区域间专利技术转让有推动作用,假设四成立。
(7)规模以上工业企业新产品项目数和规模以上工