
产业技术前沿探测的新视角.docx
6页产业技术前沿探测的新视角 摘要:探测产业技术前沿,对国家抢占世界科学技术与产业开展的制高点具有重要的理论意义和现实意义选择经过专家评审的、有培育价值的、代表未来产业开展方向的、正在美国能源部科学用户设施进行培育的工程数据,对先进科学计算研究方案培育的工程进行了产业技术前沿主体和产业技术前沿主题探测,揭示了高产的工程来源机构和前沿主题与以往基于科学论文或专利文献的产业技术前沿探测研究相比较,选择美国科学用户设施正在培育工程统计数据探测产业技术前沿的研究,更具新颖性和聚焦性,既是补充计量学〔Altmetrics〕研究领域的一个尝试,又是对科学计量学理论和方法的丰富2021.05.0030引言探测产业技术前沿,对国家抢占世界科学技术与产业开展的制高点,对科研机构部署科技人力资源和研发方向,具有重要的理论意义和现实意义现有的基于数据分析探测产业技术前沿的研究成果,国内外学者多是采用科学论文数据或专利文献,在以往的产业技术前沿相关研究过程中,学者们主要采用了以下的方法和数据第一,通过对科学论文进行分析,探测技术开展前沿或新兴技术:基于科学网〔webofscience〕数据,用系统的方法设计检索策略,探索新兴技术【1】;运用科学计量学叠加绘图方法获取新兴技术开展的战略情报【2】;通过分析科学出版物数量增长、科学合作开展趋势和科研机构变化状况等定量数据结合定性分析,探测某一技术领域的前沿开展【3】;对科学论文进行关键词分析和引文分析,探测新兴技术开展趋势【4】等。
第二,对专利数据进行分析,测度和预测产业技术开展前沿:利用专利数据结合科学论文数据,预测新兴技术开展趋势【5】;通过科学-技术-产业关联指标探测新兴技术的核心竞争力和未来产业化前景【6】;选择专利数据中的技术关键词,预测产业技术开展前沿【7】;通过专利分析的监督学习方法,预测新兴技术的开展趋势[8]等此外,还有运用技术与经济分析相结合的方法,预测产业技术开展的前沿[9];借助定向距离函数方法回忆世界产业技术开展的前沿[10];采用技术路线图方法识别和描述产业技术前沿[11]等美国能源部〔U.S.DepartmentofEnergy,简称DOE〕官方网站提供的科学用户设施培育工程统计数据为我们探测产业技术前沿提供了一个新的视角作为一个政府科学机构,美国能源部在美国经济创新开展中发挥着重要作用,将科学创新放在优先开展的地位,并将其视为美国经济繁荣的基石[12]美国能源部科学办公室〔DOEOfficeofScience,SC〕通过科学用户设施方案〔ScientificUserFacilityProgram〕,推动美国走向世界科学与创新的最前沿科学用户设施工程是联邦政府资助的、旨在推动科学技术进步开展的设施,科学用户设施对所有感兴趣的潜在用户开放,不管国籍和机构,科学用户设施为研究者提供现代科学开展最先进的工具,包括加速器、对撞机、超级计算机、光源设备和中子源等,和用于纳米世界、环境与大气研究的设施[13]。
工程方案办公室〔ProgramOffice〕负责设施的整个流程管理,从概念模型、设计、建设运营、终止甚至停运等[14]核心工程方案办公室有六个:先进科学计算研究〔AdvancedScientificComputingResearch,ASCR〕,根底能源科学〔BasicEnergySciences,BES〕,生物与环境研究〔BiologicalandEnvironmentalResearch,BER〕,聚变能科学〔FusionEnergySciences,FES〕,高能物理〔HighEnergyPhysics,HEP〕,核物理〔NuclearPhysics,NP〕与科学论文或专利文献相比较,DOE科学用户设施正在培育的工程,可能仅仅是一个概念〔concept〕或者想法〔idea〕,也可能是一个正在研究中的科学问题,或者是一个已经完成的科学成果,总之用户设施培育工程的显著特征就是它们有培育的价值、有开展潜能、经过专家评审、被认为能够助力美国产业技术领先世界已有的研究成果是本研究的重要根底本文将选择一个崭新的视角,即利用美国能源部科学用户设施培育工程的统计数据,进行产业技术前沿的探测研究我们可以合理地推断:那些经过专家评审、被认为有培育价值、代表未来产业开展方向的、正在美国能源部科学用户设施进行培育的工程,它们应该更能够代表产业技术开展的前沿。
1数据来源与研究方法标准化的、及时更新的科学论文数据库与专利文献数据库,曾经为学者们进行产业技术前沿的探测研究提供了方便、可靠的数据来源但随着科学技术突飞猛进的开展和网络信息技术的普及,传统的科技文献提供的科技情报信息已不能适应全球科学技术和产业飞速开展的需求,其中一个重要的缺乏之处就在于其比较严重的滞后性以SCI论文为例,从到评审到出版,常常需要经历一年半到两年甚至更长的时间周期;以专利文献为例,从专利申请文件的递交,到形式审查,再到实质审查,一直到最终的授权,也常常需要经历两年至三年的时间,甚至更长的四年至五年的时间这样的出版周期,当读者读到这些科技文献的时候,它们根本上已经不再是前沿的科技成果了与以往的科学论文或专利文献数据相比较,本文选择的美国能源部科学用户设施培育工程数据,从时间上看更具有新颖性,可以仅仅是个概念或想法;从范围上看,更聚焦于培育有开展潜力的产业技术因此,利用美国能源部科学用户设施培育工程的数据进行产业技术前沿的探测和分析,具有更强的学术价值和实践意义本研究数据来源于美国能源部官方网站[15]我们选择2021年科学用户设施工程统计数据中的“先进科学计算研究〞〔AdvancedScientificComputingResearch,简称ASCR〕方案培育的全部11101个工程数据,对其进行产业技术前沿主体分布和产业技术前沿主题分布分析,以此识别先进科学计算领域的前沿领先机构和前沿热点主题。
ASCR項目的使命是发现、开展和利用计算与网络能力分析、建模、模拟和预测对美国能源部能源产业技术开展重要的复杂现象[16]这个方案的一个特别挑战是满足新兴计算系统和其他新颖计算架构的科学潜力,这将需要对当今的工具和技术进行大量的重大改进,以实现对百万兆级科学开展数据的顺畅传输产业技术前沿主体分布的分析,我们选择高产的“工程来源机构〞和“工程培育的用户设施及其所属东道主机构〞两项指标来进行分析产业技术前沿主题的分布,我们选择荷兰莱顿大学科学技术研究中心〔CentreforScienceandTechnologyStudies,缩写为CWTS〕科研人员Waltman与VanEck共同开发的可视化软件VOSviewer进行VOSviewer是一款主要应用于科学文献计量网络图谱绘制的软件工具,包括络、研究者网络等,可视化网络绘制的方法包括作者共被引分析、文献耦合分析、作者合作分析等具体方法VOSviewer也可以应用于文本挖掘,通过从科学文献文本中提取重要主题词的方法,绘制主题词网络,从而实现其文本挖掘的功能我们选择“关联强度〞〔associationstrength〕算法来进行产业技术前沿主题分布的主题词可视化分析,见公式〔1〕。
其中SA〔Cij,Si,Sj〕表示工程i和工程j的相似度,Cij为工程i和j的共现频次,Si和Sj为工程i和j各自出现的频次常见的计算共现矩阵的方法有Jaccard系数、Cosine系数等,但是VanEck与Waltman通过大量的实证研究和比较分析[17,18],认为总体来看存在着两种重要的相似性测度理论与方法,即集论测度〔set-theoreticmeasures〕和概率测度〔probabilisticmeasures〕;Cosine、inclusionindex和Jaccard三种都是集论测度方法,而关联强度〔associationstrength〕那么属于概率测度方法;在科学计量学共现分析研究中,选择关联强度的测度指标比Jaccard和Cosine更适宜2产业技术前沿主体分布我们选择美国能源部科学用户设施培育工程的来源机构,即“工程来源机构〞和“工程培育的用户设施及其所属东道主机构〞两项指标来进行产业技术前沿主体分布的分析高产的工程来源机构,代表他们拥有“先进科学计算研究〞领域强大的研究实力和全球领先技术水平,这些机构将是未来先进科学计算领域相关技术产业化的先行者与前驱者表1列出了“先进科学计算研究〞领域、美国能源部科学用户设施培育工程高于70项的“工程来源机构〞。
工程来源机构的前三名全部是美国能源部所属的国家实验室其中排在第一位的工程来源机构是劳伦斯伯克利国家实验室,共有855个工程,占总数的比例为7.70%;阿贡国家实验室有790个用户工程在ASCR方案中培育,占总数的7.12%,排在第二位;橡树岭国家实验室有707个用户工程在ASCR方案中培育,占总数的6.37%来源于这三个实验室的用户工程分别都超过了700项,远远高于其他的来源机构纵观表1中的26个高产来源机构,12个是国家实验室,11个是大学,1个是美国能源部的联合基因研究所,1个是英特尔公司,最后1个是美国国家大气研究中心由此可见,先进科学计算方案培育的工程,主要来源于美国国家实验室和研究型大学图1显示了培育ASCR方案工程的用户设施及其所属国家实验室培育ASCR研究方案工程的科学用户设施共有4个:其中“国家能源研究科学计算中心〞该科学用户设施培育的工程数量最多,7205项,占总数比例为64.90%,该用户设施隶属于劳伦斯伯克利国家实验室;排在第二位的科学用户设施是“阿贡领先计算设施〞,隶属于阿贡国家实验室,共培育了2090项,占总数比例为18.83%;排在第三位的科学用户设施是“橡树岭领先计算设施〞,隶属于橡树岭国家实验室,共培育了1743个工程,占总数比例为15.70%;最后一个科学用户设施是“能源科学网络〞,隶属于劳伦斯伯克利国家实验室,培育了63个工程,占比为0.57%。
第一个科学用户设施“国家能源研究科学计算中心〞和第四个科学用户设施“能源科学网络〞,同隶属于劳伦斯伯克利国家实验室,共培育了7268个用户工程,占ASCR工程总数的65.47%3产业技术前沿主题分布我们选择“先进科学计算研究〞方案培育的全部工程11101项的工程名称〔Title〕,工程名称虽然字数不多,但其反映了工程的核心主题,是对一个工程的高度概括和凝练[19-21]我们将所有工程名称汇总为一个文本体,采用VOSviewer软件分析工具,选择关联强度〔associationstrength〕算法,对该文本体的主题词〔term〕进行频次和可視化分析,绘制了图2“ASCR方案培育工程主题词图谱〞图2显示,先进科学计算研究ASCR方案培育工程的主题分布状况:比较集中的、位于图谱中心位置的一些技术主题词,多为反映了应用领域或通用研究方法的主题词,比方模拟〔simulation〕、能源〔energy〕、超大规模〔extremescale〕、可视化〔visualization〕、数据分析〔dataanalysis〕、终端站〔endstation〕等;长长圆弧上的主题词,更多地揭示了先进科学计算研究ASCR方案培育工程的前沿热点,比方宇宙微波背景数据分析〔cosmicmicrowavebackgrounddataanalysis〕、下一代超级计算机体系结构〔nextgenerationsupercomputerarchitecture〕、大型地下氙暗物质实验〔largeundergroundxenondarkmatterexperiment,频次为86〕、软硬件一体化设计〔codesign〕、重子振动分光镜勘测〔baryonoscillationspectroscopicsurvey〕、先进光源〔advancedlightsource〕、暗能量调查超新星搜索〔darkenergysurveysupernovasearch〕等。
表2列出了ASCR方案培育工程的频次高于100次的高频主题词。
