前沿研究丨一种连接材料基因组工程数据库与集成智能制造的新型数据标识编码( 三 )


迄今为止 , DMDII的5年合作协议已取得了一些极其重要的经验、教训和问题 , 其中包括:①通过数字制造改善组织间的运作;②加速数字技术的创新;③多方合作促成创新解决方案;④解决数字制造技术中的“死亡谷”(valley of death)问题 。 类似地 , 计算材料设计中心(Center for Computational Materials Design)是ICME的前身和催化剂 , 由美国国家科学基金会产业/大学合作研究中心于2005年成立 , 是将学术界、行业和政府联系起来的基础 。 该中心可在一系列CPSPP关系中促进计算材料科学和力学的发展 , 其重点是培养和训练计算材料设计的未来生力军 。 良好的数据管理对于后续的数据和知识集成、数据发布过程后相关团体的再次利用以及知识探索和创新都是至关重要的 。
前沿研究丨一种连接材料基因组工程数据库与集成智能制造的新型数据标识编码文章插图
图2 基于网络的材料大数据平台(材料4.0)的概念
鉴于当前大数据及其使用的趋势 , 数据正呈指数级增长 , 其生成方式正变得全球化 , 并正在向新兴市场转移 。 自2011年以来 , MGI已投资超过2.5亿美元 , 用于软件工具的开发、收集和报道实验数据的标准化方法的建立 , 重点大学的计算材料科学中心的建设以及大学与企业在特定应用研究方面的合作等方面 。 一个可持续的数据生态系统由一套机制(即标准)组成 , 这些机制的功能类似于自然界中的溪流 , 它们克服障碍 , 将数据从个体存储库传输到“数据海洋”(ocean of data) , 然后再循环将数据传回个体存储库 , 如图3 (a)所示 。 FAIR原则可以被描述为一个生态系统 , 这个生态系统包括湖泊(各种数据存储库)、水流(相互连接)、渗流(私有数据)、海洋(收集)以及冷凝和降水(再利用) 。 这种运输和循环的驱动力或动力并非基于全部有用数据 。 因此 , 为了揭示数据在空间和时间上可能的联系及其与其他项目的关系 , 应将可操作或有价值的数据标记并与元数据链接 , 这是我们提出通用DID格式的初衷 。
图3(b)总结了当前材料基因组系统的技术、工具、模型和数据库基础 , 并强调未来基于相特性和结构调控显著提升系统功能 。 在材料基因组计划中需要更多的基础投资 , 重点是改进适用参数设计模型和构建高质量的数据库 。 人们认为 , 可扩展的、自动优化的相平衡基础设施(ESPEI)将是建立“数据海洋”和开发具有多种缺陷的多组分材料性能数据库的重要组成部分 。 在CPSPP关系的指导下 , 图3(b)显示了当前所有的计算材料设计方法都是基于处理过的数据 , 而处理过的数据又依赖于原始数据 , ESPEI在这两种数据收集形式中都扮演着重要的角色 , 也就是说 , 可以假定这两组数据孕育了所有其他属性 。 这个概念与图3(a)所示的“数据海洋”的概念非常吻合 。 此外 , 通过结合ICME的级联结构或基于MGI数据库的所谓的集成计算材料设计(ICMD) ,ICME/ICMD机械设计模型可以加速创新 , 最终将研究室理念转化为工业制造 。
前沿研究丨一种连接材料基因组工程数据库与集成智能制造的新型数据标识编码文章插图
图3 ESPEI在“数据海洋”中起着关键作用 。 (a)“数据海洋”的可持续生态系统示意图;(b)基于MGI/MGE的ICME方法应用的方法、工具、技术和数据库的整体层次结构 。 MSV:多尺度变量;TRL:技术准备水平;FLAPW:全势线性化缀加平面波;VASP:维也纳从头算模拟软件包;ESPEI-SQL:可扩展的、自我优化的相位平衡基础结构-结构化查询语言;DICTRA:扩散控制转换;D3D:Direct3D
三、标准系统
(一)DID编码原理及应用
集成物联网相关技术和基于云的技术将促进先进材料的发现和设计 , 并提高研究效率、性能和协作 。 通常而言 , 一系列基于云的工具(统称为物联网)可以集成实验室中的一切 , 从研究协议和设备到发表和数据存储 。 这种数字实验室管理将远远优于当前的科学工作流范式 , 甚至可能产生前所未有的研究方法 , 使今天所做的工作相形见绌 。 例如 , 已经建立的一个名为nanoHub.org的网络平台 , 为全球172个国家/地区的24万多名用户提供计算纳米技术的网络支持 。 由于它是一个科学云 , nanoHub平台的用户可以设计和运行其工具 , 而无需安装或仅需最少的基础设施;因此 , 该平台以用户友好的方式把这些工具提供给全球 。
我们认为 , 以条形码或二维码形式存储的有价值和有用数据的标签将被视为一组数据的指纹 , 并将与云平台链接 。 因此 , 被标记的数据将有可能自动跟踪CPSPP工作流过程中的进展和更新 , 这将加速新型先进材料的发现和制造 , 并提高研究效率、性能和协作(图4) 。 值得一提的是 , 建立这一云平台(即正在开发的www. MGE-TriD.com平台)的优先任务是在摩擦学研究领域发现新型先进润滑材料的协同应用 。 参与这个平台的所有研究人员都可以在全球范围内自发地合作 。 一旦从理论上或实验上生成大量数据 , 云基础设施和低成本存储设备就可以直接支持这个平台 , 并将这些数据推向可能感兴趣的研究人员 。