随着工业互联网应用的快速推广,工控系统与互联网信息交换越来越普及。协议解析广泛应用于入侵检测、防火墙、安全审计、态势感知等安全防护产品,是提高和保障工业互联网安全发展的重要基础。由于工控领域网络协议数量众多,协议解析的应用需求快速增长,同时具有软件开发经验和工控协议知识的复合型人才数量稀少,工控领域协议解析器的开发面临着沟通成本高、开发时间周期长、人工成本高、代码开发重复度高等问题。 为了解决工控领域协议解析器开发面临的问题,本文设计了工控协议消息格式领域专用语言PMFDSL(Protocol Message Format of Domain Specific Language),开发了一套工控协议解析代码自动生成系统,并以Modbus TCP和S7comm为例,验证了技术方案的可行性和高效性。本文的主要工作内容和贡献包括以下三个方面: (1)本文调研了Modbus TCP、S7comm、CIP等典型工控协议,分析了工控协议的字段特征,对工控协议消息格式进行建模,设计了可读性高,易用性强的工控协议消息格式领域专用语言。实验证明,PMFDSL能够高效地描述Modbus TCP、S7comm等工控协议,该语言描述Modbus TCP和S7comm的行数大约为所生成C++代码的30%,PMFDSL比C++等通用编程语言具有更好的易用性;(2)本文设计和开发了一套工控协议解析代码自动生成系统。该系统通过解析PMFDSL协议描述定义,将该协议描述定义高效地翻译成C++语言的协议解析器代码,实现了协议解析器代码自动生成,缩短了协议解析器开发的时间周期、降低了人工成本。以Modbus TCP数据包解析为例,PMFDSL所生成的协议解析器比Nail所生成的协议解析器大约快40%,PMFDSL具有更高的解析效率;(3)本文设计并实现了工控协议消息格式领域专用语言的语法检查、语义检查以及语法错误恢复功能。与Nail等语言相比,PMFDSL不仅可以对语义和语法错误进行检查,而且还支持单次检查出多个语法错误,提升了协议描述文件编写效率。
研究背景FDA (Food and Drug Administration)对递交的临床数据要求遵从临床数据交换标准协会(CDISC, Clinical Data Interchange Standards Consortium)标准的研究数据表格模型(SDTM, Study Data Tabulation Model)和分析数据模型ADaM ...
详细信息
研究背景FDA (Food and Drug Administration)对递交的临床数据要求遵从临床数据交换标准协会(CDISC, Clinical Data Interchange Standards Consortium)标准的研究数据表格模型(SDTM, Study Data Tabulation Model)和分析数据模型ADaM (Analysis Data Model)。CDISC提供了一整套用于临床试验的研究数据和元数据采集、交换、提交和存档的标准,包括临床数据获取协调标准(CDASH)、实验室数据模型(LAB)、操作数据模型(ODM)、研究数据表格模型(SDTM)、分析数据模型(ADaM),以及受控术语(Controlled Terminology)等。行业内已经开始逐渐应用CDISC标准:包括CDASH用以数据收集,SDTM用以数据交换和ADaM用以数据分析。应用CDISC标准,可以缩短研究时间和提高数据质量。当前,从CDASH数据,到生成SDTM和ADaM数据,还多处于手工处理阶段。自动化工具还不完善,没有成熟的商业工具。在临床试验中,如果收集的数据使用CDISC的CDASH、SDTM和ADaM后,很多东西可以重复使用:CRF的设计,数据库的设计,报表生成工具等。因此,我们可以基于CDISC标准,1)可开发相应的工具;2)尽可能使用现有的工具。研究内容、方法本研究从实际出发,以一个简单的临床研究方案入手,以此设计病例调查表(CRF),原始CDASH数据,开发配置文件和转换程序,来自动化生成SDTM数据和ADaM数据。并且,如果原始数据集不是采用的CDASH标准,而是用户自己的标准,将对其进行变量映射,预处理成CDASH标准。整个转换流程标准化,且力求通用性(变量名称,取值)强,能用于多种类型的研究。通用性:像常见的人口统计学,既往史,体格检查,不良反应,合并用药,生命体征,以及试验完成情况小结等,结构类似,都是可以标准化的,所以是通用的。以期提高递交数据的质量,减少生成数据的时间和花费。节省的时间可以用来放在设计方案和分析数据上。研究结果以常见的口腔护理领域的平均牙龈炎指数和平均牙菌斑指数为主要的有效性指标,草拟了一份临床方案。以此方案为基础,设计了病例调查表(CRF),并模拟了原始数据(包括RAW格式和CDASH格式)。对病例调查表还做了CDASH变量标注和SDTM变量标注。结合电子表格格式的配置和映射关系文件,开发了一系列的SAS宏。从CDASH转换为SDTM,和从SDTM转换到ADaM,有开发相应的配置文件和映射关系文件,用SAS程序读取这些配置文件和映射文件,将原始数据集逐步转化为SDTM和ADaM数据格式。配置文件和映射关系文件的开发,基于CDASH、SDTM和ADaM格式的特点做了需求分析,对每种变量或数据结构进行了分析。基于这些需求分析而做了映射关系文件的设计。结论临床试验中递交数据自动化生成系统将能够在短时间内,通过用户在电子表格中的设定,从原始RAW数据(CDASH/非CDASH),快速生成SDTM和ADaM数据。CDISC标准的数据格式,其变量名称固定有规律,数据结构相对固定,可读性和一致性好,方便统计分析,能够为审阅者节省时间。其设计特点:1) 以原始RAW数据(标准化的CDASH,或非CDASH标准的数据)为基础;2)自动化生成SDTM和ADaM数据;3)数据规范符合FDA的CDER部门的合规要求;4)对用户友好,微软的电子表格Excel软件人人会用,因而简单易用,对不熟悉CDISC标准的用户也能快速上手。
暂无评论