★ “智能化矿山数据融合共享规范”专栏 ★
徐金陵1,孙长春1,樊九林2,王致兵3,黄 金1,汪 莹4,刘 婵4,胡而已5,张冬阳5,陈帅领1,张伟阔6
(1. 华电煤业集团数智技术有限公司,北京西城区,100035;2.华电煤业集团有限公司,北京西城区,100035;3.中国华电集团有限公司,北京西城区,100031;4.中国矿业大学(北京)管理学院,北京市海淀区,100083;5.应急管理部信息研究院,北京市朝阳区,100029;6.华电电力科学研究院有限公司,北京丰台区,100039)
摘 要 智能化矿山数据融合共享成为煤矿智能化建设的关键,而数据分类与编码是智能化矿山数据融合共享的基础。针对智能化矿山数据分类与编码,研究了适用于智能化矿山的数据分类与编码方法。阐述了智能化矿山数据分类和数据编码的方法,介绍了智能化矿山数据的分类,并以安全类主题域分组为例详细展示了各级数据分类与编码的结果。智能化矿山数据分类与编码方法的研究,为智能化矿山数据融合共享规范体系的建立提供了基本依据和方法体系。
关键词 智能化矿山;数据融合共享;数据分类与编码;数据编码方法;IDEF0业务建模方法
分类编码已成为煤矿基础信息标准化建设与煤矿基础数据库数据组织、存储、管理和交换的共同基础,也是实现数据共享与交互操作的必然要求。关于煤矿数据分类与编码,我国学者很早便开始关注。1999年,张振飞等[3]提出了一个基于适于区域矿产资源定量评价系统的地学信息分类代码体系思路,初步讨论了如何实现分类编码的科学性、系统性及实用性。煤矿地质测量信息方面的数据分类与编码受到学者重视,在地学信息分类代码基本思路的基础上,继续深入研究,探索数据分类和编码技术[4-7]。随着信息化的不断发展,数字矿山、智慧矿山概念的提出,人们逐渐关注煤矿信息化标准体系,潘涛[8]等提出了数字化煤矿信息化标准体系的总体框架,探讨了数据元、元数据的概念及描述方法,给出数据分类方法及实例;周琳[9]和万娜等[10]对智慧矿山进一步提出了数据分类与编码思路,并对智慧矿山元数据识别模型进行了初步探索。近年来煤矿智能化标准体系与建设成为煤炭行业关注的焦点,智能化矿山数据的融合共享成为行业发展的必然趋势。但智能化煤矿各子系统缺乏统一的通信标准,各系统信息难以集成是当前智能化矿山数据融合共享面临的瓶颈,煤矿各子系统智能化水平发展迅速,亟需制定相关标准指导、规范相关功能和安全要求,同时进行分类分级建设[11]。
现有智能化矿山数据分类和编码方法尚存一定局限性。首先,由于尚未形成统一的标准,导致信息孤岛的存在,不能对智能化矿山业务数据进行唯一编码,存在不同业务系统之间数据重复编码问题;其次,数据覆盖面不足,无法覆盖支持智能化矿山各种智能设备的场景数据;此外,数据存在滞后性,存在对当前智能化矿山智能设备数据描述不清、造成歧义等问题。因此随着智能化矿山智能化水平的快速发展,煤炭行业亟需制定一套与当前智能化矿山智能场景相适应的数据分类与编码体系。王国法等[12]提出智能化煤矿分类分级体系需根据国家、社会、行业对智能化煤矿认识、要求的提高不断进行修订完善;谭章禄[13]从3个层面分析了智能化煤矿数据归类与编码的目标要求,认为智能化煤矿宜采用“基准?傆b扩展”两阶段的数据归类思路,并提出了数据归类与编码需关注确定业务域、确定数据域、识别对象类、抽取对象类属性、定义数据元5个关键步骤。上述研究成果为智能化矿山数据分类编码指明了方向,提供了良好的前期积累,对于本研究的开展具有重要的参考价值。
笔者结合智能化矿山数据融合共享活动特点,提出面向智能化矿山数据共享活动的数据分类与编码方法,并基于该方法对智能化矿山数据进行分类并编码,旨在为智能化矿山数据共享工程各建设单位提供指导和规范,为各种智能化矿山数据的采集、治理和应用相关的数据分类与代码规范提供参考,进而推动智能化矿山数据的融合与共享。
智能化矿山数据分类是智能化矿山数据编码的基础,为准确实现对智能化矿山业务数据的编码,首先需要对智能化矿山数据进行精准分类。在智能化矿山数据及其关联数据的分类过程中,应遵循科学性、唯一性、稳定性、系统性、可扩展性、兼容性等基本原则。智能化矿山数据分类的整体思路梳理如图1所示。
图1 智能化矿山数据分类的整体思路
首先要确定智能化矿山数据分类的理论依据,进而构建层次结构划分的数据模型,为智能化矿山数据类目隶属关系的划分提供依据与指导;然后依据具体的数据元识别模型,从业务、系统、未来智能化应用场景3个方面确定业务对象及其属性,以确定整个分类体系;最后完成对智能化矿山所有数据的分类。
其中,智能化矿山数据分类理论依据包含基于业务对象的划分、基于现有系统对象的划分以及基于智能化矿山未来应用场景的划分3个方面。一是基于业务对象进行划分是以智能化矿山现有业务为基础,辅助采用数据建模等方法,规范表达业务流程分析、数据流程分析,实现智能化矿山对象全识别、属性全抽取、关联全建模,面向业务过程或职能范围进行数据分类,以实现对智能化矿山现有业务数据的准确分类;二是基于现有系统对象进行分类是在依据业务对象分类的同时,应对现有信息化应用平台、信息系统、系统功能以及各系统功能所需要的数据支持,进行数据源追溯,从而与基于业务对象的分类方法相互补充校验,并根据数据现场应用特征对数据分类进行完善;三是基于智能化矿山未来应用场景进行数据分类是考虑当前智能化矿山建设基础,面向智能化矿山未来应用场景,构建完备的智能化矿山数据体系,智能化业务系统应集成系统功能以及各系统功能需要的数据支持,追溯现有数据源,对数据分类进行校验和补充。
在对智能化矿山数据分类进行设计时,将IDEF0和UML建模方法结合起来,自上而下,对智能化矿山的业务进行全面分析,首先运用IDEF0业务建模方法,建立智能化矿山业务模型,对智能化矿山的生产经营活动进行分解,将其划分为最小业务单元,以此为依据,再运用UML建模方法,分析各最小业务活动的对象和属性,从中提取数据元。
1.2.1 IDEF0业务建模方法
智能化矿山数据分类采用系统工程建模工具IDEF0,自上而下,面向业务属性,对智能化矿山业务域进行层次结构识别和划分,最终识别出最小业务单元。
IDEF0建模的主要元素是由方盒和箭头组成,如图2所示,方盒代表完成某种功能的活动,箭头表示活动所需或活动产生的真实信息或对象,IDEF0基本功能活动由活动、控制、机制、输入、输出5个元素组成,控制是该活动执行的机制和条件,机制是执行活动的人或设备[14-15]。
图2 IDEF0基本功能活动
IDEF0方法采用自顶向下逐层分解的方式来构建系统的功能模型。根据智能化矿山数据分类理论依据,面向业务属性,对智能化矿山业务域进行层次结构识别和划分,将智能化矿山数据确定为包含主题域分组、主题域、业务对象、数据实体和属性5个层次的层次架构,从而确定其类目的隶属与关联关系。
1.2.2 UML建模方法
UML立足于对事物的实体、性质、关系、结构、状态和动态变化过程的全程描述和反映。作为一种建模语言,UML有严格的语法和语义规范。UML采用一组图形符号来描述软件模型,所描述的软件模型,可以直观地理解和阅读,由于其具有规范性,所以能够保证模型的准确、一致。
UML建模方法是用来精确识别并提取智能化矿山中数据元的系统性方法,智能化矿山数据分类采用面向业务对象、结合现有信息系统分类方法相互补充校验,同时考虑智能化矿山未来应用场景对分类进行完善,基于此构建智能化矿山数据分类体系框架。在将矿山各业务划分为业务单元的基础上,采用UML数据建模方法,通过UML建模方法中的活动图、顺序图和类图,提取对象和属性,从中逐层识别和提取出数据元。
1.2.3 基于IDEF0和UML建模方法
IDEF0建模是智能化矿山业务数据进行系统分类的有效方式,UML建模是基于IDEF0识别出的最小业务单元进一步分析最小业务单元的属性、关系、结构、状态等的一种建模语言。比如,基于IDEF0识别智能化矿山最小业务单元,如图3所示,A0为顶层图,表示智能化矿山业务,自顶向下分为A1图、A2图、…、An图,分别表示矿山的各项业务;基于A1图管理业务细分,分为A11图、…、A16图,分别表示管理业务的人、财、物、产、供、销6方面;基于A11图细分为A111图、…、A11n图;基于A111图继续对人事管理细分,分为A1111图、…、A111n图,从而识别出智能化矿山业务下管理业务的所有最小业务单元。然后按图4中UML建模方法,对每个最小业务单元的属性、关系等进行识别,以提取出其中涉及到的所有数据元,这是进行数据编码的最小数据单元。
图3 IDEF0建模实例
图4 UML建模实例
智能化矿山数据编码是在智能化煤矿数据分类体系的基础上,对智能化矿山各层级数据进行系统性编码的过程。智能化矿山数据编码应遵循唯一性、匹配性、可扩充性、简洁性等基本原则,编码方法宜采用层次编码方法[16]。智能化矿山层次编码格式如图5所示。
图5 智能化矿山层次编码格式
根据数据结构模型确定数据分类的层级结构为主题域分组、主题域、业务对象、数据实体以及属性5个层次,在此基础上对智能化矿山数据进行编码。其中,主题域分组使用3位字母表示,用MJA表示井工煤矿基础类数据,MJB表示井工煤矿生产类数据,MJC表示井工煤矿安全类数据,MJD表示井工煤矿管理类数。主题域分组的字母代码为中文拼音首字母,第一位字母M为“煤矿”中“煤”拼音首字母,第二位字母J为“井工矿”中的“井”的拼音首字母,第三位字母A代表基础类数据,B代表生产类数据,C代表安全类数据,D代表管理类数据。主题域顺序码使用2位数字表示,业务对象顺序码使用2位数字表示,数据实体顺序码使用3位数字表示,属性顺序码使用4位数字表示。
根据上述提到的智能化矿山数据分类与编码方法,以业务对象、现有系统对象以及智能化矿山未来应用场景3方面为分类依据,采用IDEF0数据建模方法,自上而下对智能化矿山的数据进行分类,形成主题域分组、主题域、业务对象、数据实体以及属性5个层次的分类层级体系。其中,属性的识别提取常采用UML的建模方法。最终将智能化矿山数据分成基础类、生产类、安全类和管理类四大主题域分组,如图6所示。以生产类主题域分组为例,对智能化矿山数据分类最终结果进行阐述,主题域可理解为煤矿生产的各个业务场景,可划分为采煤、掘进、主运输、辅助运输、通风等;以掘进主题域为例,业务对象可理解为掘进业务场景中重要的系统组成及功能模块,可划分为掘进设备、支护系统、运输系统、集控系统等。数据实体可理解为描述业务对象某些业务特征的属性集合。以掘进设备该业务对象为例,根据业务特征的不同可分为掘进机、连采机、掘锚机、盾构机等数据实体。属性用于描述业务对象在某方面的性质和特征。以掘进机为例,属性包括编号、使用单位、型号等静态数据,运行状态、行进方向、截割速度等实时运行类数据以及报警类数据、故障类数据等。
图6 智能化矿山数据分类层次
其他主题域分组分类结果如图7所示。其中基础类主题域分组分为证照信息、机构、地质条件、开采条件、灾害条件和IT基础设施6个主题域;生产类主题域分组分为采煤、掘进、供配电、提升、主运输、辅助运输、通风、压风、供水、排水、降温制冷、选煤、调度管理、生产技术管理、生产计划管理、机电管理和爆破管理17个主题域;安全类主题域分组分为顶板管理、冲击地压防治、火灾防治、瓦斯防治、粉尘防治、热害治理、安全监控、井下作业人员监控、视频监控、通讯联络、风险分级管控、事故隐患排查治理、上级安全检查、不安全行为管理、事故管理、安全培训、职业健康、应急管理和环境保护20个主题域;管理类主题域分组分为人力资源管理、财务管理、审计管理、物资管理、设备管理、运销管理、节能减排管理、科技管理、项目管理、法务管理、综合管理和信息化管理12个主题域。各主题域下均细分业务对象、数据实体与属性。
图7 智能化矿山数据主题域分组及主题域示例
以安全类主题域分组为例,展示智能化矿山数据分类与编码结果。由图5可知,将IDEF0方法和UML方法结合使用,自上而下对智能化矿山数据业务对象等进行识别分类,得到安全类主题域分组分为顶板管理、冲击地压防治等20个主题域。以顶板管理主题域为例,顶板管理主题域编码为MJC01,其可细分为采煤工作面顶板防治、掘进工作面顶板防治、巷道特殊区域顶板防治、采煤工作面支架工作阻力监测、锚杆(索)应力监测、顶板离层监测、巷道围岩变形观测和巷道表面位移监测等8个业务对象,其编码依次为MJC0101、MJC0102、MJC0103、MJC0104、MJC0105、MJC0106、MJC0107和MJC0108。顶板管理分类见表1。
表1 顶板管理分类
主题域业务对象编码业务对象名称数据实体编码数据实体名称顶板管理MJC0101采煤工作面顶板防治MJC0102掘进工作面顶板防治MJC0103巷道特殊区域顶板防治MJC0104采煤工作面支架工作阻力监测MJC0105锚杆(索)应力监测MJC0106顶板离层监测MJC0107巷道围岩变形观测MJC0108巷道表面位移监测MJC0101001采煤工作面顶板基本信息MJC0101002采煤工作面回采基本信息MJC0101003工作面顶板被动支护MJC0101004巷道顶板主动支护MJC0101005巷道顶板被动支护MJC0101006来压期间顶板防治MJC0101007断层等构造带顶板防治MJC0101008冒顶处理MJC0102001掘进工作面顶板基本信息MJC0102002掘进工作面掘进基本信息MJC0102003顶板主动支护MJC0102004顶板被动支护MJC0102005顶板支护效果检验MJC0102006开门口或贯通时顶板防治MJC0102007断层等构造带顶板防治MJC0102008冒顶处理MJC0103001煤巷交叉口顶板防治MJC0103002托顶煤巷道顶板防治MJC0103003断层等构造带顶板防治MJC0103004冒顶处理MJC0104001系统基本信息MJC0104002测点基本信息MJC0104003测点动态信息MJC0104004系统状态信息描述MJC0105001系统基本信息MJC0105002测点基本信息MJC0105003测点动态信息MJC0105004系统状态信息描述MJC0106001系统基本信息MJC0106002测点基本信息MJC0106003测点动态信息MJC0106004系统状态信息描述MJC0107001观测站基本信息MJC0107002观测站动态信息MJC0108001系统基本信息MJC0108002测点基本信息MJC0108003测点动态信息MJC0108004系统状态信息描述
上述8个业务对象可进一步细分为多个数据实体,比如,采煤工作面顶板防治细分为采煤工作面顶板基本信息、采煤工作面回采基本信息、工作面顶板被动支护、巷道顶板主动支护、巷道顶板被动支护、来压期间顶板防治、断层等构造带顶板防治和冒顶处理等8个数据实体,其编码依次为MJC0101001、MJC0101002、MJC0101003、MJC0101004、MJC0101005、MJC0101006、MJC0101007和MJC0101008。
智能化矿山数据分类层级体系中的每项数据实体均具有独特的属性,进而每项数据实体可进一步细分为具体属性,并使用唯一代码进行标识。以采煤工作面顶板基本信息(MJC0101001)这一数据实体为例,对其属性进行识别并编码,见表2。可见,这一数据实体包含采煤工作面名称、采煤工作面编号、工作面标高、顶板关键岩层厚度、煤层顶板与顶板关键岩层垂距、顶板岩层抗压强度、顶板岩石普氏硬度系数、顶板冲击倾向性鉴定结果、伪顶岩层名称、伪顶厚度、直接顶岩层名称、直接顶厚度、基本顶岩层名称和基本顶厚度等14项属性,其属性编码依次为MJC01010010001、MJC01010010002、MJC01010010003、MJC01010010004、MJC01010010005、MJC01010010006、MJC01010010007、MJC01010010008、MJC01010010009、MJC01010010010、MJC01010010011、MJC01010010012、MJC01010010013和MJC01010010014。
表2 采煤工作面顶板基本信息属性编码
属性编码属性名称属性标识符说明MJC01010010001采煤工作面名称CMGZMMCMJC01010010002采煤工作面编号CMGZMBHMJC01010010003工作面标高GZMBGMJC01010010004顶板关键岩层厚度DBGJYCHDMJC01010010005煤层顶板与顶板关键岩层垂距MCDBYDBGJYMJC01010010006顶板岩层抗压强度DBYCKYQDMJC01010010007顶板岩石普氏硬度系数DBYSPSYDXS矿岩坚固性的量化指标MJC01010010008顶板冲击倾向性鉴定结果DBCJQXXJDJ分为无冲击倾向性、弱冲击倾向性、强冲击倾向性MJC01010010009伪顶岩层名称WDHYCMCMJC01010010010伪顶厚度WDHDMJC01010010011直接顶岩层名称ZJDYCMCMJC01010010012直接顶厚度ZJDHDMJC01010010013基本顶岩层名称LDYCMCMJC01010010014基本顶厚度LDHD
结合智能化矿山数据融合共享活动特点,阐述了面向智能化矿山数据共享活动的数据分类与编码的基本原则,提出了智能化煤矿数据分类及编码的方法。智能化矿山数据分类采用IDEF0建模方法,自顶向下对智能化矿山的业务进行全面分析,对智能化矿山的生产经营活动进行分解,将其划分为最小业务单元,以此为依据,再运用UML建模方法,分析各最小业务活动的对象和属性,从中提取数据元。智能化矿山数据编码按照主题域分组、主题域、业务对象、数据实体和属性依次以字母或数字进行编码。本研究所提出的智能化矿山数据分类与编码方法,为智能化矿山数据融合共享规范体系的建立提供了基本依据和方法体系。
参考文献:
[1] 王鹏,胡而已,徐金陵,等. 智能化矿山数据融合共享规范体系研究[J].中国煤炭,2022,48(6):19-27.
[3] 张振飞,马智民. 基于GIS的地学信息分类编码的一种思路[J].地质科技情报,1999,18(3):95-98.
[4] 杜新锋. 煤矿地质测量信息分类编码技术及其应用研究[D].北京:煤炭科学研究总院,2005.
[5] 杜新锋,姜在炳. 基于GIS的煤矿地质测量信息分类编码技术[J].煤田地质与勘探,2007,35(2):20-22.
[6] 周显平. 煤矿地质测量信息的GIS信息分类编码技术研究[J].煤炭技术,2013,32(2):146-148.
[7] 蔡恩琪,魏丽琼,黄丽. 矿区地理信息系统信息编码与数据采集研究[J].中国锰业,2018,36(2):26-29.
[8] 潘涛,王继生,张骐,等. 数字矿山信息标准化基本方法探讨[J].工矿自动化,2014, 40(2):23-26.
[9] 周琳. 面向智慧矿山的数据编码及元数据模型的研究[D].焦作:河南理工大学,2016.
[10] 万娜,景海涛,周琳. 智慧矿山空间数据元数据模型研究与应用[J].测绘与空间地理信息,2018,41(1):40-45,54.
[11] 王国法,杜毅博. 煤矿智能化标准体系框架与建设思路[J].煤炭科学技术,2020,48(1):1-9.
[12] 王国法,庞义辉,刘峰,等. 智能化煤矿分类、分级评价指标体系[J].煤炭科学技术,2020,48(3):1-13.
[13] 谭章禄,王美君. 智能化煤矿数据归类与编码实质、目标与技术方法[J].工矿自动化,2023,49(1):56-62, 72.
[14] WANG Beihai, YAO Chenghan, LI Xuezhong, et al. A green cooperative development method based on the IDEF0 model of manufacturing knowledge: case study of a carton-filling machine[J].Sustainability,2023,15(5):4047.
[15] GODLEVSKYI M D, ORLOVSKYI D L, KOPP A M. Structural analysis and optimization of IDEF0 functional business process models[J].Radio Electronics, Computer Science, Control,2018,3(46):48-56.
[16] 中华人民共和国国家质量监督检验检疫总局. GB/T 7027-2002 信息分类和编码的基本原则与方法[M].北京:中国标准出版社,2003.
XU Jinling1, SUN Changchun1, FAN Jiulin2, WANG Zhibing3, HUANG Jin1, WANG Ying4, LIU Chan4, HU Eryi5, ZHANG Dongyang5, CHEN Shuailing1, ZHANG Weikuo6
(1. Huadian Coal Industry Group Digital Intelligence Technology Co., Ltd., Xicheng, Beijing 100035, China;2. Huadian Coal Industry Group Co., Ltd., Xicheng, Beijing 100035,China;3. China Huadian Co., Ltd., Xicheng, Beijing 100031, China;4. China University of Mining and Technology-Beijing, Haidian, Beijing 100083, China;5. Information Institute of Ministry of Emergency Management of PRC, Chaoyang, Beijing 100029, China;6. Huadian Electric Power Research Institute Co., Ltd., Fengtai, Beijing 100039, China)
Abstract Intelligent mining data fusion and sharing have become the key to the intelligent construction of coal mines, and data classification and coding are the foundation of intelligent mining data fusion and sharing. A data classification and coding method suitable for intelligent mines was studied for intelligent mining data classification and coding, the intelligent mining data classification and data coding methods were elaborated, the results of intelligent mining data classification were introduced, and the results of data classification and coding at all levels were demonstrated in detail by taking the grouping of safety themed domains as an example. The research on intelligent mining data classification and coding methods provides a basic basis and methodological framework for the establishment of a standardized system for intelligent mining data fusion and sharing.
Keywords intelligent mine; data fusion and sharing; data classification and coding; data coding method; IDEF0 business modeling method
中图分类号 TD67
文献标志码 A
移动扫码阅读
基金项目:中国华电集团有限公司技术标准项目(CHDKJ22-01-101)