收稿日期:2020-07-14
基金项目:国家社会科学基金项目 基于技术综合集成的协同知识构建机理与方法研究 (项目编号:20BTQ091);黑龙江省社会科学基金项目 推动知识服务供给侧结构性改革的协同知识构建策略研究 (项目编号:18TQD365); 基于概念格集成情境的协同知识构建及其个性化感知服务实现 (项目编号:18XN063)㊂
作者简介:姜永常(1965-),男,研究员,研究方向:知识管理与服务创新㊂王红露(1972-),女,硕士研究生,研究方向:信息资源管理㊂李浩(1990-),男,博士研究生,研究方向:知识供应链㊂
㊃情报理论与前瞻观点㊃
CKAIC中基于概念格整合异构资源的情境本体构建
姜永常1㊀王红露2㊀李㊀浩3
(1.哈尔滨商业大学商业经济研究院,黑龙江哈尔滨150028;
2.黑龙江大学图书馆,黑龙江哈尔滨150080;
玻璃杯简谱3.哈尔滨商业大学管理学院,黑龙江哈尔滨150028)
摘㊀要:[目的/意义]异构资源蕴含着优势互补的综合情境信息,可以在基于概念格整合的集成情境协同知识构建(CKAIC)中为用户决策制定构建出感知应用的情境本体㊂[方法/过程]这种情境本体构建方法需要依次对异构资源形式背景进行并叠置运算和冗余信息剔除的属性约简㊁协调集判断及其概念格构造㊂[结果/结论]通过情境适配性应用分析可知,经过属性集协调的异构资源概念格能够将其所包含的综合情境精练地转化成用户感知应用的适用性情境本体,为用户决策提供参考的解决方案㊂
关键词:集成情境知识协同构建(CKAIC);概念格;异构资源;情境本体;情境感知;用户决策DOI:10.3969/j.issn.1008-0821.2021.03.004 中图分类号 G250 73㊀
文献标识码 A㊀
文章编号 1008-0821(2021)03-0038-06
ResearchonContextOntologyConstructionBasedonConcept
LatticeIntegratingHeterogeneousResourcesinCKAIC
JiangYongchang1㊀WangHonglu2㊀LiHao3
你别说了
(1.InstituteofBusiness&EconomicResearch,HarbinUniversityofCommerce,Harbin150028,China;
2.Library,HeilongjiangUniversity,Harbin1500801,China;
3.SchoolofManagement,HarbinUniversityofCommerce,Harbin150028,China)
Abstract:[Purpose/Significance]Heterogeneousresourcescontainscomprehensivecontextinformationwithcomple⁃
mentaryadvantages,whichcanbeconstructedacontextontologytouserperceivefordecisionmakingin
collaborateknowl⁃edgearchitectureintegratingcontext(CKAIC)basedontheintegrationofconceptlattice.[Method/Process]Thiscontextontologyconstructionmethodrequiredthejudgmentofattributereductioncoordinationsetofeliminatingredundantinforma⁃tionanditsconstructionofconceptlatticeintegratingcontextbysuccessivelysuperimposingoperationonheterogeneousre⁃sourceformalbackground.[Result/Conclusion]Throughtheapplicationanalysisofcontextadaptation,itcanbeseenthat
theheterogeneousresourceconceptlatticewhichwascoordinatedbytheattributesetcouldtransformthecomprehensivecon⁃textitcontainsintotheadaptivecontextontologyofuser-awareapplicationspithily,andprovideareferencesolutionforus⁃erdecisionmaking.
Keywords:CKAIC;conceptlattice;heterogeneousresource;contextontology;contextawareness;userdecision㊀㊀情境是知识得以有效生产创造㊁组织存储和感知应用的枢纽和灵魂[1]㊂虽然现实世界中的知识
常处于离散分布状态中,造成了知识情境信息的分布异构性,但是却可以在集成情境协同知识构建
83 2021年3月
第41卷第3期
现代情报
JournalofModernInformation
Mar.,2021
Vol 41㊀No 3
never say goodbye 我的女孩(CollaborativeKnowledgeArchitectureIntegrati
ngCon⁃text,CKAIC)中将其整合起来,为用户所感知应用[1-2]㊂尤其是在结构化和非结构化这两种异构资源之中,前者往往蕴含着描述事物持久属性或可完成通用任务的情境信息,后者则往往蕴含着描述事物即时状态特征或可解决具体问题的情境信息,在内容上具有功能互补的优势,需要综合集成才能构建出一个可供用户感知应用的情境本体(ContextOntology),为其决策制定提供一个比较完整的解决方案[3-4]㊂
CKAIC是为应对协同知识管理和集成情境知识管理挑战而提出的一种知识协同构建模式和策略,至今单独加以研究的成果非常少㊂所以,本文试图根据概念格对异构资源进行CKAIC的支持,从面向用户感知应用的情境本体构建视角,来开启CKAIC研究㊂
1㊀CKAIC基于概念格整合异构资源构建情境本体的可行性与方法
㊀㊀主题词表和文本资源具有典型的异构性,能够分别代表结构化资源和非结构化资源用于CKAIC的情境本体构建㊂下面就以其作为概念格整合的对象加以情境本体构建方法分析㊂
1 1㊀基于概念格整合异构资源构建情境本体的可行性分析
㊀㊀基于概念对象与属性关联的知识情境认知机理表明:在面向用户感知应用的情境本体构建过程中,以形式概念分析(FormalConceptAnalysis,FCA)为基础的概念格(
ConceptLattice)不仅能使具有相同对象域或属性域的异构资源得到CKAIC,而且还能够在整合这两大基础性异构资源过程中,通过对其相关概念对象G与属性M之间所存在的I⊆GˑM关系的可视化呈现,构建出各自的形式背景(G,M,I),并在并叠置运算和属性约简中构造出可集成两者综合情境的概念格L(G,M,I),进而转化成满足用户感知应用的情境本体[5-6]㊂情境本体的具体构建过程可按图1模型加以展开㊂
1 2㊀基于概念格整合异构资源构建情境本体的方法来自于异构资源的情境信息具有分布性㊁多源性㊁动态性㊁不确定性等特征[7]㊂KrishnamoorthyS[8]认为要想使这些复杂的情境信息得到建模,就需要对其进行可比较性的数据合并㊁
一致性的关联
图1㊀情境本体构建过程模型
组织和可进化性㊁可扩展性㊁互操作性㊁灵活性㊁
通用性的机器可解释表示㊂而这些情境本体构建需
求的满足,又需要综合集成各种情境建模技术才能
得以实现㊂
在如图1所示的情境本体构建过程中,概念格
可以在FCA中依次利用分词工具ANSJ或ICTCAS
来对异构资源进行规范化数据处理,构建各自的形
式背景,并经过并叠置运算㊁属性约简和协调集判
断后;再运用概念格建格工具ConExpt或LatticeMiner使异构资源形式背景得到统一的概念格构造和情境的综合集成,最后使用本体建模工具Protégé
或KAON对目标概念格加以本体构建,并选用本
体描述语言OWL对编辑好的情境本体给予体系结
构描述[6,9]㊂这样,概念格便能在各种情境建模技术提供的高效组织机制下,不但会使异构资源得到CKAIC,而且构建出的情境本体也会得到有序的语法排列㊁语义互联的导入和属性协调的情境集成,可为用户情境进化推理㊁适应配置㊁感知应用提供明确的概念层次结构㊁类属分明的网络关系㊁内容丰富的语义信息,为CKAIC的情境感知系统建立提供适配性应用的情境本体[10-12]㊂
2㊀异构资源形式背景的构建与属性约简
在异构资源形式背景的统一构建与属性约简中,
文献[13]曾运用矩阵数据处理方式,提出了一种从
属性关系获取㊁真包含关系认定到核心属性断定及
协调集判断的分布式属性约简方法㊂但是,这种属
性约简方法对于高组合性的异构资源形式概念分析
及概念格约简来说,往往因过于复杂而需要付出昂
贵的计算成本㊂为以示简明高效,本文仍一样选择
一组具有相同对象域的‘综合电子政务主题词表“
及其相应网络文本集合作为异构资源的数据处理对
象,并采用文献[14]提出的冗余信息去除方法,对
两者并叠置运算而生成的异构资源形式背景进行更
93
2021年3月第41卷第3期CKAIC中基于概念格整合异构资源的情境本体构建
www.xdqb.net
Mar.,2021
Vol 41㊀No 3
加简练的属性约简和协调集判断,为下一步的异构资源概念格构造和情境本体转化奠定基础㊂2 1㊀异构资源的数据预处理与各自形式背景构建2 1 1㊀结构化资源的数据预处理与形式背景构建
经过领域专家提炼而成的‘综合电子政务主
题词表“是一种清晰㊁简洁㊁权威的分类工具,能够以其特有的 属㊁参㊁分㊁代㊁族 等词间关系,对 信息产业 词族中 软件 的相关主题词进行概念间关系形式化处理,构建出以具体软件系统为形式对象㊁以所属类别为形式属性的结构化资源形式背景K1=(G1,M1,I1),如表1所示㊂
2 1 2㊀非结构化资源的数据预处理与形式背景构建对于以 软件 为主题的相关文本获取,可以
表1㊀结构化资源的形式背景K1
对㊀㊀象属㊀㊀㊀㊀性
系统软件
应用软件
智能软件
智能系统001应用系统010操作系统
根据主题词表中的相关主题词从网络中加以非结构化资源选择㊂然后,选用ANSJ为分词工具,滤掉停用词㊁无意义的特殊符号后,便可基于词间关联构建出如表2所示的非结构化资源形式背景K2=(G2,M2,I2)㊂
表2㊀非结构化资源的形式背景K2
对㊀㊀象
属㊀㊀㊀㊀㊀㊀性
m1源代码
m2系统软件m3应用软件m4研发者m5程序员m6安全软件m7软件分析m8办公软件m9软件架构m10智能软件m11操作系统g1:智能系统11000000010g2:应用系统10000000000g3:软件业01100100000g4:软件工程00000010100g5:开源软件10100000000g6:设计模式00011000100g7:软件开发00111010101g8:Windows00011001001g9:Linux
2 2㊀异构资源形式背景的并叠置运算
异构资源形式背景的合并是其属性约简的前提,
应对K1与K2进行横向合并,合并对象域相同㊁属性项不同的两者形式背景,并叠置运算后的异构资源形式背景可表示为K=(G,M,I),其中G=G1ɣG2,M=M1ɣM2,I=I1ɣI2,如表3所示㊂
2 3㊀异构资源形式背景的属性约简与协调集判断
在异构资源形式背景(G,M,I)中,如果以ga
(a=1,2, ,9)代表对象,以mb(b=1,2, ,11)
代表属性(两者均为有限集合,各对象ga和属性mb名称已在表中分别给出标注);那么,为了剔除其中绝对不必要的属性,以核心和相对必要的属性来精练地反映其综合情境,就需要应用概念格约简技术对形式背景(G,M,I)加以冗余信息去除和属性集协调,以便获得一个适当复杂度和大小的概念格来更加精练地反映情境本体的结构[14]㊂
2 3 1㊀冗余信息去除的异构资源形式背景属性约简定理1[14]:在形式背景(G,M,I)中,若g㊁hɪ
G,且gᶄ=hᶄ,那么g和h便可由单一代表性对象替换;若m㊁nɪM,且mᶄ=nᶄ,那么m和n也可以用一个代表性的属性来代替㊂由此,便可删除形式背景(G,M,I)中的冗余信息,并以约简的属性来简明地反映其概念格和情境本体的结构㊂
在表3所示的异构资源形式背景中,由于mᶄ4
=mᶄ5,(m6ɣm10)ᶄ=mᶄ2,mᶄ9=mᶄ10,所以m4与m5㊁g9与g10可相互替代,而m6与m10则可由m2加以
04 2021年3月
第41卷第3期
现代情报
JournalofModernInformation
Mar.,2021
Vol 41㊀No 3
表3㊀合并后的异构资源形式背景K=(G,M,I)
对㊀㊀象
属㊀㊀㊀㊀㊀㊀性
m1
源代码
m2
系统
软件
m3
应用
软件
m4
研发者
m5
程序员
m6
安全
软件
m7
软件
分析
m8
办公
软件
m9
软件
架构
m10
智能
软件
m11
操作
系统
g1:智能系统11000000010g2:应用系统10000000000g3:软件业01100100000g4:软件工程00000010100g5:开源软件10100000000g6:设计模式00011000100g7:软件开发00111010101g8:Windows00011001001g9:Linux00011001001
合并替代㊂经过冗余信息m6与m10的删除,m4对m5㊁g9对g10的替代,由此获得的属性约简形式背景Kᶄ不仅可以生成一个与原始信息结构同构的概念格,而且还能获得一个精简的属性集,来对异构资源所包含的综合情境加以更简明表示㊂如表4所示㊂
表4㊀属性约简后的异构资源形式背景Kᶄ=(G,M,I)
对㊀㊀象
属㊀㊀㊀㊀㊀性
m1
源代码
m2
系统软件
m3
应用软件
m4
研发者
m7
软件分析
m8
办公软件
m9郎朗老婆
软件架构
m11
操作系统
g1:智能系统11000000g2:应用系统10000000g3:软件业01100000g4:软件工程00001010g5:开源软件10100000g6:设计模式00010010g7:软件开发00111011g8:Windows00010101
2 3 2㊀约简后异构资源形式背景的属性协调集判断在约简后的形式背景Kᶄ中,由于属性m6与m10完全可由m2代替,可确定为绝对不必要的属性;而m4与m5可以相互替代,可确定为相对必要的属性;余下的m1㊁m2㊁m3㊁m7㊁m8㊁m9㊁m11便成为了不可约简的核心属性㊂
在上述对异构资源形式背景的属性进行3类分组约简的基础上,经过领域专家的参与,还能对属性值相同的非绝对不必要属性进行再度协调集判断,将相对必要属性与核心属性划分成{m1,m2,m3,m4,m7,m8,m9,m11}㊁{m1,m2,m3,m5,m7,m8,m9,m11}两个属性协调集㊂这不但使异构资源所含的综合情境得到更加明确的表示,也为其概念格简明构建提供了保障㊂
3㊀CKAIC用户感知应用的情境本体构建异构资源经过形式背景合并和属性约简与协调集判断后,其包含的综合情境还需要再经过概念格构造,才能转化为CKAIC用户感知应用的情境本体㊂
3 1㊀异构资源概念格的构造与集成情境分析3 1 1㊀异构资源概念格构造
本文选择ConceptExplorer中的ConExp-1 3版
14
2021年3月第41卷第3期CKAIC中基于概念格整合异构资源的情境本体构建
www.xdqb.net
Mar.,2021
Vol 41㊀No 3
本作为构造概念格的工具,来对属性约简后的异构资源形式背景Kᶄ加以输入和显示形式的调整;然后根据相应规则将其转换为异构资源的概念格LKᶄ=(G,M,I)㊂计算机可根据输入的形式背景自动生成
如图2所示异构资源概念格Hasse图
图2㊀属性约简的异构资源概念格Hasse图李月华 血恋
3 1 2㊀异构资源概念格集成情境分析
在异构资源融合生成的概念格Hasse图中,每
个节点代表1个概念,概念的内涵㊁外延分别由黑㊁白背影表示㊂将结构化资源㊁非结构化资源与异构资源整合后的概念格相比,可以发现属性约简后的异构资源概念格共有大小不等的15个节点,各个节点的大小和相互间连线的多少代表了每个概念在整个集成情境中的相对比重和语义丰富度,从而体现出 软件 相关概念间具有更加丰富的语义信息㊁鲜明的层次结构㊁隐含的关联关系㊁综合的集成情境㊂
3 2㊀基于异构资源概念格转化的情境本体构建
经过属性约简的异构资源概念格LKᶄ只有将其
所有概念节点及其属性的偏序关系完全对等地映射到CKAIC的情境本体中,才能将其所包含的综合情境集成起来,也才能转化成一个满足用户感知应用的情境本体,并用面向对象G的网络约束形式加以表示㊂
3 2 1㊀异构资源概念格转化成情境本体的规则将异构资源概念格LKᶄ转化为CKAIC的情境本
体,可依次采用如下的映射规则www.dj68
[15]
:①将目标概
念LKᶄ各节点所代表的概念全内涵和全外延地映射为情境本体中对应的概念;②将每个概念的属性ma和对象ga分别映射为情境本体的相应属性和实例;③将概念格LKᶄ中所存在的偏序关系RI=
{(cab)eˑf,eɪa,fɪb}对等地映射为情境本体中概念的分类关系㊂以使处于不同类别中的不同对象分别
得到所属领域的概念定义㊁属性类分㊁功能界定和彼此之间兼容性的类层划分及其具体关联关系建
立,使处于同一类别中的同一对象得到与子类及其所具有属性和功能的进一步关联,使其在与所涉及概念之间进行内涵与外延的全方位扩展,以充实其应有的属性㊁功能和应尽的关联,并基于网络约束加以表示㊂这些均可在图3的情境本体图示中得到进一步说明与验证
图3㊀由异构资源概念格转化成的情境本体
3 2 2㊀CKAIC用户感知应用的情境本体构建
在CKAIC构建感知应用的情境本体过程中,可
以选用本体构建工具Protégé3 4,并遵守上述这种全方位对等的本体映射规则,将存在于目标概念格LK∗中的概念数量及其关联关系㊁层次结构完整地复制到转化而来的情境本体之中,以使异构资源所包含的综合情境也能得到完整的集成,并用如图3所示的网络约束形式加以表示,这就为用户基于图例所示的关系进行感知应用地制定决策提供各种参考的解决方案[4,16]㊂
3 2 3㊀情境本体的适配性应用解析为了验证CKAIC基于概念格整合异构资源构
建情境本体的适配性应用效果,需要将其与单一资源构建的本体进行词重率㊁增词率㊁漏词率对比㊂经过统计分析,整合异构资源构建的情境本体共有9个概念,全部来自于非结构化资源;而结构化资源有3个概念,与异构资源交叉的概念为2个,共有的概念为10个,不属于结构化资源的新概念为
7个㊂由此可以计算出情境本体与结构化资源的词重率为20%㊁增词率约为233%㊁漏词率约为33 33%,
24 2021年3月
第41卷第3期
现代情报
JournalofModernInformation
Mar.,2021
Vol 41㊀No 3