欢迎访问论文查重发表网站!
经济论文

数据库资源共享存取进行优化的重要意义

【摘要】为了更好的使用科学技术数据库,对数据库资源共享存取进行优化具有重要意义。由于科学技术数据库的开放性,使得数据库资源量较大且多样化。传统的资源共享存取只是针对数据库资源的多少,忽略了其多样化的特点,导致共享存取效率低、误差大的问题。提出基于混沌关联维特征提取的科学技术数据库资源共享存取方法。先融合于主成分分析方法计算出资源样本空间内各个资源结构的方差,组建数据资源结构的标准化变量协方差矩阵,获取不同资源样本的类问矩阵和类内矩阵,通过重构相空间建立了一个资源结构多维的状态空间,促使各个数据几何特征量保持不变,提取资源结构关联维数特征,依据提取的混沌关联维特征对各资源结构特征进行聚类,利用聚类的结果完成对科学技术数据库资源共享存取的优化。仿真结果证明,采用改进方法进行资源共享存取,其存取精度较高,可以有效地提升对科学技术数据库资源存取的使用率。

【关键词】科学技术数据库;资源;共享;存取;优化

l 引言

    随着科技技术水平的不断提升,数据库技术在各行业领域的建设中受到了普遍的应用,并且为科研机构和企业积累了大量在不同数据库管理系统中存储为不同形式的数据[1-3]。在对科学技术数据的资源进行共享存取过程中,在提升资源利用率和降低二次开发成本等目标的驱动下,人们对其相关领域不同机构间共享现有科学技术数据库资源的需求与日俱增。可是由于该类科学技术数据库是在多种应用背景下,且是利用不同数据模型独立设计的,所以其数据资源间存在的资源结构、表示方法等多方面的差异和冲突,这种差异和冲突很容易降低对科学技术数据库资源共享中资源存取的精度和效率[4-6]。在这种情况下,如何有效地进行科学技术数据库资源共享存取成为了科学技术数据库领域亟待解决的主要问题,引起了很多专家和学者的重视,同时也出现了很多好的成果[7]。

    文献[8]提出基于多因素方差分析的科学技术数据库资源共享存取方法。该方法先使用多因素方差分析方法得到科学数据库的数据资源结构特征,根据蚁群适应度概率正则训练迁移法则,确定初始数据资源结构聚类中心,以此为依据完成对科学技术数据库数据资源共享存取的优化。该方法共享存取效率较高,但是存在方法局限性大的问题。文献[9]采用基于深度学习的科学技术数据库资源共享中数据资源共享存取方法。先利用边际Fisher准则描述同类数据资源结构间边界点邻近关系,计算出数据资源结构类间分离性,得到数据资源结构存取的目标代价函数,以此为依据完成对科学数据库资源共享存取的优化。该方法鲁棒性较强,但是采用当前方法进行存取时,无法提取不同类型数据资源特征,存在数据资源共享存取误差大的问题。文献[10]重点研究了基于非线性特征提取的数据资源共享存取方法。该方法先通过线性或者非线性映射,将科学技术数据库资源特征空间映射到低维空间,计算数据资源结构特征的局部权重矩阵,以此为依据完成对科学技术数据库资源共享存取方法的优化。采用该方法虽然存取精度较高,但是存在存取过程繁琐,耗时长的问题。针对上述问题,提出基于混沌关联维特征提取的科学技术数据库资源共享存取方法。仿真结果证明,采用改进方法进行资源共享存取精度较高,可以有效地提升对科学技术数据库资源共享存取的精度。

2 科学技术数据库资源共享存取原理

    在对科学技术数据库资源共享存取过程中,计算出数据资源存取响应函数,得到数据资源结构关联主特征存取时间减弱函数,提取数据资源结构特征,将资源模式中的属性名分别转换为与之对应的目标资源属性名,组建资源共享结构模式间的语义映射关系规则,以此为依据完成对资源的共享存取。具体的步骤如下详述:假设,由ode代表待存取的数据资源,arj代表在存取ode的过程中,数据资源中各个数据资源间的响应函数,A’代表待存取数据资源的关键词属性,”wdef代表两个数据资源间的相似度,则利用式(1)计算出数据资源存取响应函数,式中,pndjp代表通过存取界面接口采样的随机样本,fdfpo代表存取接口的属性表现形式。

    将要存取的资源定义为要访问的一个节点,假设,由adfr代表各个数据资源间的距离,则两个数据资源间的相似度越小,则其距离就大, Φpdr代表数据资源结构特征的有效概率,则利用式(2)得到存取查询时间减弱函数,式中,p’dfp代表共振致密因子,ey代表蚂蚁从特征i转移到特征j的概率。假设,由dis代表数据资源结构特征样本两两间的距离,φsdc代表数据资源结构特征幅度最大值处对应的离散频率,则利用式(3)将数据资源模式中的数据资源属性名分别转换为与之对应的目标数据资源属性名,假设,由mdge代表数据资源特征向量的多因素方差,Rsdp代表具有相同属性的数据资源,lhip代表映射规则的集合,则利用式(4)组建不同数据资源结构模式之间的语义映射关系规则,假设,由drkj代表映射规则,sdf代表数据库资源存取模式结构,则利用式(5)完成对科学技术数据库资源共享存取.

    综上所述可以说明,科学技术数据库资源共享存取原理,利用该原理完成对科学技术数据库资源的共享存取。

3 科学技术数据库资源的共享存取优化

3.1 数据资源特征的映射

    在对数据库资源共享存取优化过程中,融合于主成份分析方法对数据资源中各数据资源分量进行过滤,保留方差大、信息多的数据资源分量,组建数据资源属性的类间矩阵和类内矩阵,通过给定线性映射将原始的非线性数据资源空间变换成维数更高的线性空间,通过欧式距离的计算求解出高维空间各个数据分布点。具体的步骤如下详述:假设,由rd代表数据库的高维空间,x代表其高维空间对应的资源向量,满足于x={x1,x2,xd}r的条件,y代表其低维空间向量,满足于y={y1,y2,,yd}的条件,则利用式(6)融合于主成分分析方法对科学技术数据库中资源分量进行过滤,保留方差大、信息多的数据资源分量,式中,deghj代表原始数据资源包含的分量信息量,lrdep却代表数据资源包含的主成分分量的数量,swj代表具有相同主成分数据的概率,D代表数据主成分的变量,T代表数据样本方差贡献率。

    假设,由lkgo代表各个数据资源标准化变量协方差矩阵,xdk代表数据资源d的第K类属性的第i个分量,NK代表第K类属性的样本数,Gndf代表数据属性的类型数量,lghp代表不同数据资源属性在异构数据源的全部数据中的分布概率,edep代表数据资源邻域点集合。则利用式(7)和式(8)组建数据资源属性的类间矩阵和类内矩阵,式中,Bpdrt代表量化的类间优化准则。假设,由sx代表原始空间的非线性数据资源,Sr代表其相对应的维数更高的线性空间,则利用式(9)通过给定线性映射将原始的非线性数据资源空间变换成维数更高的线性空间,式中,Ydf代表数据资源属性间的相互叠加次数,玑如代表不同数据资源属性的权值向量。假设,由Fy代表高维空间数据点xi的kn个邻域数据资源,则利用式(10)通过欧式距离计算出高维空间每个数据资源分布点,式中,x代表正则项分布,w代表数据点的局部权重矩阵,yjkgg代表数据点线性组合的近似性。

    综上所述可以说明,在对科学技术数据库中资源共享存取优化过程中,融合于主成分分析方法对数据资源分量进行过滤,保留方差大、信息多的数据资源分量,组建数据资源属性的类间矩阵和类内矩阵,通过给定线性映射将具有原始的非线性空间数据资源变换成维数更高的线性空间,通过欧式距离计算出高维空间每个数据点分布点,为实现对科学技术数据库资源共享存取优化奠定了基础。

3.2 基于特征聚类的资源共享存取优化

    在对科学技术数据库资源共享存取优化过程中,以3.1节获取的数据资源分布点Pss为依据,融合于混沌相空间重构理论建立数据资源结构多维状态空间,计算出数据资源结构重构相空间的最佳时间延迟,得到数据资源结构特征的概率分布曲线,提取数据资源结构的混沌关联维特征,给出不同数据资源结构特征的聚类中心值,以此为依据完成对资源共享存取优化。具体的步骤如下详述:

    假设,由{s1,s2,sn}代表资源中各个数据资源分布的时间序列,sdj代表对各个数据资源结构相空间重构的结果,m代表嵌入维数,则以3.1节获取的高维空间各个数据资源分布点Prs为依据,融合于混沌相空间重构理论建立数据资源结构多维状态空间,式中,ohjp代表延迟时间互信息,kdpt代表最佳延迟时间。

    假设,由Isdp代表延迟时间的互信息权重,dmy代表在m维相空间形成的y维矢量,则利用式(12)计算出数据资源结构重构相空间的最佳时间延迟ksdpt,式中,Ejrp代表相空间重构最小嵌入维数。

    假设,由d(n)my代表dmy的虚假近邻点,Cxdj代表虚假最近邻点占的比例曲线,则利用式(13)得到数据资源结构特征的概率分布曲线,假设,由Nxjp代表数据资源结构混沌关联维特征,Dsdn代表相点中存在关联的相点对数,Ggkp代表相空间重构中的向量点数量,则利用式(14)计算出数据资源结构混沌关联维特征Nsj,假设,由Ndfp代表从样本中选取的聚类中心的数量,则利用式(15)给出不同数据资源结构特征的聚类中心值,以式(15)的计算结果为依据可以完成对数据资源共享存取优化。

4 实验与仿真证明

    为了证明提出的基于混沌关联维特征提取的科学技术数据库资源共享存取优化方法有效性,需要进行一次实验,在matlab7.0环境下搭建数据库资源共享存取优化仿真平台。实验数据资源来源于2个同为记录设备资料的实例数据库。

4.1  不同方法存取有效性对比

    分别采用本文所提基于混沌关联维特征提取方法和文献[8]所提基于多因素方差分析方法进行数据库资源共享存取优化实验。比较2种不同方法进行资源共享中资源存取的查全率和查准率,利用对比的结果衡量2种不同方法进行数据资源共享中资源存取的有效性,对比结果见图1和图2。从图1和图2中可以说明,利用本文方法进行科学技术数据库资源共享存取的有效性要优于文献[8]方法进行科学技术数据库资源共享存取方法的有效性,这主要是因为在利用本文方法进科学技术数据库资源共享中资源存取时,先融合于主成分分析方法计算出数据资源样本空间内各个数据资源结构的方差,组建数据资源结构的标准化变量协方差矩阵,获取不同数据资源样本的类间矩阵和类内矩阵,从而保障了本文方法进行科学技术数据库资源共享中资源存取方法的有效性。

4.2  不同方法存取的整体优越性对比

    分别采用本文所提基于混沌关联维特征提取方法和文献[8]所提基于多因素方差分析方法进行科学技术数据库资源共享中资源存取实验。比较2种不同方法进行科学技术数据库资源共享中资源存取的资源利用率和查询冲突率,利用对比的结果衡量2种不同方法进行科学技术数据库资源共享中资源存取方法的整体优越性,对比结果见图3和图4。从图3和图4中可以说明,利用本文方法进行科学技术数据库资源共享中资源存取方法的整体优越性要高于文献[8]方法进行科学技术数据库资源共享中资源存取方法的整体优越性,这主要是因为在利用本文方法进行科学技术数据库资源共享中资源存取方法优化时,通过重构相空间建立了一个数据资源结构多维的状态空间,促使各个数据资源几何特征量保持不变,提取异构数据资源结构关联维数特征,依据提取的混沌关联维特征对各数据资源结构特征进行聚类,利用聚类的结果完成对科学技术数据库资源共享中资源存取优化,提升了本文方法进行数据资源共享中资源存取的整体优越性。

5 结束语

    针对采用当前方法进行存取时,无法存取不同类型数据资源结构特征,存在资源结构存取误差大的问题。仿真结果证明,采用改进方法进行资源共享存取,其存取精度较高,可以有效地提升对科学技术数据库资源存取的使用率。

参考文献:

[1]贺杰.面向资源整合发展的物流企业营销创新方式.[J].西安工程大学学报,2016,4(30):528—533.

[2]刘淑英.云计算中基于随机游走的数据查询方法研究[J].微型电脑应用,2014,30(9):30一33.

[3]崔义童,等.基于图聚类算法的大规模RDF数据查询方法研究[J].小型微型计算机系统,2015,36(12):2625—2628.

[4]慈祥,等.一种云环境下的大数据Top—K查询方法[J].软件学报,2014,25(4):813—825.

[5]李重文,邓腾彬,马世龙.基于分段极值的时间序列数据查询显示方法[J].计算机工程,2014,40(9):27—31.

[6]王佳英,王斌,杨晓春.面向压缩生物基因数据的高效的查询方法[J].软件学报,2016,27(7):1715一1728.

[7]王有为,等.基于统计方法的Hive数据仓库查询优化实现[J].计算机研究与发展,2015,52(6):1452—1462.

[8]王妍,等.基于压缩的海量不完整数据近似查询方法[J].计算机研究与发展,2016,53(3):57l一581.

[9]孟祥福,等.结合语义相似度分析的web数据库T0p—K典型化查询方法[J].小型微型计算机系统,2016,37(8):1692一1696.

[10]王怀宇,李景丽.网络海量数据中隐私泄露检测方法仿真[J].计算机仿真,2014,3l(6):429—432.

 

热门期刊