数据挖掘在软件工程技术中的应用毕业论文
摘要 计算机技术在发展,软件也发展的越来越复杂,而系统开发工作也显得更加重要 。信息技术的广泛应用会产生大量数据,通过对数据进行挖掘 , 分析其存在的规律 , 对实现数据资源的有效利用意义重大 。本文就数据挖掘技术在软件工程中的应用作简要阐述 。
关键词 数据挖掘技术;软件工程中;应用软件技术
【数据挖掘在软件工程技术中的应用毕业论文】
随着信息技术发展而快速发展 , 但是其可控性并不是特别强 。软件在应用过程中会产生大量数据,数据作为一种宝贵的资源 , 有效的利用可以带来价值增值 。作为软件开发行业,数据挖掘技术应用则实现了数据资源的有效利用,通过对其中规律进行研究,为软件工程提供相应指导,并且对于系统故障能够有效处理,成本评估的有效性也能够提升 。
1数据挖掘技术应用存在的问题
1.1信息数据自身存在的复杂性
软件工程所包含的数据可以分为两个类别,结构化与非结构化 。在非结构化数据中软件代码发挥着重要作用 。而对结构化数据产生影响的则是软件版本信息 。结构与非结构化数据二者之间联系非常密切 。实现数据有效利用就需要通过一定技术找出其中的规律 。数据挖掘技术则刚好满足需求 。利用该技术对结构与非结构化数据进行整合,提升其使用的有效性 。
1.2在评价标准方面缺乏一致性
数据挖掘技术在生活中的应用比较广泛 , 通过该技术应用能够更好的对实际情况进行评价,从而对结果进行优化 。但是由于没有统一标准,导致了软件信息复杂 。而在表述方式方面自身又存有差异性 。信息获取者无法有效的对信息进行应用及对比 。而信息缺乏统一标准的原因就在于评价方式不一致 。
2数据挖掘技术在软件工程中的应用
2.1数据挖掘执行记录
执行记录挖掘主要是对主程序的路径进行分析,从而发现程序代码存有的相关关系 。其实质是通过对相关执行路径进行分析,并进行逆向建模 , 最终达到目的 。作用在于验证 , 维护,了解程序 。记录挖掘的过程通常是对被分析的系统进行初步插装,之后是记录过程,该过程在执行上一步程序后,对应用编程接口 , 系统,模块的状态变量记录,最后是对所得到的信息进行约简,过滤,聚类 。最终得到的模型能够表达系统的特征 。
2.2漏洞检测
系统或是软件自身都会存在漏洞 , 漏洞自身具一定的隐蔽性,由于人的思维存在某些盲区,无法发现漏洞的存在,就需要借助于某些软件 。检测漏洞的目的就在于找出软件中存在的漏洞及错误,并对其进行修复,从而保证软件质量与安全 。将数据挖掘技术应用于软件检测,首先要确定测试项目,结合到用户需要,对测试内容进行规划,从而确定测试方法 , 并制定出具体方案 。测试工作环节主要是对数据进行清理与转换,其基础在于漏洞数据收集,通过对收集与采集的信息进行清理,将与软件数据有关联同时存在缺陷的数据筛选出来,而将剩余无数据清理,对丢失项目采取相应措施补充,将其属性转换为数值表示 。之后是选择适当的'模型进行训练与验证,该环节要结合到项目实际的需要选择挖掘方式,通过对不同数据结果进行分析与比较找到最适合的方式 。之后则是重复应用上述方法,对软件存在的漏洞进行定位与检测 。并将与之对应的数据收集于软件库,在对漏洞进行描述的基础上分类,最后将通过挖掘得到的知识应用到测试的项目中.
2.3开源软件
对于开源软件的管理由于其自身的开放,动态与全局性 , 需要与传统管理软件进行区别对待,一般情况下,成熟的开源软件对于软件应用记录较为完整,参与的内容包括了错误报告,开发者活动 。参与开发的工作人员会处在动态变化之中,存在动态变化的原因就在于软件的开放性 。同时对于软件中动态性特征的挖掘,可达到对开源软件进行优质管理的目标 。
2.4版本控制信息
为了保证参与项目人员所共同编辑内容的统一性,就需要对系统应用进行控制 。软件开发工程应用中,开发工作管理与保护都会通过版本控制系统来实施 。并且其应用方式主要是对变更数据挖掘,找出不同模块及系统存在关系 , 并对程序中可能会存在的漏洞进行检测 。此类技术的应用,使得系统后期维护成本被有效的降低,而对后期变更产生的漏洞也有一定的规避作用 。
3数据挖掘在软件工程中的应用
3.1关联法
该方法作用在于寻找数据中存在的相关联系与有趣关联 。而体现的关联规则有两个明显的特征 。①支持度;②信度 。前者表示在某个事物集中,两个子集出现的概率是相同的 。而后者则表明了某事物在事物集中出现的概率,而另一事物也会出现 。
3.2分类方法
该方法主要是应用于分类标号与离散值的操作 。该方法的操作步骤是,首先要建立相应的模型 , 对数据进行描述,并利用模型对其进行分类 。在分类方法选择方面 , 常用的有判定树法 , 贝叶斯法,支持项量机法等 。判定树法应用的基础是贪心算法 。
3.3聚类方法
该方法常用的有划分方法 , 基于密度,模型,网格的方法与层次方法 。聚类分析输入的是一组有序对 , 有序对中的数据分别表示了样本 , 相似度 。其基本的应用理论是依据不同的对象数据予以应用 。
4数据挖掘在软件工程中的应用
4.1对克隆代码的数据挖掘
在软件工程中最为原始的是对克隆代码的检查测试 。就其方式而言有文本对比为基?。?标识符对比为基础 。前者是利用系统中程序代码包含的语句进行判断 。该方法在后期改进过程中主要是对字符串匹配效率进行提升 。实际应用过程中是通过相关函数匹配对效率进行优化 。
4.2软件数据检索挖掘
该方法同样是软件工程中原始的挖掘需求之一 。该方法在应用时主要有以下三个步骤 。
①数据录入 。其实质是对需要检索的信息录入,并结合到使用者需要在数据中查找使用者需要的数据 。
②信息查找过程 。确认了用户需要查找的信息后,系统将依据信息内容在数据库中进行查找,并分类罗列 。
③信息数据导出与查看 。用户可以依据自身需要将数据导出或者是在线查看 。数据在导出时会形成相应的记录,客户再次进行查找时就会更加的方便与快捷 。而将数据导出则需要利用到相关的软件 。
4.3应用于设计的三个阶段
软件工程有许多关于软件的资料,资料通常是存放于代码库中 。数据运用可以提升工作效率 。软件工程每一次循环都会产生大量的数据 。基于软件工程生命周期可以将其分为分析设计,迭代的开发,维护应用三个阶段 。
4.4面向项目管理数据集的挖掘
软件开发工作到目前已经是将多学科集中于一体 。如经济学,组织行为学,管理学等 。对于软件开发者而言,关注的重点除过技术方面革新外,同时也需要科学规范的管理 。除过对于版本控制信息挖掘外,还有人员组织关系挖掘 。对于大规模的软件开发工作而言,对人力资源的有效分配与协调也是软件工作领域需要面对的问题 。例如在大型系统开发过程中,往往会有许多人参与其中,人员之间需要进行沟通交流 。交流方式包括了面对面沟通,文档传递,电子信息等 。通过对人员之间的关系进行挖掘,有利于管理工作开展 。员工群体存在的网络是社会网络 。通过人员合理组织与分配,将会影响到项目进度,成本,成功的可能性 。而对该方面实施研究通常采用的是模拟建模 。
5结束语
软件工程技术在生活中许多领域都有广泛的应用,数据挖掘作为其中的一项技术,其重要性及作用随着技术发展而表现的越加明显 。为了保证挖掘技术的可靠性与高效,与其它工程技术有一定融合性 。数据挖掘在实际应用工作中体现出了巨大的经济效益 , 因此应该大力推进其应用的范围 , 并拓展其应用的深度与层次 。
参考文献
[1]李红兰.试论数据挖掘技术在软件工程中的应用综述[J].电脑知识与技术,2016(34).
[2]雷蕾.关于数据挖掘技术在软件工程中的应用综述究[J].电子测试,2014(02).
[3]孙云鹏.数据挖掘技术在软件工程中的应用综述[J].中国新通信 , 2015(15).
;
软件专业毕业论文书写有什么要求?毕业论文排版过程
论文写作完毕之后 , 我们还需要在word文档中进行格式排版 。我在上学吧论文查重上看到一篇毕业论文排版过程 , 希望对你有所帮助 。
当然,我们把论文排版都处理好之后,还需要进行论文查重,为了避免在学校熬夜排队进行论文查重检测修改 , 还不如在上学吧论文查重检测平台提前检测选择知网PMLC本科论文查重、知网VIP硕博论文查重、知网期刊论文查重、知网大分解论文查重、知网小分解论文查重、Paperfree论文查重、万方论文检测、维普论文检测 。
1、为标题建立新样式
步骤:
格式->样式和格式->新样式,在弹出的对话框设置标题的各种值,选中标题,点击样式格式栏中刚才新建的“GXM的标题”,论文中的标题会变化 。
说明:如果对于新建的样式有不满意的地方可以修改新建的样式,修改后使用该样式的额文本会自动更新 。
2、建立各级标题
步骤:
选中同一级别的标题(选择不连续的文本按住CTRL键),点选样式格式对话框中的“标题X”(如果是一级标题,选择标题1).
说明:该操作的时候论文最好切换到大纲视图,操作比较方便 。
在大纲视图下设置完各级标题的效果如下:(各级标题前的+号意义和用途跟资源管理器中的树形目录一样,双击该+号可以伸展该级标题的下级内容)
3、为正文修改样式
设置了标题之后 , 在样式格式对话框中点选“正文”下拉列表中的“择所有**实例”,则论文中的内容除了标题均被选中,然后点选正文修改 , 根据论文设计要求中的内容对正文格式做相应修改 。
4、为章节编号
由于我们写论文的时候已经给每个章节加了编号 , 如1.1等,所以我们设置好标题之后各个标题会有编号 。其实我们可以利用word自带的标题编号功能 。
步骤:
为了实现该功能我们将之前的编号删除,切换到大纲视图 。
单击“标题1”的下拉列表,选择“修改……”,弹出的修改样式对话框,单击“格式”按钮选择弹出菜单中的“编号……”
在弹出的“项目符号和编号”对话框,如下图所示,选择“多级符号”选项卡选择一种样式,单击“自定义”按钮 。
在此对话框中根据不同的论文设计要求,设置论文标题编号 。
说明:在大纲视图下,大纲工具栏的一些按钮的作用非常实用 。
5、生成目录
设定完论文的标题后就可以生成目录了!
步骤:插入->引用->索引和目录,在弹出的对话框中可以修改目录的各个属性值 。
说明:当在后续的修改中如果文章的内容与页数发生了位移,以至于之前生成的目录中页码不正确了,可是将鼠标置于生成的目录单击右键在弹出的菜单中选择更新域,在更新域对话框中选择,更新页码单选按钮 。
6、为图表插入题注、引用题注、生成图表目录
论文中的图表要有名称,而且在内容中会有引用,这就涉及到了图表的题注 。
步骤:将光标定位于要插入题注的位置,插入->引用->题注,弹出题注对话框 。
设置完毕之后,单击确定,也可以在窗口的右边对话框中对设置好的题注进行修改 。
题注的引用
如果在文章内容中有提到对图表的引用语句, , 我们可以对该部分进行题注的引用 。
具体办法:删除提到的部分,插入->引用->交叉引用,弹出如下对话框
在内容中插入交叉引用的效果如下图所示,将光标置于交叉引用的内容时会有跟踪链接提示 。
设置交叉引用的目的是 , 如果修改了图表的名称,可是在交叉应用的位置单击右键选择更新域,内容将会变成修改后的结果,从而省去了逐个修改引用部分的麻烦!
在文章的后面可是插入图表的目录,插入方法跟插入章节的目录的步骤类似,只是在插入索引和目录对话框中要选择第二个选项卡“图表目录” 。
说明:有的时候在做“更新域”的操作时,更新后,图表的名称变成了“错误!不能通过编辑域代码创建对象 。”产生此现象是因为图是在office系列的另一软件visio中画的 , 粘到word中后,自动创建了与源文件的关联,而现在论文几经周转,找不到源文件 , 无法更新了 。遇到如此情况,可以按快捷键ctrl+shift+F9图切断与源的连接 , 之后才不受更新的影响 。
7、参考文献
参考文献的插入我们采用了尾注的方法 。
步骤:
将光标置于要插入参考文献的位置,然后插入->引用->脚注和尾注,弹出如下对话框
点击插入按钮之后,在光标定位处跟文档结尾均出现了尾注编号1,在文档的结尾可以输入第一条参考文献,其他参考文献可以依次输入,插入后在文章中 , 当鼠标放于插入脚注的序号上,会出现如下图的提示 , 表示插入脚注成功 。
8、插入页眉页脚
在需要插入不同页眉页脚的地方插入分节符!
步骤:插入->分隔符->分节符(下一页) 。
然后视图->页眉页脚,在弹出的页眉页脚对话框中设置页眉页脚,特别是该对话框一些按钮的使用要注意 。
论文要求
1. 每个学生必须独立完成毕业设计论文;
2.论文书写规范、文字通顺、图表清晰、结论明确;所用的专业语言准确、概括、简练 。
3.论文格式顺序:
① 题目(封面)
② 目录
③ 中文内容摘要
④ 正文:正文是毕业设计说明书的主体部分,包括所选题目的理论分析、设计方案论证、功能模块、关键技术分析、资料运用和结论性意见等 。正文分章节撰写, 每章应另起一页 。各章标题要突出重点、简明扼要 。
⑤ 致谢:简述自己通过本设计的体会 , 并对指导教师以及协助完成设计的有关人员表示谢意
⑥ 参考文献(或资料)
4.字数要求,论文正文应在5000字以上(不含计算机程序清单) 。
5.论文文档要求用A4纸打印,装订成册 。
6.标准论文格式要求:
①纸张大小及页面设置:
(1)毕业论文一律采用Word书写,A4复印纸打印 。
(2)页面设置上下为2.54cm,左右为3.17cm页眉1.5cm , 页脚1.75cm 。
②封面及任务书:
采用学院统一印制的论文封面及论文任务书,须用钢笔正楷填写 。
③论文摘要:
摘要应当高度概括研究课题的主要内容、特点和观点,以及取得的主要成果和结论 。字数在300字以内为宜 。其中“摘要”为宋体三号字加粗居中,摘要内容为宋体小四号字,1.5倍行距 。
④目录:
“目录”为宋体三号字加粗居中,目录内容为宋体小四号字 , 1.5倍行距 。
⑤正文:
(1)论文题目采用宋体二号字加粗 , 副标题采用宋体三号字加粗,正文中小标题采用宋体小四号字加粗 。
(2)论文正文一律采用宋体小四号字,行距为1.5倍行距,正反面双面打印 。
(3)正文中奇数页页眉为“天津工程职业技术学院毕业论文(设计)”,采用宋体小五号字居左,偶数页页眉为“论文题目”,采用宋体小五号字居右,页脚为论文页码,采用小五号字居中 。
7.谢辞:
“谢辞”为宋体三号字加粗居中,谢辞内容为宋体小四号字,1.5倍行距 。
8.参考文献:
参考文献应按下述格式列写:
序号、作者[作者2 , 作者3…]、刊物名称[著作名、出版地、出版单位、出版时间]、刊号 。“参考文献”为宋体三号字加粗居中,参考文献内容为宋体小四号字,1.5倍行距 。
9.论文装订要求:
论文装订应按论文封面(使用学院统一规格的封面)、毕业论文(设计)任务书、摘要、目录、前言、正文、结论与谢辞、参考文献、成绩评定表的顺序左侧装订成册 , 如附程序清单或图纸应当一并附后装订 。
10.其他要求:
(1)论文中每章大标题采用“§1”、“§2”、“§3”的形式,章节编号方法采用阿拉伯数字分级编号的方法 。如:第一级为“1”、“2”、“3”等,第二级为“1.1”、“1.2”、“1.3”等,第三级为“1.2.1”、“1.2.2”、“1.2.3”等 。分级阿拉伯数字的编号一般不超过三级 。两级之间用下角圆点隔开,每一级的末尾不加标点,采用宋体小四号字加粗显示 。
(2)论文中图形和表格编号方法采用“图1-1、图2-1”和“表1-1、表2-1”的编号方法 , 编号位置应对应于相应的图形与表格的正下方,采用宋体小五号字加粗标注 。图形与表格位置尽量在文章中居中显示 。
(3)论文中如有注释,应在需要注释的后面标注“注①、注②、注③”,并在相应页内下方作相应注释,字体为宋体小五号字 。
- 梦幻西游手游种树攻略
- ofo为什么现在改名叫“小黄车”?
- 在武汉汉口地方开个咖啡厅需要多少资金?
- 学生男生换衣服换裤子么
- 什么DJ音乐最好听?适合在KTV蹦迪时候放的音乐.
- 长乐九龙山风景区在哪里
- 古诗黄鹤楼崔颢翻译
- 我在上大学,一星期前买了自行车,现在丢了
- 厦门雅基软件有限公司电话是多少?
- 农民在夏季种植的什么蔬菜基本不用农药?