基于图像理解的众包测试报告抽样分析烟研究计算机科学与技术专业.docx
《基于图像理解的众包测试报告抽样分析烟研究计算机科学与技术专业.docx》由会员分享,可在线阅读,更多相关《基于图像理解的众包测试报告抽样分析烟研究计算机科学与技术专业.docx(32页珍藏版)》请在课桌文档上搜索。
1、摘要1Abstract2前言3第一章绪论41.1 研究背景及意义41.2 研究内容概述61.3 本文的主要工作71.4 本文的组织结构8第二章相关工作与理论基础92.1 众包测试技术92.2 测试报告分析技术102.3 图像处理技术112.4 抽样技术122.5 本章小结13第三章众包测试报告抽样分析流程143.1 问题描述143.2 文本处理15321提取关键词153.2.2文字距离163.3 截屏处理163.3.1 图像理解17332截屏距离173.4 混合距离183.5 聚类193.6 抽样193.7 本章小结20第四章实验结果与分析214.1 实验设置214.2 实验结果214.2.1
2、 评价标准224.2.2 对比结果224.3 实验分析244.4 本章小结25第五章总结与展望275.1 本文总结275.2 后续工作展望28参考文献29致谢错误!未定义书签。摘要众包测试可以通过模拟真实使用场景的方式,提供真实用户反馈,达到全面可靠的错误检测。缺陷报告是描述软件缺陷的重要软件构件,由于程序员很难编写没有任何缺陷的程序,所以在软件开发过程中,发现和修正缺陷是很有必要的。在众包软件测试中,检查大量的测试报告是一项工作量很巨大但又不可避免的软件维护任务。在移动测试领域,测试报告通常包含更多的屏幕截图和更短的描述性文字,由于文本信息不足,以及自然语言的模糊性,重现缺陷的文本描述可能会
3、被编写的不明确甚至是误导,通过截屏辅助移动众包测试技术具有深远的研究意义。通过查阅相关文献,了解了相关技术的研究现状,本文提出了一种分析测试报告的方法,即在原本对文本描述进行处理的基础上,加入基于图像理解的技术对众包测试报告进行聚类,并在聚类的类簇中进行抽样,进而帮助开发人员更高效地发现报告中描述的移动应用中的错误。本文选取了华为运动等多个移动应用的测试报告,对其进行抽样分析,并设计了文本聚类、截屏聚类、文本和截屏的混合聚类以及随机情况下四种不同抽样基准的对比实验。通过对实验结果的观察分析,可以肯定的是,对测试报告中的屏幕截图进行处理是一项很有意义的工作,随着移动应用的普及,图像已经成为了十分
4、基本的信息源之一。关键词:众包测试;测试报告;图像理解;抽样技术AbstractCrowdsourcingtestscanproviderealuserfeedbackbysimulatingreal-worldusagescenariostoachievecomprehensiveandreliableerrordetection.Bugreportsisanimportantsoftwarecomponenttodescribesoftwarebugs.Becauseprogrammerscantwriteprogramswithoutanybugs,intheprocessofsoftw
5、aredevelopment,itisnecessarytofindandcorrectbugs.Incrowdsourcingsoftwaretesting,checkingalargenumberoftestreportsisahugebutinevitabletaskofsoftwaremaintenance.Inthefieldofmobiletesting,testreportsusuallycontainmorescreenshotsandshorterdescriptivetext.Becauseofthelackoftextinformationfortestreports,a
6、lsobecauseoftheambiguityofnaturallanguageandthedescriptionofthereproducingbugsthatcanbewritteninambiguousorevenmisleading,itisofgreatsignificancetostudythetechnologyofcrowdsourcingbyscreen.Byconsultingtherelevantliteratureandrealizingtheresearchstatusofrelatedtechnologies,thispaperpresentsamethodfor
7、analyzingtestreports.Thatis,onthebasisoftheoriginaldescriptionofthetext,introducingimage-basedtechnologytoclustertestreportsandsamplinginclustercluster.Thisinturnhelpsdevelopersmoreefficientlyfindbugsinthemobileapplicationsdescribedinthereport.Inthispaper,thetestreportsofmobileapplicationssuchasHuaW
8、eiareselectedandanalyzed.Wedesignthecomparisonexperimentoffourdifferentsamplingbenchmarksofthemixedclusteringoftextclustering,screenshotclustering,textandscreenshot,andrandom.Throughobservationandanalysisofexperimentalresults,thereisnodoubtthat,handlingscreenshotsinthetestreportisaworthwhileeffort.W
9、iththespreadofmobileapplications,imageshavebecomeoneofthemostbasicsourcesofinformation.Keywords:CrowdsourcingTest;BugReports;ImageUnderstanding;SamplingTechnique众包技术目前已经被广泛应用于软件工程领域。众包是指,将原本应该由公司内部员工完成的工作任务,以自由自愿的形式包给非特定的大众网络的做法,这为个人和商业提供了一种利用互联网上大量人力资源来解决问题的新途径。采用众包技术,可以向开发人员提供真实用户的信息和操作,并且这些用户提供的数
10、据是来自于真实、多样的软件和硬件平台上执行的任务。也正是由于众包测试的这一特性,会以大量的用户群为基础,产生的测试报告数量亦将是一个庞大的数字。尽管大量的测试报告有助于提高软件的质量,但是分析这些测试报告也是一个非常具有挑战性的任务,开发人员也就有必要寻找更好的发现缺陷、确定有用信息的方法。在过去的几十年里,软件工程的研究人员提出了许多处理方法。大多数关于测试报告分析的工作会关注如何对测试报告进行有效的预处理,如重复测试报告的识别、测试报告分类等。在几乎所有的这些方法中,都是根据测试报告的文本相似性”或是执行轨迹一进行捕获和分析的。然而对于移动应用众包测试的报告来说,由于在移动平台上截图比打字
11、更方便,测试人员往往会在测试报告中包含更多的截屏而使描述性的文字更简短。本文提出了一种方法,即通过一种基于图像理解的技术对移动应用众包测试的报告进行聚类,在聚类的类簇中进行抽样,进而帮助开发人员更快地处理测试报告,从中更高效地发现移动应用中的错误。通过将数个移动应用的测试报告作为样本,进行文本聚类、截屏聚类、文本和截屏的混合聚类以及随机情况下这四种不同抽样基准的对比实验,以检测到的故障的平均百分比(APFD)作为评估标准,验证了这种方法的优势。可以发现,随着移动应用越来越普及,图像已然成为一种十分基本的信息源,截屏在移动应用众包测试的报告中举足轻重。第一章绪论本章首先介绍了众包测试报告抽样分析
12、的研究背景和意义,其次简单介绍了基于图像理解的众包测试报告抽样分析的研究内容,并概述了本文所做的主要工作,在本章的最后介绍了本文的组织结构。1.1 研究背景及意义随着移动应用的普及,由于众包测试能够在短时间内提供反馈,提高移动应用的可用性和质量,应用众包测试己经成为一种十分流行的方法。众包技术的一个关键优势是,它们可以向工程师提供真实用户的信息和操作,而这些用户提供的数据来自于真实、多样的软件和硬件平台上执行的任务。例如,众包测试(如beta测试)可以为大量用户、硬件和操作系统提供验证数据。这样的好处对于移动应用程序测试来说是十分理想的,因为它通常需要快速的开发和部署迭代,并且支持许多移动平台
13、。此外,众包移动测试可以为开发人员提供真实用户的反馈、新特性请求和用户体验信息,这些信息很难通过常规的软件测试实践获得。基于这些原因,在过去的5年里出现了一些较为成功的众包移动测试平台(如uTest,Testin)o众所周知,软件维护活动通常是十分昂贵且具有挑战性的。在具体的实践中,移动众包测试的目标是通过充分利用庞大的劳动力来提供真实用户的反馈,众包测试报告的数量往往会很多,如图1.1和图1.2,显示了APaChe和ECIiPSe两个软件项目在2013年的连续时间段里,每天的测试报告提交和处理的相关数据。可以发现,在众包测试中,存在着大量的测试报告需要开发人员进行分析和处理。如何有效地处理测
14、试报告并发现其中描述的缺陷,对于在移动应用程序中应用众包测试来说,是一项关键的挑战。并且这也使得众包测试涉及到许多终端用户,他们的软件工程知识差异可能会很大。在这种情况下,对于开发人员来说,重现缺陷的文本描述可能会被编写得很糟糕(甚至是误导),而对屏幕截图信息进行分析处理,可以有效提升对移动众包测试报告的理解。测试报告的数量图1.2EdiPSe每天提交和处理的测试报告数量与桌面软件或网络软件的测试报告相比,移动应用程序的测试报告中所包含的文本描述更短。对于移动测试来说,屏幕截图比手动键入长段的文本描述要方便的多,因此记录者通常更倾向于提供简短的文字描述而在报告中添加活动视图的必要截屏。在这种情
15、况下,图像对于众包测试报告的理解有着重要的作用,在对文本信息进行处理的基础上,加入图像的分析处理,能够在一定程度上帮助开发人员更快更高效地发现测试报告中报告的缺陷信息。在软件工程领域,与自然语言处理(NLP)技术相比,图像分析和理解技术很少被研究和学习,这些技术旨在分析文本信息,并被广泛应用于协助各种软件工程任务。图像理解是计算机视觉领域的一个重要问题。由于匹配算法必须考虑到缩放、光照和旋转等因素,图像匹配真实对象尤其具有挑战性。幸运的是,在本文的相关工作中比较的图像是由不同设备的不同应用程序所呈现的应用程序视图的屏幕截图。本实验针对具有至少一张图片的测试报告,捕获了文本和图像信息,测量了这些
16、部分之间的相似性,在此基础上进行聚类和抽样,目的是帮助开发人员更快地发现移动应用中存在的错误。在众包移动应用测试的场景下,传统的缺陷报告分析理解技术不能很好地适用,已有少数研究学者开始关注如何结合移动众包测试的特性,研究对应的缺陷报告分析和理解技术,这也逐步成为研究的热点。1.2 研究内容概述对于众包软件测试,在实践中,测试报告中会存在各种形式的多媒体信息,例如语音信息和简短的操作视频。但根据以往的经验来看,在这些信息中,文本描述和屏幕截图是被最广泛使用的两种。对于众包的移动应用测试来说,测试人员则更倾向于针对移动应用的特性,使用更容易捕捉的完整的活动视图的截屏来描述错误。于是,在本文中,我们
17、将重点放在移动屏幕截图的处理上。我们假设每个测试报告只包含两个部分:一段文字描述和一组截屏。于是在每个移动应用的测试报告中设定R(r)=r(Si,Ti)i=0./,其中,S表示屏幕截图(即图片),T表示描述错误和操作步骤的文本。其中,每个测试报告通常会包含多个屏幕截图,也就是说,对于测试报告后的屏幕截图S,我们设S=S同2,.,s加“其中即表示测试报告方的第/个截图。对这两部分分别进行处理:(1)文本的处理工作包括提取关键词和计算距离构造距离矩阵;(2)截屏的处理工作包括图像理解并得到距离矩阵;对于文本的分析,自然语言处理技术可以帮助完成很多任务;对于截屏的分析,本实验使用了空间金字塔匹配(S
18、PM)技术来测量屏幕截图的相似性;同时,采用了Jaccard距离来分别度量测试报告集R中的文本描述之间和截屏之间的差异。在对文本描述和屏幕截图分别进行处理之后,本实验将它们的距离结合起来,应用平衡公式形成一个混合距离矩阵。在本次对比试验中,我们对三种距离矩阵依据一定的阈值进行聚类,完成聚类之后,可以得到一个报告类簇,我们希望这个报告类簇可以表达一类错误。最后使用随机抽样的方式对每个报告类簇进行抽样,抽样的循环方式为反复遍历所有类簇,抽样的终点为所有的错误类型被发现。最后,本文使用了APFD这一度量标准,即检测到的故障的平均百分比。这是测试用例优先化技术的最广泛使用的一种评估指标,用来衡量本次对
19、比实验中技术的有效性。通过对实验结果进行分析,可以发现,一般来说,与仅仅基于对文本的处理的移动众包测试相比,图像理解技术能够提高对测试报告处理的效率,能够更快地发现移动测试报告中的缺陷。1.3 本文的主要工作本文提出了一种基于图像理解的众包测试报告抽样分析的方法。到目前为止,还没有一项工作能很好地解决使用屏幕截图的测试报告的问题,尤其是众包测试中的移动应用测试报告。大量的工作人员更倾向于用直接的截图和简短的描述来重现缺陷,与此同时,开发人员也对屏幕截图更感兴趣,而不是查看报告者的自然语言描述。但是,由于图像理解的复杂性,匹配真实世界对象的图像尤其具有挑战性。幸运的是,在本文的研究内容中,这一问
20、题得到了改善,我们比较的图像是由不同设备的不同应用程序所呈现的应用程序视图的屏幕截图,存在的主要问题是图像界面中的元素的变化。比较两个图像的基本技术是比较它们的直方图,图像的特征直方图能表示图像中某一特性的值的分布。特别地,图像的颜色直方图可以代表图像中颜色的分布,显然,如果两个图像是相同的,它们的颜色分布也会互相匹配。虽然反过来是不正确的,即两个不同的图像也可能会有相同的直方图,但是这个问题在本文的对比实验中并不是特别重要。本文提出的对比实验,是对基于文本、基于屏幕截图以及基于二者混合和随机的情况进行了抽样分析。对于文本分析,我们使用了自然语言的文本分析技术来度量测试报告中文本描述的相似性,
21、得到了文本的距离矩阵;对于图像分析,我们使用了SPM技术来测量屏幕截图的相似性,也得到了图像的距离矩阵;对于二者混合的情况,应用了平衡公式,得到了混合距离矩阵。在本次实验中,我们对一些移动应用(如HuaWei,MyListening的众包测试报告进行了对比抽样分析实验,为了评估四种不同的抽样样本的有效性,本文使用了APFD度量。本文通过实验得出如下结果:(1)屏幕截图在移动应用程序的测试报告中至关重要,它可以显著提高开发人员从测试报告中获取缺陷信息的效率;(2)对于某些类型的移动应用程序,本文提出的方法相对于只对文本处理的技术有着显著的优势,即混合距离和图像距离聚类抽样后的APFD值优于文本距
22、离聚类抽样的APFD值,也优于随机情况。考虑到所有的实验结果,可以发现图像理解技术可以为众包移动测试报告的分析提供优势,并且这种混合文本和图像的方法所展现的优势也为后续的研究带来了希望。1.4 本文的组织结构本文共分为五章,各章内容安排如下:第一章:绪论。本章介绍了课题的研究背景及意义、基于图像理解的众包测试报告抽样分析的主要研究内容、本文的主要工作及工作结果,最后介绍了本文的组织结构。第二章:相关工作与理论基础。本章详细阐述了众包测试技术、测试报告分析技术、图像处理技术、抽样技术的研究方向和发展现状,继而论述了目前存在的问题以及后续可能的发展方向。第三章:众包测试报告抽样分析流程。主要详细介
23、绍了本次研究的实验流程,包括文本的处理、截屏的处理以及后续的聚类、抽样工作。第四章:实验结果与分析。主要介绍了本次研究的对比实验的结果,详细阐述了实验相关参数的设置以及对比实验的评价标准,对不同抽样类簇的实验结果和本次实验的意义进行了分析。第六章:总结全文,提出未来工作的设想与展望。第二章相关工作与理论基础本章详细阐述了众包测试技术、测试报告分析技术、图像处理技术、抽样技术的研究方向和发展现状,继而论述了存在的问题以及后续可能的发展方向。2.1 众包测试技术2006年Howe首次提出众包的概念,众包的基本特征包括:采用公开的方式召集互联网大众;众包任务通常是计算机很难独立处理的问题;大众通过协
24、作或独立的方式完成任务;众包是一种分布式的问题解决机制。众包测试是一种很独特的测试方式,它能让真实的用户或者测试人员,在真正的应用环境下参与到测试的过程中来。在基于众包的测试优化方面,目前主要研究工作包括针对特定测试类型的优化,如应用于QOE测试、可用性测试、GUI测试等;以及针对测试流程的优化,如应用于测试用例生成、程序调试与修复等。在QoE测试方面,Chen等设计了一个基于众包技术的框架来对多媒体内容进行QoE测试。WU等则提出了一个值得信赖的众包框架来对多媒体内容的QoE系统进行评估。HOSSfeki等针对众包QOE测试的问题和补救方式做了详尽的分析,并对众包竞争和最佳实践方式进行了完善
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 图像 理解 测试报告 抽样 分析 研究 计算机科学 技术 专业
链接地址:https://www.desk33.com/p-1226469.html