18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 信息时代 > 图像数据挖掘技术(数据库)

图像数据挖掘技术(数据库)

时间:2022-11-24 04:30:01 | 来源:信息时代

时间:2022-11-24 04:30:01 来源:信息时代

    图像数据挖掘技术 : 从图像数据库和Web数据库的海量数据中挖掘有用的图像信息,发现和识别有意义的图像模式与知识的一种技术。如今互联网和Web技术已成为人们获取信息的重要手段与途径,使得在全球范围内实现资源共享和信息交换成为可能。然而,Web上的数据是海量的,Web数据具有无结构性、动态性、异构性和Web页面的复杂性,使人们要从众多的Web站点中找到有用信息,尤其是图像信息,已变得越发困难。Web数据挖掘(Web data mining)是指采用数据挖掘技术从Web站点和Web活动中抽取人们感兴趣的、潜在的有用模式和隐藏在其中的有用信息,其中包括大量的图像信息。如Web的新闻、广告、金融、电子商务、教育等信息服务中,就包含了大量的图像信息,它为数据挖掘提供了丰富的信息资源。
1.基于Web的图像数据挖掘
Web数据挖掘,又称为Internet网上的数据挖掘服务,是实现对Web存取模式、Web结构与规则,以及动态Web内容进行查找的一种技术。Web数据挖掘一般可以分为三类: Web内容挖掘、Web结构挖掘和Web用户日志挖掘。如下以Web内容挖掘(Web content mining)为例,来说明图像数据挖掘。Web内容挖掘是用于发现Web数据库文档中的有用信息或知识的一种挖掘方法。Web内容挖掘的对象有文本信息和多媒体信息两类。其中多媒体信息主要是针对网上的各种非结构化数据(包括图形图片等静态图像、视频/音频动态图像数据等复杂对象)。目前,由于网络带宽加大,图像等多媒体信息在网上呈增长趋势,这对图像信息的挖掘提出了更高的要求。由于涉及复杂对象,实现这种数据挖掘技术的难度更大。
图像数据挖掘泛指对空间数据库、图形库和图像数据库中的图形、光栅图像、数字图像和视频图像中的图像数据进行挖掘,以发现有意义的模式。这些图像数据包括由点、线、多边形(区域)及其组合(如网格及划分)组成的数字光栅矢量(vector)形式的图像数据(如地图、设计图纸、蛋白质分子链三维排列图、卫星遥感图像、X射线断层摄影图像等),也有以位图(bitmap)形式表示的各种数字图像数据(如彩色图像、多光谱图像、多视图像和视频(运动)图像等)。近年来,随着3G时代的来临,对图像等多媒体数据的挖掘的要求与日俱增。
2. 图像数据挖掘算法
图像数据的挖掘算法主要有相似搜索、多维分析、分类、聚类、关联分析和预测分析等。现以相似搜索算法为例来说明。在图像数据库中搜索相似数据,既可基于数据描述,也可基于数据内容的搜索方法来实现。基于数据描述的方法,主要是在图像描述之上建立标引(如关键词、标题等)和执行对象检索; 基于数据内容的搜索方法,可支持多种图像内容(如颜色、纹理、形状、对象、小波变换等)的检索。
(1)基于图像内容的数据挖掘:这种挖掘方法主要采用图像的视觉特征来标引图像,并依赖图像视觉特征的相似性来检索图像对象。常用的挖掘方法有两种: 一种是基于图像样本的挖掘,它通过找出所有与给定图像样本视觉特征相似的图像。其作法是从样本中提取特征矢量或特征标识,将其与已经提取出来并在图像数据库中已经索引过的图像特征矢量相比较,以得到与样本图像相似的图像。而基于图像特征的挖掘是指给出图像的特征描述(如颜色、纹理、形状等),将其转换为特征矢量后,与图像数据库中的已有的图像特征矢量相匹配。目前,基于图像内容的数据挖掘方法已在气象预报、医学诊断、TV制作、针对图像内容的Web搜索引擎和电子商务中应用。目前,已研制成功的图像数据挖掘系统,如按图像内容的查询QBIC(query by image content)系统,可同时支持样本查询和按图像特征描述查询。有的系统则能同时支持基于内容和基于特征描述的查询。以下为在图像数据库中常采用的一些基于图像特征标识的相似图像数据挖掘方法: ①基于颜色直方图的特征标识: 其图像特征标识仅包括图像颜色的直方图,而不包括任何形状、位置或纹理信息,用于对比两幅颜色相似的图像; ②多特征构成的特征标识: 此法中,图像特征标识由颜色直方图、形状、位置和纹理等多种特征组成。通常,可对每一个特征定义其距离函数,然后综合出总的结果; ③基于小波的特征标识: 此法中,利用图像的小波系数作为优势特征标识,小波可在一个单一的框架内表示形状、位置和纹理等信息,从而减少需查询多种特征所耗费的时间,提高图像数据挖掘的效率;④带有区域粒度的小波特征标识: 此法中,特征标识的计算和比较在一定的区域粒度上进行,而不是搜索整个图像。这种基于区域相似的搜索可以迅速找到包含有相似对象的图像,而这些对象或许是经过变换或伸缩过的。
(2)图像数据的分类和预测:在多媒体数据挖掘技术中,图像数据的分类和预测具有重要作用,它在天文学、地震学、气象学和地理与地球科学等领域具有广阔的应用前景。在图像数据挖掘中,常采用决策树实现图像的分类和预测。在天文学研究中,可以天文学家分类过的天空图像为训练集,根据图像特征(大小、面积、密度、图像要素和位置)构造天体模型,以后,可以此模型为基础,通过天文望远镜和太空探测器对搜集到的大量图像进行分析处理,用于识别星系和发现新的天体。目前,已用这种方法成功地识别出金星上的火山。
图像数据的分类和聚类与各种图像处理技术密切相关,通常许多有效的图像处理技术都可以用来实现图像数据挖掘。如对图像和视频图像进行关联分析时,可以采用以下三类规则:①图像内容和非图像内容特征之间的关联; ②与空间关系无关的图像内容的关联;③与空间关系有关的图像内容的关联。通常,在图像数据库与事务数据库中的关联规则挖掘之间存在一定的差异。首先,一个图像包含多种对象,每个对象又具有许多特征(如关键词、颜色、形状、纹理和位置),这里存在多种关联。因此,要采用多级分辨率逐步求精的数据挖掘策略,来降低图像数据挖掘的代价;第二,在图像关联分析中,要考虑到包含多个对象的图片可能在分析中重复出现,因此应对图像的关联及其度量的定义(如支持度、可信度等)做相应的调整;第三,图像对象之间存在重要的空间关系,如之上、之下、之间、附近等,这些特征对挖掘对象的关联的相关性非常有用。因此,空间关系,可同其他图像特征(如颜色、形状、纹理和关键词)一起,构成有意义的关联。显然,拓扑空间关系特性和空间数据挖掘方法对图像数据挖掘具有重要作用。
(3)可视化图像及视频图像挖掘:这种图像挖掘方法是指采用数据与知识的可视化技术从大型数据库或数据仓库的数据集中发现隐藏在其中的有用知识,并通过人的视觉系统由人眼和脑来识别。“一图胜过千言万语”,对可视化数据挖掘具有现实意义。目前,已采用多种图像处理语言和图像用户界面等在网络上实现对静态和动态图像进行可视化数据挖掘。其中包括:①数据可视化: 对数据能用多种可视化方法来描述,如数据空间分布图、曲线、曲面、三维立方图等; ②挖掘过程可视化: 用可视化形式描述挖掘过程,如抽取、清洗、集成、预处理等各种挖掘过程用图形或图像表示;③挖掘结果可视化: 将挖掘后得到的知识和结果用可视化的形式表示,如散列图、盒状图、决策树、族、孤立点等。可视化图像及视频图像挖掘技术与各种图像处理技术相结合,在建立遗传基因及DNA数据库、空间数据库、时序数据库等领域获得广泛应用。

74
73
25
news

版权所有© 亿企邦 1997-2022 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭