注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

采宁的窝

——走在“认识自己,成为自己”的路上!

 
 
 

日志

 
 
关于我

一个随性、敏感、表里不一、情绪多变的女人,在文字的虚拟世界中享受着情感自由表达的快乐!

网易考拉推荐

RDF;Protégé;OWL;语义网;杜威十进分类法  

2008-11-18 15:51:10|  分类: 专业知识 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

RDF

RDF即资源描述框架,它定义了一些规则,这些规则是各领域和应用定义用于描述资源的词汇表时必须遵循的。当然,RDF也提供了描述资源时具有基础性的词汇表。简单而言,一个RDF文件包含多个资源描述,而一个资源描述是由多个语句构成,一个语句是由资源、属性类型、属性值构成的三元体,表示资源具有的一个属性。资源描述中的语句可以对应于自然语言的语句,资源对应于自然语言中的主语,属性类型对应于谓语,属性值对应于宾语。

RDFS(资源描述框架纲要,RDF Schema )RDF的元数据(meta-data),其内容定义基础的词汇,RDF可以依据这些词汇来描述资源。

Protégé

美国斯坦福大学开发的知识本体Protégé。在Protégé中包含许多知识本体的定义;描述一个领域中的概念称为class,描述每一个概念的属性与性质称为slot,描述属性的限制称为facet,类别所产生的实例称为instance。上下层类别之间可以有继承关系,subclass可以继承superclass所定义的slot,也可以使用slot描述类别与类别之间的关系,包含类别与类别的实例,这是一组完整的知识概念,即知识库。

OWL

Web本体语言(Web Ontology Language, OWL)是目前本体的标准描述语言。OWL可以清晰地表达本体中的概念含义以及概念之间的关系。OWL兼容和超越了XMLRDFRDF Schema,并且拥有更多的机制来表达语义。OWL分三个子语言: OWL LiteOWL DLOWL Full.

分类主题词表与本体关系

本体是共享概念模型明确的形式化规范说明,也就是概念和概念关系的集合。分类主题词表是类目、主题词(概念)和关系的集合,其基本功能和本体具有一致性。对于图书馆知识管理而言,领域本体必须是囊括所有知识资源的本体,可以利用《中国分类主题词表》确定知识资源领域内的术语、属性和关系等内容。分类表看作是领域本体概念网络的主体结构,主题词表看作是概念网络的各级概念节点。确定了本体的概念以及概念间的关系后采用RDFXML等揭示概念间的各种关系。但分类主题词表中的术语是规范的而不能用自然语言表达,知识点是线性的而不能反映概念网络,内容结构滞后而难以更新,语义单调而缺乏针对性等等,需要对分类主题词表进一步修改、完善。

语义网

语义网就是能够根据语义进行判断的网络。简单地说,语义网是一种能理解人类语言的智能网络,它不但能够理解人类的语言,而且还可以使人与电脑之间的交流变得像人与人之间交流一样轻松。语义网是因特网的延伸,目的是让计算机能真正了解使用者输入关键词的真正意义,以逻辑推理让人机之间能有更好的互动与合作关系,使机器能进一步处理并且理解信息,而不是单纯显示数据。语义网的内容包含XMLRDF;它以知识本体作为其基础理论,运用知识本体进行理解与推理,可以得到真正符合使用者的语义知识。

知识挖掘

知识挖掘是按照某种既定目标,对大量数据进行分析和探索,从中识别出有效的、新颖的、潜在有用的知识,以最终可理解的模式显示的一系列处理过程。

杜威十进分类法

杜威十进分类法(DDC),早在1873年时Melvil Dewey就有此分类构想,而于1876年正式出版,是目前全球各地图书馆广泛使用的分类法。杜威将图书馆的书籍管理视为知识分类的学问,将知识区分为十大类,每类有100个数码,再以十进制往下细分,因此称为十进分类法。

1876年《杜威十进分类法》第一版出版以来,以平均六年一版的速度进行修订,目前最新版是2003年出版的第22(DDC22)DDC 22除了顺应地理行政区的改变而修订,各项学科领域也随其扩充发展而增加新的类目,包括计算机科技、社会学、医学、史学等。在相关索引中也增加新的类别(主类、学科、主题)以及关键词提供检索,以利扩大其使用范围。

杜威十进分类法结构、符号、层次:杜威十进分类法是以传统的学科进行分类,总共有三个层级,第一个层级的10个主类涵括所有的知识体系,每个主类细分10门学科,每一门学科再细分10个主题,每个类别(可能是主类、学科或主题)都会设定特定范围的阿拉伯数字来表示。

杜威十进分类法的分类方法:杜威十进分类法的第一层有10大类,以三位数字的第一个数字代表主类。由000900的每一个号码代表一个大的学科,其中000包含最普遍性的知识或没有限制而且比较困难归类的类目,如新闻、百科全书、图书馆学等。杜威十进分类法的第二层有100,以三位数字的第二个数字代表类。杜威十进分类法是以阿拉伯数字代表每一类。如果想要了解更详细分类程度可以在分类号的第三个数字后加上一个十进制的小数点来表示。一个主题可能会出现在一个以上的学科,这是因为分类观点的不同,同一个概念可能出现在分类法的数个位置。

 

PDF

 PDF全称Portable Document Format,是一种电子文件格式。这种文件格式与操作系统平台无关,也就是说,PDF文件不管是在WindowsUnix还是在苹果公司的Mac OS操作系统中都是通用的。这一特点使它成为在Internet上进行电子文档发行和数字化信息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件开始使用PDF格式文件。PDF格式文件目前已成为数字化信息事实上的一个工业标准。

  Adobe公司设计PDF文件格式的目的是为了支持跨平台上的,多媒体集成的信息出版和发布,尤其是提供对网络信息发布的支持。为了达到此目的, PDF具有许多其他电子文档格式无法相比的优点。PDF文件格式可以将文字、字型、格式、颜色及独立于设备和分辨率的图形图像等封装在一个文件中。该格式文件还可以包含超文本链接、声音和动态影像等电子信息,支持特长文件,集成度和安全可靠性都较高。

  PDF文件使用了工业标准的压缩算法,通常比PostScript文件小,易于传输与储存。它还是页独立的,一个PDF文件包含一个或多个“页”,可以单独处理各页,特别适合多处理器系统的工作。此外,一个PDF文件还包含文件中所使用的PDF格式版本,以及文件中一些重要结构的定位信息。正是由于 PDF文件的种种优点,它逐渐成为出版业中的新宠。

  对普通读者而言,用PDF制作的电子书具有纸版书的质感和阅读效果,可以“逼真地”展现原书的原貌,而显示大小可任意调节,给读者提供了个性化的阅读方式。由于PDF文件可以不依赖操作系统的语言和字体及显示设备,阅读起来很方便。这些优点使读者能很快适应电子阅读与网上阅读,无疑有利于计算机与网络在日常生活中的普及。Adobe公司以PDF文件技术为核心,提供了一整套电子和网络出版解决方案,其中包括用于生成和阅读PDF文件的商业软件Acrobat和用于编辑制作PDF文件的Illustrator等。 Adobe还提供了用于阅读和打印亚洲文字,即中日韩文字所需的字型包。

 

  评论这张
 
阅读(534)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017