阅读完 这篇由Bill Roth 撰写的 关于 语义Web 的文章之后,我开始思考一个相关的话题,我将其称作“符号Web”(Semiotic Web)。通常,语义Web专注于使用 RDF和OWL 之类的技术将原来毫无结构的信息组织到一个实体中。其主要目标是允许机器和人类在原本无关联的信息之间建立连接。其实践应用通常用于重新构造数据的获取和标记方式,从而不仅能够获得数据的表示(即HTML),而且还能获取所表示信息的类型。这种应用使软件能够解析大量的数据并将其组织成便于查看的可视化数据,或者根据先前业务流程中无意义的信息进行程序判定从而进行其他的操作。
语义Web的典型示例是标记地理编码(与纯文本地址相对)之类的位置信息,从而能够以新的方式应用这些位置,比如说将某个Web站点中的位置添加到Google地图的功能。通过微格式(microformat)标记语义Web信息的方法相当简单,因此可以用这种类型的混搭(mashup)产生不凡的效果。
语义在社会计算(Social Computing)上下文中的典型应用是 标签云集 的使用。标签云集(Tag Cloud)常用于根据标签的热门程度可视化显示某一领域中的信息摘要,从而揭示该领域中发生了哪些主要的“meme”,请参见Fortune的 iMeme站点 或 Flickr。
但是,许多标签云集都存在这样一个问题:即它们往往是平面的或一维的;比如说,它们的含义只针对某个团体中的具有相同知识体系的人。在最糟的情况下,这可以对社会领域中的一个知识系统 执行一致性,或者只是针对某个特定团体的成员对一个社会Web站点进行转换。
比如说,如果在因特网上的标签云集中出现了 Mashup 这个词,那么您很有可能会在相关标签中看到 AJAX。但是,对于音乐领域的团体来说 Mashup 和 AJAX 之间是毫无关系的——因为在音乐领域中 Mashup 的意思是藉由混合搭配不同的音乐,而呈现出不同的音乐效果。这或许还可以解释为什么最流行的社会书签站点往往更偏好人们所关注的技术而不是其他类型的团体。
考虑到人们都来自不同背景并且具有不同的知识构成,因此我提出了“符号Web”这个概念。符号Web实际上可以根据创建者和使用者的情况考虑各种符号(在本例中为标签)在社会上下文中的实际含义,从而推导出信息的“内涵”或“社会”地图。换句话说,计算机可以将社会上下文应用到符号中获得更匹配的联系,从而将额外含义应用到信息中。比如说,您可以获得一个个性化的标签云集,它会显示出与您密切相关的链接,而不是与其他人或团体有关的链接。
语义Web就是将语义应于因特网中,同理符号Web也就是将 符号学(Semiotics) 应用于因特网中。有时,人们认为符号学是语义学的分支,该学科专注于符号的“内涵”或“社会”值。在符号学的基本概念中,“符号”是没有意义的,除非人们使用它表示某些内容。符号学家的工作并不是对现有的符号进行分类,而是尝试理解如何使用符号表示含义,他们主要根据社区和历史对符号创建和解释的环境进行研究。从技术角度而言,这意味着使用计算机获取和利用用户在社会环境中的信息,并以此确定该信息在上下文中的具体含义。
BEA的AquaLogic Pathways 便开始应用了这一概念。该产品可以使用一些额外的信息,如标记的查看者及其社区上下文,来确定与该查看者有关的标记和链接。Pathways可以使用优先的站点活动以及社区中的隐式和显示成员关系对搜索结果进行排队,从而返回特定于个人的结果。因此,这种根据各种信息排队的搜索可以提供许多不同的结果,这种方式要优于根据相同知识主体排队的搜索方式。
在类似的方法中,Google正在研究如何利用各用户的个人搜索历史以及他们喜爱搜索的内容类型(使用类似搜索的模式定义一个公共的隐式“社区”),以决定最佳的显示结果。显然,这些信息集合包括位置信息、和其他可以收集到的档案信息(去过哪些地方,居住地,在哪上学和其他类似于Facebook的信息源)。
总的来说,符号Web方法的价值在于对信息的重新认识和理解,我们可以使用社会上下文从公司和因特网中快速创建的知识中获取更多的含义。
如果对这一主题感兴趣,我建议您阅读一些符号学方面的文章,从中可以了解信息的含义在社会环境中的发展和形成。有关符号Web的基础知识,请阅读这篇优秀的 在线文章 和 一些前沿文章。
原文出处:http://dev2dev.bea.com/blog/jlannin/archive/2007/07/the_semiotic_we.html