Web 信息架构

1. 信息架构的意义

1.1 定义

数据是事实和数字。关系型数据库是高度结构化的,产生特定的答案给特定的问题。知识是人脑中的东西。知识管理者会开发工具,设计流程,以及找出动机,鼓励人们分享知识。信息正好处在数据和知识之间混乱的地带。对于信息系统而言,某一问题通常没有单一的正确答案。我们关心各式各样的信息:网站、文件、软件等。我们也关心元数据。

各种不同的粗细程度有:杂志的议题、文章、段落及句子

以用户为中心的设计方式还是不够的,组织及管理信息的人也很重要。信息架构必须在用户的需求和商业的目标之间取得平衡。有效的内容管理及明确的政策和程序也不可或缺。

诸如可用性工程(Usability Engineering)和民族志 这类学科可以帮我们引进严格的科学方法,进行用户需求和信息搜寻行为的分析。

信息架构的实践绝对无法简化成一些数据:到处充满了模糊性和复杂度。信息架构师必须依赖经验、直觉及创造力。我们必须甘愿冒险,并相信我们的直觉

1.2 为什么信息架构如此重要

寻找信息的代价:每个员工多花 5 分钟的时间在企业内寻找答案,这样的花销是多大?

找不到信息的代价:由于员工找不到需要的信息,组织每天得做出多少错误的决策?有多少重复性劳动是因为找不到信息而造成的?

  • 教育的价值:教会你的顾客在网站上搜索他们想要的产品或服务,这样做的价值是什么?
  • 建造的成本:设计和建设一个网站的成本是多少?6 个月后因为网站的找寻功能不足或者 无法扩充时,需要重做的代价是多少
  • 维护的成本:同样的,确保优良设计不会因时间流逝二毁坏的代价是什么?维护网站的人 知道该把新内容放在哪里吗?他们是否知道何时该把过时的内容移除呢?
  • 培训的成本:对员工进行系统使用培训的成本是多少?如果系统使用起来不那么复杂,那 么不进行培训能节省多少成本?
  • 品牌的价值:如果用户无法找到他们所需的东西,则您的品牌在他们眼中就丧失了价值

1.3 实践

我们必须找出各种方式,清楚表达技术的关键理念,协助别人了解用户需求和行为和复杂本 质。我们必须找出人群和构成知识网络的内容两者间的互动关系,另外还要说明这些联系该 怎么用,才能把静态的网站变成复杂自适应系统。

我们必须要有心理准备,深入细节,找出网站的组件系统。我们必须显示语义网络如何为流畅的浏览提供稳定的基础。而且我们要说服客户和同事,有效的搜索体验不仅仅需要好的引擎或好的操作界面,各子部分之间谨慎地整合成一个系统也是必要的。

最后我们需要产出具体的成果。我们要以明确而且引人注目的方式,设计出语义和结构的架构。简言之,我们要让别人看到那些看不见的东西。

2. 实践信息架构

2.1 我们需要信息架构师吗

为信息架构项目配置人员时,值得考虑局外人和局内人两者间的优缺点。从一方面来讲,让信息架构师可以从局外人的角度思考问题,以新鲜的态度看待网站,对于用户的需求有灵敏度,不会收到内部组织政治上的包袱限制。另一方面,局内人可以真正了解组织的目标,内容及对象,而且可以长期随侍在侧,协助设计、实施和管理解决方案。

2.2 在真实世界实践信息架构

用户、内容、情境 —— 这三个词语构成了实践信息架构设计模式的基础

提到信息架构最重要的特征时,答案就变得相当简单:对用户及其需求(来自人机交互及其 他各种领域)、内容(考虑技术传播及新闻业)、以及情境(读本有关组织心理学的书)有 点了解。

2.3 情境

信息架构必须百分之百和它们的情境相吻合。你的网站和企业网络词汇与结构会变成你的生 意和你的顾客与员工之间对话演进时的重要组件。词汇和结构会影响这些人对你的产品和服 务的看法,让他们知道未来会从你那儿获得什么,今儿在顾客和员工之间造成互动的限制或 亲近。

成功的关键就是了解与结合,首先,你必须了解商业情境。其独特性是什么?现在的生意点 在哪里?明天又该如何?然后必须想办法把信息架构和企业的目标、策略,以及文化结合起 来。

2.4 内容

我们把「内容」定义的很广,包括文件、应用程序、服务、模式,一集人们要找到你的网站所需要的元数据。真要采用某个专业术语的话, 可以说是构成你的网站的「材料」

当你观察各种网站的内容时,下列的问题会浮上台面,以区分各种信息生态的因素:

  • 所有权:内容是谁做的?谁拥有这些内容?所有权是完全归属于内容创作小组,或者是分 散在各个部门之间?有多少内容是外部信息提供商授权提供的?这些问题会影响到你在其 他层面的控制力
  • 格式:网站和企业网络逐渐变成获取组织内容所有数字格式的统一途径。Oracle 数据库、 产品目录、各种文档报告等
  • 结构:文件并非生而平等。有些系统信息是以文件为主轴建造起来的,把文件是为最小的 独立单元。其他的系统则采取内容组件或数字资产的做法,搭配其他形式的结构化比置标 语言,使管理和存取可以控制在比较细致的程度之下
  • 元数据:你的网站已经有多少元数据是用来描述内容和对象的?文件是以手动加入标签或 自动加入标签?质量和一致性的程度如何?是否有一套受控词表?或者让用户可以为内容 提供自己的通俗标签?这些因素会决定信息检索和内容管理这两方面要从头开始做的部分 有多少。
  • 数量:涵盖的内容有多少?你的网站有多大?
  • 动态性:成长率或周转率如何?明年会增加多少个内容?内容会多久会过时?

2.5 用户

现实生活中顾客的喜好和行为的差异,在网站和企业网络的情境中就会被转化成不同的信息 需求和信息搜寻行为

谁在使用网站?他们如何使用?他们希望从网站上获取什么信息?

3. 用户需求及其行为

3.1 主题

网站的信息架构在设计时应该将这些差异性考虑在内,这些需求就是信息搜寻行为的范例。搜索一直食物的行为和浏览未知事物的行为截然不同。把这些需求和行为区分开来,然后找出那一种是用户最需要的东西,实际有追求价值的

3.2 过于简单的信息模型

过于简单的信息需求模型:用户提出问题 → 黑箱魔术 → 用户收到答案

信息需求的情境(在这之前发生过的相关事件,以及用户之后碰触键盘的事)没有包含在内

3.3 信息需求

探索式搜索 Exploratory Seeking 用户并不确定要找什么

无遗漏式研究 Exhaustive Research 用户通常有好几种方法表达他要找的东西,而且有耐心的以这些不同的词汇狗仔他的搜索表达式

已知条目搜索 Known-Item Seeking 用户通常知道该找什么,该以什么名称称呼,以及上哪儿可以找到它

重新寻找以前寻找过的 我们的衰退的记忆以及忙碌的行程表会一直迫使我们重新寻找以前已碰到过的有用的信息

3.4 信息搜寻行为

搜索行为有两大类:整合和重复

采摘 Berry-Picking 每次对内容的搜索、浏览、询问,以及交互都会大幅度影响我们正在搜索的东西 信息搜寻行为中这些不同的组件会组成复杂的模型,比如 Marcia Bates 提出的采摘 模型,用户开始先产生信息需求,然后构想出一种信息请求(查询), 接着在信息系统中重复动作,可能会沿着复杂的路径前进

另有一种有用的模型是「珠形增长(Pearl-Growing)」方法。用户从一些有用的文件开始, 这些文件正是他们所需要的,他们想得到更多像这样的东西

3.5 学习信息需求和信息搜寻行为

这样学习用户信息需求和搜寻行为?搜索分析法与情境式询问

搜索分析法牵扯到查阅网站上最常见的搜索查询。由此诊断搜索性能、元数据、导航,以及 内容的问题。搜索分析法提供了用户市场在搜索些什么,有助于你了解她们的信息需求和搜 寻行为。

情景式询问这种研究方法是根植于民族志学的,可以说是搜索分析法绝佳的补充,因为这种 方式可以让你观察用户在其「自然」场合下如何与信息交互,而且在该情境下,询问他们为 什么会做他们正在做的事情。

4. 信息架构详解

主题

为什么把信息架构尽可能具体一点是很重要的事情 通过自上而下以及自下而上的返利帮助你实现信息架构可视化 分类信息架构组建的几种方式,是你能更深入的理解和解释信息架构

展现信息架构

是什么东西才能让信息架构得以显露出来?信息架构组建:

组织系统

以各种方式为我们展示信息

组织系统 Organizing System 全站内容分类或分组的主要方式,也称为分类法和等级体系。标签云图也是一种组织系统

  • 全站导航系统:主要的导航系统,协助用户了解他们的位置,以及在网站中可以到哪里去。
  • 区域导航:主要的导航系统,协助用户了解他们在自网站的位置,以及可以在子网站中去 到哪里。
  • 网站地图目录:支持主要导航系统的次要导航系统,提供浓缩过的总揽以及到主要内容和 子网站的链接,通常是采用概要的形式。
  • 网站索引:辅助性的导航系统,可以提供排序后的链接列表,指向网站的内容。
  • 网站指南:辅助性的导航系统,针对特定主体提供特定的信息,以及指向网站中相关子主 题的链接。
  • 网站向导:辅助性的导航系统,可以通过一系列的步骤来引导用户,也有指向网站中相关 子主题的链接。
  • 情景式导航系统:用链接统一联想相关内容。通常内嵌在文字内,一般是用来链接网站中 高度专业化的内容。

导航系统

导航系统 Navigating System 协助用户在内容上移动,诸如常去地点「_A-Z Directory_」以及「_Go Quickly To…_」

搜索系统

搜索系统 Searching System 可以让用户搜索内容。此处,默认搜索是_Gustavus_网站,但是你也可以从该网站搜索日历、名录等

搜索界面:输入和修改搜索字符串的方法,通常会提供一些教你怎么改善查询的信息,以及其他设定搜索方式

查询语言:搜索查询的语法。包括布尔运算符(AND, OR, NOT),相似运算符(ADJACENT, NEAR),活着是指定要搜索哪个字段的方法(AUTHOR=“Shakespeare”)

查询构造器:一些提升查询效果的方式,常见范例包括拼写检查器,词干分析、概念搜索,以及从词典钟取出同义词

搜索算法:是搜索引擎的一部分,决定哪些内容可以满足用户的查询。

搜索区域:网站内容的子集合,已经特别做过索引设计,以满足较细致的搜索

搜索结果:展示满足用户搜索条件的内容。牵扯到那些类型的内容应成为个别的结果,应该现实多少结果,以及结果应该如何分级、排序和聚类

受控词表和叙词表:预先确定较佳的词汇,用以描述特定领域。通常会包含其他的名称。叙词表通常是包含上位类、下位类、相关关系的徐词链接和优选词的说明组成的受控词表。搜索系统可以从受控词表中取出查询的同义词以提升查询效果。

最佳猜测(Best Bets):手动和搜索查询相匹配的较佳搜索结果;编辑和主题专家会决定哪些查询应该去除最佳猜测,以及哪些文件应该有最佳猜测状态。

标签系统

Labeling System 使用对用户来说有意义的语言描述分类目录、选项及链接

标题:为内容命名的标签。

嵌入式链接:文字内的链接,就是连向某些内容的标签。

嵌入式元数据:可以作为元数据的信息,但是必须先被抽取出来(例如在食谱中,如果有提到某种材料,这项信息可以被索引起来,可以支持以材料搜索的功能)

成块信息:内容的逻辑单元,这些单元可大可小(标题和章节都是成块信息),而且可以是嵌套的(章节是书本之内的)

清单:一群成块信息,或者连向成块信息的链接。这些很重要,因为他们已经按组分类了,而且以特定次序展现

顺序式帮手:暗示用户在某一流程货任务中所在位置的线索,以及完成任务之前还要走多远

标示符:暗示用户在信息系统中的所在位置的线索(标示指出用户正在使用的网站是什么)

网站的设计师很努力的把最常用的问题确认出来,然后设计这个网站来满足这些需求,我们 称之为自上而下的信息架构

通过支持搜索和浏览,来自网站内容的结构会使得用户问的答案浮出水面,这是自下而上的 信息架构内容结构,排列顺序,以及标签系统有助于你回答,这是哪里、这里有什么、可以 去哪里的问题。

自下而上的信息架构很重要,因为用户可能逐渐跳过网站的自上而下的信息架构。相反的, 他们会通过搜索引擎或者信息聚合读取到网站深层次的内容。一旦进入深层次的页面,用户 就只想跳到相关的内容,而不是去了解自上而下的结构。优良的信息架构被设计为预计用户 会使用这种查找方式。_Keith Instone_简单又实用的导航压力测试提供了评估网站自下而 上信息架构的绝佳方式 http://user-experience.org/uefiles/navstress

5. 组织系统

5.1 主题

  • 主观、政治,以及其他导致组织信息如此困难的原因
  • 精确和模糊的组织体系
  • 通俗分类法(Folksonomies)、标签法,以及大众分类(Social Classification)

5.2 信息组织的挑战

5.2.1 模糊性

分类系统是基于语言的,而语言本身是具有模糊性的。这样的模糊性是的分类系统的基础不 稳固。当我们以字词座位目录的名称时,我们就必须承担用户可能误会我们意思的风险。

5.2.2 异质性

异质性指的是某种东西或者一群东西是由不相关或者不相同的部分组成的。

网站异质性本质使得我们很难在内容上强加某种单一的结构化组织系统。以各种不同力度对 文件进行分类,通常是不具有意义的

5.2.3 不同观点的差异性

我们把用户研究和分析方法结合起来用,以得到真正的洞察力。用户如何收集信息?他们使 用哪些标签?他们的浏览方式如何?这样的挑战是很复杂的,是因为网站是由很多人设计的, 而每个人对信息的理解方式不同。

个人的需求、观点和行为会随时间改变,因此,实际情况会更加复杂。图书馆学情报学领域 中有一个详单重要的研究主题,就是探索信息模型的复杂本质。例如_N. Belkin_所写的_< Anomalous States of Knowledge as a basis for information retrieval >

有关人们安排实体桌面和办公室空间的方法特色,可以参考_T. W. Malone_的研究_< How Do People Organize their Desks? Implications for the Design of Office Information Systems >

5.2.4 公司内部的政治文化

每个组织都有其政治化。个人和部门经常要取得影响力或尊敬。因为信息组织固有的力量, 对理解和观点的形成的很重大的影响,因此为网站和企业网络设计信息架构的流程,可能会 牵涉到政治立场的私下对决。组织系统的分类系统的选择对于用户如何看待该公司及其部门 和产品的相当大的影响。

5.3 组织网站的企业网络

组织系统 Organizing System 是由组织体系组织结构足够

组织体系 Organizing Principle 定义内容条目之间共享的特性,而且会影响这些条目的逻辑式分组方式

组织结构 定义内容条目和群组之间的关系类型

组织是与导航、标签命名,以及索引方式有密切关系。网站的等级式组件结构,通常是主要 导航系统中的主角。各类目的标签在定义该分类的内容时,扮演很重要的角色。手动式索引 或者元数据标记(_metadata tagging_)则是一种工具,可以在非常具体的层次上把内容条 目分组。

尽管关系密切,但是在设计师还是有可能将他们分开,而且这样也很有帮助。因为组织系统导航系统和标签系统的基础。把焦点放在逻辑式分组上,就不会因为实施细节而分心,从 而设计出更好的网站。 **

5.4 组织体系

5.4.1 精确性组织体系

精确或客观的组织体系,会将信息分成定义明确的区域和互斥区域。 精确性组织体系的问题是,用户必须知道他们要找的资源的特定名称已知条目搜索 精确性组织体系相当容易设计和维护,因为把条目放到类别中并不需要什么智力投入,使用起来也很方便

按字母排序:按字母顺序排列是百科全书和词典中最主要的组织体系

按年表:某些类型的信息适合采用年表的组织方式。例如新闻归档等。用户可能也会想用标 题、产品类别或地理位置浏览新闻,或者按关键词搜索。互补式的组织体系通常是必要的

按地理位置:地点通常是信息的重要特性。除了边界的争论之外,地理位置组织体系的设计 方式和使用方法都非常直截了当。

5.4.2 模糊性组织体系

使用模糊或主观的自治体死队信息分类时,会模糊掉精确性的定义。模糊性组织体系受困于 语言和组织的模糊之中,更别提还会牵扯到人类的主观性。

人们觉得模糊性组织体系好用的理由很简单:我们不见得知道我们要找什么探索式搜索

在某些情况下,你只是不知道正确的标签名称为何。或者你的信息需求相当模糊,也无法说清楚。 信息的搜索通常是重复和交互性的

一开始搜索时所找到的东西,可能会影响后续的搜索方向,以及接下来会找到的东西。这种 信息搜索过程会牵扯到一种联想式学习。不断搜寻,最后应该会找到东西,但是如果系统设 计良好,也会在搜索过程中获得学习体验。

在模糊性组织体系下进行搜寻,会得到意想不到的结果,这是因为模糊性组织体系采用有意 义的方式把条目聚集在一起。把把条目聚集在一起的结果,就会引发联想是学习的过程,使 得用户可以做新的联想,得到更满意的结论。

模糊性组织体系对用户的价值超过精确性组织体系所能给予的

按主题 以主旨或主题组织信息,式最有用且最具挑战性的做法之一。设计主题式组织体系时,定义 涵盖面的广度是很重要的

按任务 任务导向的组织体系把内容和应用程序组织成流程、功能或工作的集合。如果有可能预测用 户想优先执行的一组任务时,这一类的体系就很恰当

按用户 网站或企业网络会有两组以上可以清楚界定出来的用户,采用以用户为主题的体 系就有其意义。以用户为主的方式组织网站,会对任何形式的个性化行为带来各种优缺点。 所有模糊性体系都需要信息架构师根据经验做一些猜测,而且要随时做调整。以用户为主的 体系可以是开放式或者封闭式。开放式的体系就是让某一用户群的成员去获取为另一用户群 准备的内容。封闭式的体系就会避免不同用户群之间互通内容。如果有牵扯到订阅费用或安 全议题时,这样做可能就比较合适

按隐喻 隐喻时常帮助用户以熟悉的东西了解新的东西。使用隐喻设计界面时,用户就能直观的了解 内容和功能。此外,探索用隐喻设计的组织体系过程中,也会对网站的设计、组织和功能产 生新奇和令人惊叹的想法

隐喻探索很有用,但必须集体商讨,当你在设计以隐喻为主的全站组织体系时。首先,如果 要让隐喻成功的话,它们必须是用户很熟悉的。其次,隐喻也可能引起不想要的包袱或受到 限制。(数字图书馆应该有一名管理员)

混用 纯粹的组织体系力量来自于其有能力指出用户可以立刻理解的简单心理模型。用户很容易就 能认出用户为主的组织,或者以主题为主的组织。而且,小型且简单的组织体系可以适用大 量内容,而不会牺牲内容的正确性,或者减少其可用性。

把多种体系混合起来时,困惑就会出现,而且提出来的解决方案也无法在规模上做扩充。当 这些组织体系都混合在一起,我们无法找出某种心智模型。混用式体系唯一能对抗上述缺点 的例外指出,就存在于导航的表层内。当公司的组织及其用户以寻找内容和完成任务作为最 高优先地工作(内部系统)。因为这只牵扯到最高优先级的任务,所以这种解决方案不需要 具有规模调整的灵活性。

只有当混合体系要组织超大数量内容和任务时,问题才会出现。但深层混合体系也非常常见, 这是因为我们很难全都认同某个体系,所以我们会把多种体系组合起来。另一种做法是要和 设计师沟通,让他们了解保持每一种体系完整的重要性。只要各种体系是在网页上的不同位 置,依然可以保留住为用户建议一个心智模型的能力。

5.5 组织结构

信息结构会定义用户浏览时的主要方式。适用于网站和企业网络架构的几种主要的组织结构

等级式:自上而下的做法

几乎所有优良的信息架构的基础都是设计良好的等级式系统或者说分类法(Taxonomy)。

等级式系统在我们的生活中无处不在,而且让我们能以有意义的方式完全了解这个世界。因 为等级式相当有说服力,用户可以很容易切快速的了解使用等级式组织模式的网站。用户可 以根据网站结构发展心智模型,并了解他们在此结构中的位置。这样可以提供一种情境,让 用户觉得很自在。

设计分类法 首先,要注意到一个观念,但不要被它束缚:等级式类别之间是彼此互斥的。对单一的组织 体系而言,你必须在排他性和包容性之间取得平衡。

允许交叉编目的分类法具有**复合式等级(Polyhierarchical)**的特性。对模糊组织体系 而言,要把内容区分成彼此互斥的类别,是特别困难的。如果有太多的条目进行交叉编目, 等级式系统的价值就会丧失。排他性和包容性之间的张力无法横跨不同的组织体系。你会期 望依照格式组织的产品目录所包含的条目和以主题组织的产品目录一样。主题和格式只是查 看相同信息的两种不同**分面(Facets)**。

其次,在分类法中要注意到宽度和深度之间的平衡是很重要的。宽度指的是等级式系统中每 一层的选项数目;深度指的是等级式系统中的层数。

如果层次太窄太深,用户就得点选过多的层次,才能找到他们要找到。对又宽又浅的等级系 统而言,用户就会面临主菜单上有太多选项,而且当他们选了一个选项,却没有看到什么内 容时,就会产生不良的观感。

考虑范围时,对于一般人的视觉观察能力,以及人类心智的认知局限要仔细琢磨。我们不打 算教你那套差劲的_7±2_(G. Miller [The Magical Number Seen, Plus or Minus Two: Some Limits on our Capacity for Processing Information]。一般的看法是你的链接数 目要限制在用户视觉扫描页面的能力之内,而不是以短期记忆作为依据。

要认识到让用户承载太多选项时的危险性 在页面层次上组织信息及设计结构 让你的设计送交严格的用户做测试

和宽度相反,考虑深度时,要采取更保守的行动。如果使用这被强迫点选的层次超过两三层, 他们可能会直接放弃,并离开你的网站。由微软研究部门主持的一项研究指出,湿度平衡宽 度和深度可以提供最佳结果(Kevin Larson & Mary Czerwinski [Web Page Design: Implications of Memory, Structure and Scent for Information Retrieval]

新兴网站和企业网络如果要成长,就应该倾向于宽而浅的等级系统,而非窄而深的等级系统。 这样在增加内容是,就不用对组织结构作大幅修正。在登记时系统中的次级页面,新增条目 比在主页中增加条目会少很多问题。首先,首页是用户最主要而且最重要的导航界面。修改 首页会破坏用户长年累月在这个网站上形成的心智模型。其次,因为首页时主要而且重要的 界面,公司会花很多精力和金钱在图形设计和布局上。对主页的修改和对次级页面做修改相 比,会花费更多时间和金钱。

数据库模式:自下而上的做法

数据库的定义是「收集和整理数据集合,使能便捷地搜索和获取它们」

我们所使用的大部分重量级数据库,都是以关系型数据库模式建造而成的。在关系型数据库 结构中,数据是储存在一组关系(_Relation_)或表格(_Table_)中。表格中的数据行代 表记录,而数据列则代表字段。不同表格中的数据可以通过一系列的键值(_Key_)连结起 来。

为什么数据库结构对信息架构师而言很重要?毕竟,我们的焦点是信息的存取,而不是数据 的检索。

简言之就是**元数据**。元数据是连接信息架构与数据库结构设计的关键所在。元数据可以 让我们把关系型数据库的结构和为力,运用到异质性的、非结构化的网站环境和企业网络中。 使用受控词表的元数据为文件和其他信息对象打上标签,我们就可以进行有力的搜索、浏览、 过滤、以及动态链接。

元数据元素之间的关系可以很复杂。定义并对应这些形式上的关系,必须有很好的技巧以及 对技术的理解。

每一种实体都有其属性。这些尸体和属性会变成记录和字段。 ERD 是在设计和采用数据库之 前,建立与调整数据模型的方法。对于大型网站而言,最好是依赖于内容管理系统软件来管 理元数据和受控词表。

信息架构师必须了解元数据、受控词表及数据库结构在以下方面的用途:

  • 自动产生按字母排序的索引
  • 动态展示相关的 see also 链接
  • 字段搜索
  • 高级过滤机制和搜索结果的排序

超文本

超文本是信息结构中相对比较新的一种方法,而且是高度非线性的。超文本系统牵扯到两种 主要的组件:**要彼此连接的条目或信息块,以及块状信息之间的链接**。这些组件会形成 超媒体系统,链接文字、数据、图像、视频及音频数据。超文本数据可以按等级、非等级或 者两者并用的方式连接起来。

虽然这种组织结构有很大的灵活性,但是会引起潜在的复杂度和用户的困惑。因为超文本链 接会高度反映出个人的联想。用户无法在超文本链接之间建立一种心智模型。没有了情境, 用户很快会受不了。此外,超文本链接本质上也是个性化的产物。某人在内容条目之间看见 了某种关系,二对别人而言却不见得那么明显。因此,超文本通常不是作为主要的组织结构, 但却可以弥补等级模式惑数据库模式的不足。

超文本可以让你在等级式系统中,简历条目和区域之间有用而具有创意的关系。先将信息等 级系统设计出来,再以超文本补充等级式系统的不足,这样会比较合理。

5.5.1 大众分类

自由式标签法也成为合作式分类、大众索引法及民族志分类法。标签是公开的,作为群体导航的枢纽。

5.6 建立凝聚性的组织体系

Nathan Shedroff 建议我们把数据转换成信息的第一步就是探索其组织(continue read < Unified Theory of Design >)

如你所见,信息系统时相当复杂的,你必须考虑各种精确性和模糊性。要以主题、任务或用 户的分类方式来组织吗?年表式或地理位置体系如何?

你也必须考虑组织体系会怎么影响用户再次体系下浏览时的效果。你应不应该使用等级式系 统?或者是结构化的数据库模式?如果放进大型的网站开发中,这些问题就会令人难以承受。 这就是为什么把网站切成多个组件是很重要的。这样才能一次解决一个问题。此外,所有的 信息检索系统在应用到同质性内容这种具体领域时,能发挥最大的功效。把内容集拆成数个 具体领域,就可以找出高效率组织系统的机会。

然而,不要因此而看不见宏观的蓝图,这点也很重要。

5.7 总结

思考采用哪一种组织体系时,要记住精确性体系和模糊性体系之间的不同。精确性体系适用 于已知条目搜索,因为用户已经知道他们要找的是什么。模糊性体系最适用于浏览和联想式 学习,因为用户对其信息需求也不明确。可能的话,两种体系都用。此外,要注意网站组织 信息的挑战。语言是模糊的,内容是异质的,我们各自有不同的观点,而政治立场会让人的 本性表露无遗。提供多种方法获取相同的信息可以解决这些问题。

思考采用哪一种组织结构时,记住一点,大型网站和企业网络通常都需要用到这几种结构类 型。网站最顶端、伞状的架构几乎都是等级式架构。当你在设计这种等级式系统时,要注意 结构化且同质化的信息集合,这些潜在的字网站是数据库模式的最佳对象。最后,要记住, 条目之间缺乏结构而且具有创造性的关系时,则可以通过作者提供的超文本,或者使用者贡 献的标签来解决。这样一来,无数的组织结构就能一同运作,从而建立起凝聚性的组织系统

6. 标签系统

6.1 主题

  • 何谓标签分类以及为何重要
  • 常见标签类型
  • 开发标签的原则
  • 开发标签:利用现有资源或者从头开始

6.2 为何要关心标签命名

分类标签(Label)的明明是一种表达形式。标签的目的是有效的沟通信息;也就是说,传 递意义时,无需占用网页太多的垂直空间或者说是用户的认知空间。

标签系统如何与其它系统搭配?标签通常是向用户清楚展示组织系统导航系统的显著方式。 例如单一网页可能包含不同群组的标签,每一组代表的都是不同组织系统导航系统。范例 包括符合网站组织系统的标签,符合全站导航系统的标签,以及符合子网站导航系统的标签。

当我们和另一个人谈话时,靠的是对方持续的响应,才能把信息传达给对方。我们会不自觉 的注意到对话者并开始理清思路,准备发表他们的观点,然后我们以自己的交流方式作出反 应。

为了把交流终端这种情况减少到最小,信息架构师必须尽其所能的设计标签,使其能够和网 站用户的观点保持一致,而且又能反映出实质内容。此外,就像对话那样,对于某个标签有 问题或疑问时,也应该予以澄清和说明。标签也应该教导用户新的概念,协助他们快速辨认 出熟悉的标签。

6.3 各式各样的标签

6.3.1 标签作为情境式链接

指向其他网页中大块信息的超链接,或者只想同一张网页中的另一个位置。

情境式链接通常不是以系统性的方式创建的。情境式链接是当作着要在他的文章和某种东西 之间做链接时才会产生的特殊行为。因此,超文本链接和等级式系统中的条目相比,就显得 更加异质化而且 充满个人特色。为了让情境式链接更能代表其指向的内容,情境式链接自 然更依赖其情境。缺乏表达力的标签有其适用之处,我们很可能已经信赖作者的观点,会想 点进去多知道些。但是如果没有这种程度的信赖,则缺乏表达力的标签就有破坏力。

分类的一致性对链接标签而言不见得都办得到。这些标签会通过文章及其情境而连接在一起, 而非通过同等群体的成员关系连接在一起。然而,在这些标签与标签所指向的大块信息之间 的一致性依然是一项要记在脑海中的议题。信息架构可以自问「用户点下去之后,期待看到 怎样的信息」,确保情境式链接标签具有足够的代表性(要研究用户对标签的解读,有一个 简单的办法,就是打印出网页,上面的标签要清楚,然后让用户写下他们认为每一个链接会 指向的内容主旨)。

另一方面,承认情境式链接不在信息架构师掌控之中是很重要的。通常来讲,内容的作者要 负责创建情境式链接。

6.3.2 标签作为标题

标签是常被用作标题,二标题就是秒湖连接在其下面的大块信息。标题通常是在文章中建立 等级。

标题之间的等级关系,无论是大标题、小标题或同层次的标题,通常采用统一的编号、字号、 颜色和样式、空白和缩进,或者是这些组合起来建立的。视觉上有明确的等级,可以帮助信 息架构师减轻负担,不用去创造必须传达等级信息的标签,因此此项工作通常是由信息架构 师或图形设计时担任的。

不要太受限于等级关系也很重要。设计等级式标题时,我们可以更灵活一些,但是,在一个 流程中为每一个步骤命名标签时,维持其一致性就特别重要。位了能在一个流程中成功的浏 览,用户通常必须完成流程中的每一步,所以标题标签必须明显而且传达出其前后次序。使 用号码是一种传达过程的显著方式,而且把标签一致的命名成有行动意义的字眼,也可以协 助将步骤之间的序列联系在一起。

6.4 导航系统内的标签

因为导航系统内通常有一小群选项,因此标签应用上的一致性要求就比其它的标签更为严格。 此外导航系统通常胡子爱网站上一再重现,因此导航系统的标签设计有问题时,就会因为重 复曝光而放大。

用户是依赖导航系统的,经由一致的网页位置和外观、产生合理的行为。标签也应当如此, 有效的运用标签是建立一种熟悉感不可或缺的东西,所以标签最好不要每页更换。

当然,同样的标签通常可以代表不同类的信息。位了解决这些问题,导航标签可以在主页上 做简单的说明以强化其意义(也称为**范围批注**)

6.4.1 标签作为索引术语

索引术语是常被称为关键词、标签、描述性元数据、分类法、受控词表,以及叙词表,是一 组可以描述任何类型的内容的术语标签集合。索引术语可以代表某一块内容的意义,由此支 持更精确的搜索,而不只是简单的搜索内容中的所有文字。

索引术语也可以让浏览更容易一些:一些来着一群文件的元数据,可以作为可浏览清单或菜 单的来元数据。使用索引术语对整个网站进行索引的话,当用户搜索_Web_时,更有可能发 现该网站。( Search Engine Watch 时最有用的 资源网站,你可以再次学到_Web_搜索引擎与目录的运作方式,以及如何为网站的主页和其 他主要网站做索引)

6.4.2 图标型标签

图标能表现的信息,和文字是一样的。但图标的问题时它们能指定的词汇,远比不上文字的 效果。这也是为什么图标通常用在导航系统或小型组织系统标签中,其中选项很少。

图标一方面会增加网站的美观性,只要不影响可用性,没有理由不适用图标。如果用户经常 访问,这种图标语言自然会经由重复曝光而他们的心中建立起模式。这种情况下,图标时特 别有用的缩写,极具代表性也容易从视觉上辨认。

6.5 设计标签

设计有效的标签可能是信息架构中最困难的部分,因为语言本身的模糊性,你需要担心某个 术语的同义词、同音字等,都会影响我们理解该词的不同情境

6.6 通用原则

内容、用户和情境会影响信息架构的各个层面,对标签而言更是如此。我们如何确定标签能 够更具表达力,更少点模糊性。

6.6.1 尽量窄化范围

窄化的商业情境就是指网站的目标和架构更明确,标签也会达到更明确的效果。 如果我们把网站锁定在更加明确的用户上,就能减少某个标签可能的意义范围。

另一种方法是,如果网站的内容、用户和情境都保持简单和集中时,明明标签之事就简单许 多。

如果网站必须挤入所有生意,则避免使用代表整个网站内容的标签。但是为其他领域命名标 签时,把内容分成模块并予以简化后置入各子网站中,用来满足特定用户的需求。这样做会 让你的设计具有模块化的优点,而标签的集合也更简单,更能代表这些特定领域的内涵,但 同时也会导致网站不同的区域产生个别的标签系统。

6.6.2 开发一致的标签系统,而非标签

成功的标签系统的特质就是统一其下所有成员。在成功的标签系统中,其中一种特质就是一 致性。

因为一致性代表的就是可预测性,当系统可预测时,就容易学习。 一致性会受到很多因素影响:

  • **风格**:标点符号和大小写的用法不一致是标签系统常见的问题,如果无法消除,可以由样式只能解决(< The Elements of Style > by Strunk & White)
  • **版面形式**:字体、字号、颜色、空白、分组方式的一致性应用,可以从视觉上强化标签群组的系统性本质。
  • **语法**:常常看到有以动词为主的标签,名次为主的标签,还有疑问句的标签,这些标签混杂在一起使用。在特定的标签系统中,考虑选择一种单一的语法样式,然后遵守下去。
  • **粒度**:在标签系统中,让标签的意义能大致等同于他们特定的内涵是有帮助的。不考虑例外情况,用户碰到一组标签其含义有不同的粒度,则会感到困惑。
  • **理解性**:用户可能会对标签系统中的大缝隙给绊倒。(例如,服装零售网站列出了裤子、领带、鞋子,但是没有列出衬衫,会让用户以为哪里出错了,或者衬衫卖完了)。
  • **用户**:要考虑网站的主要用户语言。如果每一种用户使用不同的术语,则要为每一种用户开发独立的标签系统,即使这些系统说的都是同样的东西。

6.7 标签系统的来源

6.7.1 现在要准备设计标签系统了,要从哪里开始呢?

你的网站、或类似网站、或竞争对手网站上,现有的标签系统可能包含你所需的标签。问问自己,谁曾使用过这些标签。学习、研究,以及借用在别的网站上发现的词汇。研究现存标签系统最主要的好处是它们是系统化的,而不是一群奇怪、各自为政的随意混杂起来的标签集合。

6.7.2 你的网站

一个有用的做法是抓出单个文件内现有的标签。这样做的话,要走遍整个网站,无论是自动还是手动,把标签收集起来。你可以考虑使用简单的表格整理它们,这张表包含标签清单、每个标签的概况,以及其代表的文件。建立标签表格,通常是清点内容过程中的自然步骤。 以表格的方式整理标签,可以使用集中、更完整、更精确的观点看待网站的导航系统,将之视为一种系统,不一致的地方就很容易找出。

6.7.3 类似的网站和竞争对手网站

最有可能的是事先弄清楚用户需求,然后查看竞争对手的网站,借用一些能用的东西,也要注意什么是不能用的。如果你观察了许多类似网站或竞争对手网站,就会发现标签的模式开始出现。

6.7.4 受控词表及叙词表

受控词表和叙词表,这些相当有用的资源是由图书馆员或特定的领域专家所建立的,确保表达方式精确且一致

6.8 创建新的标签系统

当没有现存的标签系统,或者想做一些特殊设计时,就会面对要从头建立标签系统的挑战。最重要的来源就死内容和网站用户。

6.8.1 内容分析

标签可以直接来自网站的内容。你可以读取网站中有代表性的内容,然后为每份文件速记一些关键词。如果你走这条路,可以把焦点放在内容中具代表性的数据,如标题、总结和摘要,以此加快整个过程。

6.8.2 内容作者

另一个手动做法是要求内容作者为他们的内容建议标签。如果你可以接触到作者,这可能是有用的。但是作者并不是专业的索引者,所以他们的标签不能照单全收,而且不够精确,作者提供的标签应视为有用的候选版。

6.8.3 用户代言人及主题专家

另一种做法是找到专门的用户或所谓的用户代言人,可以从用户的角度发言。秘诀就是和了解用户需求的人一起工作。

6.8.4 直接来自用户

网站的用户可能告诉你标签应该怎么写才对,无论是直接还是间接的。这虽然不是最简单的办法,但是一旦拿到了,它就是标签的最佳来源。

  • **卡片分类(Card Sort)**:是训练用户如何使用信息的最佳方式之一
  • **自由列表(Free Listing)**:是取得用户建议的标签成本更低的方法。自由列表相当简单:选个项目,让实验对象瞬间想出一些字眼予以描述。你可以自己做,或者使用远程的方式。(此方法参见 Rashmi Sinha 的文字 < [Beyond Cardsorting: Free-listing methods to explore user categorizations
  • 你也要考虑下实验对象:谁(对整体用户而言有十足的代表性)以及有多少(三五个也许 无法产生科学性的重要结果,但总好过没有)。你可能想要把实验对象为他们所建议的词 汇排除等级,作为决定何者为最佳词汇的方式。

你也得选出哪些条目要通过头脑风暴的方式产生瞬间词汇。显然,你只能对内容的一部分自 己做这种事情。你可以选择一些有代表性的内容,诸如一些公司的产品。但即便如此该选哪 个商品呢?所以最后会在选择的一些产品之间得到平衡,从而进行自由列表活动。

最后得到结果后,该怎么做?寻找模式及使用频率。这样的模式可以让你了解如何为个别条 目命名标签,也可以看出用户语言的整体语调。你可能会注意到他们的行话用的不少,或者 恰好相反;或许你发现他们的标签中采用所写的数量多得惊人,或者其他模式会从自由列表 中突现。所得结果不会是成熟的标签系统,但是,当你在开发标签系统时,这会让你对于应 该采取什么基调和风格有比较好的感觉。

6.8.5 间接来自用户

多数机构都是位于描述用户需求的数据领域顶端。分析这些搜索查询是调整标签系统的绝佳 方式,更别提用于诊断网络其他各种问题。此外,通俗标记法也是一种有关用户需求的间接 来源,相当有价值,有助于信息架构师开发标签系统。

  • **搜索日志分析**:是最没有入侵性的数据来源方式,用一获取网站用户实际使用的标签信息。分析搜索查询字符串是了解你的网站用户通常在使用的标签种类。
  • **标签分析**:使用通俗标记法的网站,对于标签分析的数据的用法, 也类似于搜索日志分析。

6.8.6 调整和微调

你的标签清单可能还很原始,是直接从网站的内容去的,从网站的用户而来,或者是你自认为应该运作的最好的想法,或者,可能来自于受控词表重的东西。无论如何,都得再加工,才能变成有效的标签。

  • 首先,以字母为顺序排列属于清单。
  • 然后,检验清单。检查其用法、标点符号、字母大小写等的 [一致性]。

要决定哪些术语放进标签系统中,必须考虑系统的宽度和规模: 首先,要找出标签系统是否有明显的差距,标签系统中是否包含网站所有必须包含的东西。 如果网站的标签系统以主题为主,试着考虑还没加进网站中的主题。你可能会惊讶这些标 签加入后对标签系统的影响,说不定大到要让你改变整个惯例。如果你没有做这样的预测, 可能会碰上未来的内容无法放进网站中的情况,因为你不知道该怎么制定标签。事先考虑 和规划未来新增标签的情况,才不会破坏当前的标签系统。

当然,你的标签系统今天要达成什么目标,对此要有所理解,然后和此规划之间要取得平衡。尽量把你的范围窄化,集中焦点,使得它能够清楚的描述你的网站独有的内容需求,解决用户的特殊需求,以及满足事业目标。

最后,要记住一点,标签系统必须时常调整和改进。因为标签代表两种东西之间的关系(用户和内容),而这种关系会市场变动。

7. 导航系统

7.1 主题

  • 平衡网站导航中的情境和灵活性
  • 合全站、区域,以及情境式导航
  • 助导航工具,诸如网站地图、索引、指南、向导,以及配置器
  • 个性化、可视化、标签云、协同过滤,以及社会化导航

7.2 导航的种类

导航系统是由几个基本元素或者子系统所组成的。嵌入式导航:

7.2.1 全站导航系统

所谓的全站导航系统就是在网站上的每一页都会展示的全域导航系统。全站导航常常是网站中单一且一致的导航元素,所以对可用性而言有很大的影响,因此全站导航系统应该密集且重复来访的用户为中心,进行设计和测试。

7.2.2 区域导航系统

在许多网站上,全站导航系统由区域导航系统辅助,使得用户可以立刻探索那些区域。有些严格控制的网站会把全站导航和区域导航整合成一致且统一的系统。 有些区域导航系统和其所提供的内容时常会不同,使得这些区域被称为子网站。子网站存在的理由有两点。首先,内容和功能的某些区域实际上是值得采取独立的导航手段。其次,由于大型组织由分散的本质,不同的人通常是负责不同的内容区域,并且每一分组会以不同的方式处理导航。

7.2.3 情境式导航

有些关系不适合放在全站和区域导航结构分类中,此时就需要建立情境式导航链接,指向特定的网页。 这样一来,情境式导航可以支持联想式学习。用户可以通过探索定义条目之间的关系进行学习。用户可能会了解他们还不知道的有用产品,或者引起他们对以前从来没想过的主题产生兴趣。情境式导航可以让你建立一种具有连续性组织的网站,使得用户和组织都能受益。 通常,情境式链接都是用内联的超文本链接。如果这些情境式链接对内容比较重要,那么这种做法就有问题。因为用户都是很快速的扫描网页,会忽略掉不那么明显的链接。因此,你可能想设计一个系统,在网上提供一个特定区域或者视觉惯例,供情境式链接使用。适度是建立这些链接的主要原则。保守使用情境式链接,可以增加某种程度的灵活性,弥补现存导航系统的不足。过度使用情境式链接,会增加混乱和困惑。每一张网页要采用的做法,应该由情境式链接的本质和重要性来决定。

7.2.4 辅助性导航系统

辅助性导航系统时确保大型网站的可用性和可寻性的关键因素。

  • 7.2.4.1 网站地图

    网站地图具有较少的层次感,典型的网站地图是展示信息层次的顶端几层,在内容上提供更宽广的视野,方便随机存取被分隔的各部分内容。 网站地图是网站上最自然的东西,有助于等级式的组织。如果架构本身的层次不强,则采用线索或另一种可视化表示方式可能比较好。 从搜索引擎最佳化的观点来看,网站地图可以指示搜索爬虫直接通向整个网站上的重要网页。 网站地图的设计对其可用性有很大的影响,和图形设计师工作时,要确保他了解下列原则:

    • 强化信息层次,使得用户对内容的组织方式愈加熟悉
    • 对了解网站用途的用户,则便利其快速、直接访问内容
    • 避免让用户承担太多信息。目标是协助用户
  • 7.2.4.2 索引

    网站的索引也是以关键词或词汇按字母顺序排列而成的,没有展示出等级关系。因此当用户已知他们要找的东西名称时,索引就相当有用。对于大型且复杂的网站通常都需要网站地图和网站索引。网站地图会强化层次,促使用户探索,而网站索引会跳过等级,方便寻找已知条目。对于小型网站而言,网站索引单独存在可能就够了。 为网站编织索引最主要的困难是粒度问题。要找出答案,你必须了解你的用户,了解他们的需求。你可以分析搜索日志,对用户做研究。 建立网站索引有两种方法。对小型网站而言,可以利用你对内容了解的知识来决定要引入哪些链接,然后手动创建索引。对于大型网站而且分布内容管理者,在文件层次上采用受控词表编织索引,在自动产生网站索引,可能会比较合理。很多受控词汇可能出现在很多文件内,这种索引必须经过两个步骤。首先,用户从索引中选择术语,然后,再从以该术语为索引的文件清单中选出想要的。 索引的排序有用技巧牵扯到**术语轮排**,也称**交替(Permutation)**。可进行替换的索引会轮排词汇中的字,这样用户就可以在字母顺序序列中的两个地方找到该词汇。你需要在用户寻找特定术语的几率,以及放太多替换术语使得索引混乱之间取得平衡。如果有时间最好做一些用户测试,如果没有,最好以常识为依据。

  • 7.2.4.3 指南

    指南有好几种,包括演示、教程,以及针对特定用户、主题或任务而设的具体网站。无论是哪一种,指南都能补充现有的浏览和理解网站内容的方法。 指南通常是为新用户介绍有关网站内容和功能的有用工具,同时也为有限制访问的网站提供一个相当有价值的营销工具,能够让潜在的顾客知道花钱可以得到什么。对内部而言也很有价值,可以提供一个机会把重新设计过的网站的重点特色展示给同事。 指南基本上是现行导航的(新用户是想接受指引,不是被丢进去)但是超文本导航可以提供其他灵活性。 设计导航的原则如下:

    • 指南应该要短
    • 无论何时,用户都能离开指南
    • 导航的位置在每页都应该相同,这样用户才能在指南中反复移动
    • 指南的设计应该是用来回答问题的
    • 截图应该干脆、明确及最佳化,具有把重点功能放大的效果
    • 如果指南有好几页,则有可能需要目录

    指南的用途是为新用户做介绍,也是进行网站营销的机会。但实际上它不是每天都有在用,不会是网站的重点所在,所以你应该在这两者之间取得平衡。

  • 7.2.4.4 搜索

    搜索是辅助导航的核心 导航系统的设计会让我们深入信息架构、交互设计、信息设计、视觉设计,以及可用性共之间的灰色地带。这些都可以在用户体验设计这把大伞下被分类

7.3 建立情境

即使手上有各种导航系统,但是在计划我们的路线之前,必须先搞清楚我们所在的位置。设计复杂网站是,在较大的整体中提供情境特别重要。 一定要遵守一些法则,确保你的网站有提供情境的线索。例如用户应该一直知道她们在浏览那个网站,即使他们通过搜索亲活着附属网页的链接跳过网站的首页。把组织的名称、标志和身份识别图放进网站的所有页面中,是达到此目的最显著的方法。 导航系统应该以明确且一致的风格,展现信息等级结构,而且要指出用户当前的位置。 如果你有网站,我们建议让一些用户来做压力测试(_Navigation Stress Test_),以下是基本步骤:

  1. 忽略首页,直接跳进网站里面。
  2. 随机选择一张网页,你能知道你的位置与网站其他部分的关系吗?你正在哪个区域?上层页面是什么?
  3. 你能知道这张网页能把你带去哪一页吗?链接文字说明足够让你知道链接背后是什么吗?链接是否有足够的差异性,可以让你根据想要做的事做选择?

7.4 改善灵活性

等级式的导航有其优点,但是却无法在横向自由的移动。使用超文本链接可以解决这个问题。

7.5 实践嵌入式导航

导航系统设计最常碰到的困难,就是在移动的灵活性与提供太多选项之间取得平衡。成功的关键之一就是认识到全站、区域和情境式导航元素都在大多数网上同时共存。有效的整合,就能彼此互补。但是当这三种系统独立设计时,他们会结合起来垄断很多的页面空间。独自存在时,每一种都很好管理,但全放到一张网页上,各种不同的选项可能会让用户受不了,结果淹没了内容。在某些情况下,你必须重复访问在每一导航条中的各种选项才行。其它情况下,通过小心的设计和布局,这种问题可以减到最小。 **文字导航还是图形式导航比较好呢**?文字标签最好做,也最能表现出每一个选项代表的内容。用图标很难表达出抽象概念。而图标可以弥补文字的不足,因为常客对图标很熟悉,不用再读文字标签,而且图标可以让快捷菜单选取更为便利。

7.6 高级导航方法

7.6.1 个性化和定制化

个性化(Personalization)就是针对个人的行为、需求或喜好的模式,提供裁剪后的网页给用户。 定制化(Customization)是给用户直接控制权,可以针对展现格式、导航和内容选项的组合做调整。 个性化和定制化都可以用来补充现存的导航系统

  • 通常扮演重要但有限的角色
  • 需要扎实的结构和组织基础
  • 很难做好

个性化在特定的情境中运用的很好,但是当你将之扩展到整个用户体验时,就会失败。 定制化的问题在于大部分都不想花时间进行定制,或者只愿意在少部分对他们而言很重要的网站上这么做。 还有个问题,即使用户自己,也不见得知道明天要知道什么或做什么

7.6.2 可视化

使用隐喻的方式建立网站

7.6.3 社会化导航

社会化导航(_Social Navigation_)的前提是建立在个人的价值观可以从其他用户的行为中推论出来的基础之上的。社会化导航依然有着伟大的前途。

8. 搜索系统

8.1 主题

• 决定你的网站是否需要搜索系统搜索系统详解 • 让什么东西可以搜索 • 搜索算法的基础 • 如何呈现搜索结果 • 搜索界面设计 • 何处深入学习

8.2 网站需要搜索功能吗

让网站支持搜索功能钱, 要三思而后行: • 网站有足够的内容吗 如果你的网站比较像图书馆,搜索可能就有意义。如果是这样,再来就要考虑内容的数量,然后在建立和维护搜索引擎所需的时间,以及搜索引擎能够带给网站用户的好处之间取得平衡。 • 投资搜索系统会不会转移更有用的导航系统的资源 如果搜索引擎能够利用设计优良的导航系统的各方面优点,搜索系统会运作的更好。如果搜索系统导航系统合作无间,用户就能从这两种寻找工具中受益。 • 你有时间和技术为网站搜索引擎做最优化工作吗 如果你不打算花时间把搜索引擎调整到最佳状态,那么就要再重新考虑是不是真的要使用搜索引擎。 • 有更好的替代方案吗 如果没有信心配置搜索引擎,或者没钱去购买,则可以考虑改用网站的索引。 • 网站用户讨厌搜索吗 你的用户不见得就喜欢搜索,有时候他们更喜欢浏览。 • 有太多信息要浏览而搜索会有帮助时 你的内容脱离了浏览系统,或者用户在网站上找内容找到快疯了,那就是搜索引擎该现身的时候了。 • 搜索可以协助成片断的网站 像许多大型企业那样,各个业务部门自行其是,以极少的标准原则任意开发内容,而且可能没有元数据支持任何合理的浏览机制。如果是这样,你还有一段路要走,搜索无法解决所有问题,跟别说用户问题。但是首先应该建立一个搜索系统,尽可能的跨部门的内容涵盖在内,以执行全文搜索。 • 搜索是学习工具 通过搜索日志分析,你可以搜集有用的数据,有关用户实际上想从你的网站得到什么,以及他们如何表达需求。 • 搜索应该在那儿,因为用户希望在那儿 如果网站是个实用网站,可能就值得采用搜索引擎。理由如下:用户不见的想浏览网站的结构,他们的时间有限,而且认知的承载力门槛远低于你的想象。 • 搜索可以驯服动态性 如果网站有高度动态内容,你也应该考虑建立搜索系统。例如新闻网站。你可能没有时间每天手动分类内容。

8.3 搜索系统详解

搜索系统基本解析(Semantic Studio < In Defense of Search >)

8.4 选择要搜索什么

建立搜索区域(Search Zone)可以让用户能够集中他们的搜索;搜索区域中应包含叫具有同质性的内容。 有很多方式可以建立搜索区域,你可以把文件分隔开,或者嵌入标签。再决定网站的组织体系时,通常也会帮你决定出搜索区域 • 内容种类 • 用户 • 角色 • 主旨/主题 • 地理位置 • 年表法 • 作者 • 部门/业务单位 诸如此类。就像浏览系统那样,搜索区域可以让一大块内容以新的、有用的方式重新切块切片,提供用户以不同的观点浏览网站及内容。但是搜索区域是把双刃剑,这也是很自然的。通过搜索区域窄化搜索可以改良结果,但是,交互时传会增加复杂度。所以,要小心;很多用户在开始搜 fpcifj 会忽略搜索区域,而是倾向于输入简单的搜索字符串以执着索整全网站的索引。所以,用户可能不会碰触你细心做出来的搜索区域,直到他们通过高级搜索界面做第二轮搜索之时。 下面是一些切块的切片的方法:

8.4.1 导航 vs. 目的地

大部分网站至少有这两种网页:导航网页的目的地网页。目的地网南存放实际信息:比赛分数、书评等。导航网页可能含有主主页、搜索页,以及帮助你浏览网站的网页。网站的导航网大同小异最重要的目的就是让你到达目的地网页。 当用户热量索网站时,假设他是在找目的地网页,这很合理。如果导航网页也包含在搜索流程中,则只会弄乱搜索结果而已

8.4.2 为特定用户做索引

如果你已经决定采用以用户为导向的组织体系为架构,则根据用户作切割建立搜索区域也是很合理的。有了搜索区域,索引间的重叠就会减少,因而增加搜索效果。

8.4.3 以主题做索引

8.4.4 为新近内容做索引

以年表的方式组织内容,可能是最简单的搜索区域做法。因为国旗的数据通常不会模糊,而且日期信息一般也很容易加上去。

8.5 选择要对什么内容组件做索引

对网站的某些局部内容提供访问途径是很有用的,同样的,让用户可以搜索文件中特定的组件也有其价值,这样可以让用户检索出更具体而准确的结果。 Salon 的网站搜索系统可以让用户善用网站的结构,支持下列内容组件搜索:文章主体、标题、URL、网站名称、链接、图像链接、图像的替代文字、说明、关键词、远程锚文本 但是用户会觉得使用这些组件做搜索很麻烦吗?我们可以根据搜索查询记录来了解情况。但如果搜索系统还没有实现,我们是否知道用户会善用这种特殊的功能吗? 这个问题引发难以解决的矛盾:即使永固受益于这种玛丽增强的搜索功能,但是从早期的用户研究中发现,用户不太可能自行要求。用户对搜索系统的复杂度和功能没有太多的了解。运用用例(use case)和场景(Scenarios)可能挖掘出一些理由来支持具有这种细节程度的搜索功能。但直接研究网站的用户,觉得有价值的搜索界面可能会更好,然后再决定是否提供类似功能。 利用网站结构还有另一个原因。内容组件不是只有增进搜索精确度而已,还可以让搜索的结果格式更有意义。

8.6 搜索算法

(参考书籍 < Modern Information Retrieval > by Ricardo Baeza-Yates & Berthier Ribeiro-Neto)

8.6.1 模式匹配算法

查全率和查准率两种不可兼得,考虑用户的利益然后取得平衡。有些搜索引擎会提供自动词干搜索(Automatic Stemming)功能,把一个属于扩展,包含其他共享相同词干的术语。这样有助于查全率。 另一个考虑的是内容的结构如何。只搜索对应的字段还是全文搜索?

8.6.2 其他做法

协同过滤法(Collaborative Filtering)以及引文搜索法(Citation Searching)这些做法又更近了一步。

8.7 查询辅助工具

• 拼写检查工具 • 语音工具 • 词干搜索工具 • 自然语言处理工具 • 受控词表和叙词表

8.8 展示结果

当搜索引擎把结果组合好后要显示时,会发生什么事呢?有很多方式可以展示结果,所以,你还是得做一些选择。一如既往, 了解网内容以及用户如何使用它的神秘艺术,会成为选择过程中的主要驱动力。 当你在配置搜索引擎该如何显示结果时,要考虑连个主要的议题:对每一份搜索出的文件而言,要显示哪些内容组件,以及如何列出分组这些结果。

8.8.1 要显示哪些组件

最简单的原则就是,对那些已经知道自己要找什么的用户,信息就少显示一点。但是对那些不确定自己要找什么的用户,信息就多显示一点。另一个变通的做法是,对那些已经知道自己要什么的用户,就显示代表性的内容组件(如标题或作者),以协助用户迅速区分他们搜索的结果。对那些不确定自己要找什么的用户,则可以从描述性的内容组件中受益不少,像是摘要或关键词,对他们想要搜索的结果产生一点感觉。你也可以提供一些选项让用户决定要显示什么;不过,设定默认情况是,还是要考虑用户最常见的信息需求。 每一条结果要显示多少信息,也是决定一般的搜索结果集又多大的公式。也许你的网站很小,或者大部分用户的查询都有特定的目标,使得他们只会搜索出一小部分的结果。如果你认为在这些情况下用户会喜欢多一点信息,也许可以让每一条结果多显示一点内容组件。但是,无论你指定了多少方式,搜索结果太多而一个页面无法全部显示时,许多用户是不会去看第一页以后的结果的。所以,每一条结果不要提供太多内容组件,不然,前面几条结果可能会阻碍其余的结果。 每一条结果要显示哪些内容组件,也是取决于每一文件中有哪些组件可用(也就是内容的组织方式),以及内容要怎么来用。如果内容没有什么结构,或者你的搜索引擎是搜索全部的文字,那么在文件的上下文中显示查询术语,也算是这个主题的另一种变通做法。

8.8.2 要显示多少文件

要显示多少文件,多数是由两个因素决定的。如果你的搜索引擎的配置是药味每一条搜索出的文件显示很多信息,可以考虑显示小一点的搜索集,反之亦然。此外,用户的屏幕分辨率,联机速率,以及浏览器的设定都会影响能够有效显示的结果数量。简单化是最安全的,只显示一小群结果,但是提供很多设定值,可以让用户根据其需求选取。 一定要在用户浏览搜索结果时,让他们知道搜索出的文件总数是多少,这样他们才知道后面还有多少文件要看。此外,也可以考虑提供结果的导航,帮助他们在结果之间移动。

8.8.3 列出结果

现在你有了一群搜索结果,也了解想针对每一条结果显示哪些内容组件,那么这些结果应该以什么次序列出?一如既往,答案取决于你的用户有什么信息需求,他们想收到什么样的结果,以及他们想怎么使用这些结果。 列出结果的方法,常见的有两种:排序(Sorting)和排名(Ranking)。结果可以按日期进行时间排序,也可以按任何内容组件的字母顺序排列(标题、作者、部门),还可以由搜索算法进行排名(如相关性、受欢迎程度)。[如何定义相关性] 用户如果要做决策或采取行动,排序就相当有用。任何内容组件都可以排序,但是要提供有用的组件给用户排序,以帮助他们实际达成任务。 如果有必要理解信息或学习事物时,排名就有用处。排名通常描述搜索出的文件的相关性,从最相关的排序到最无关的。用户通常会假定上面少数几条结果就是最佳结果。 • 按字母排序 任何内容组件都能按字母顺序排序。字母顺序是很好的通用排序法,尤其是排序姓名时。 • 按年表排序 如果你的内容对时间很敏感,年表排序就是有用的做法。 • 按相关性排名 相关性排名算法通常是按下列项目之一或其中几项决定的: • 搜索出的文件中含有多少个查询字符串的术语? • 这些术语在文件中出现的频率有多高? • 这些术语出现的位置有多近?(相邻?同句?同段?) • 术语出现在何处?(出现在标题时,通常比出现在征文相关性高) • 查询术语出现在所在文件的受欢迎程度(链接的频率,以及文件中链接的来源是否也受欢迎) • 根据受欢迎程度排名 受欢迎程度是 Google 受欢迎的原因,其做法是把搜索出文件中的链接数目列入重要因素之中。Google 也区分这些链接的质量:链接来自网站,如果有接收很多链接,则表示此链接的价值高于来自不知名网站的链接(此算法称为 PageRank) • 以用户或专家评价排名 越来越多的情况下,用户愿意评价信息的价值。用户的评价可以作为结果排序的基础。 • 按订单付费排名 位置付费(Pay-for-Placement PFP)变成了 Web 搜索中越来越常见的东西。网站出价者越高,在用户结果列表中的等级就越高

8.8.4 分组结果

尽管我们可以用各种方式列出结果,却没有一种是完美的。像 Google 的混合式做法就很有希望,但通常必须介入搜索引擎的设计工作。另一种替代排序和排名的做法是比较有希望的:依照某个共同的方面把结果聚集起来。微软和加州大学伯克利分校的研究人员的研究显示(参见 < Human Factors in Computing Systems > 中 「Optimizing Search by Showing Result in Context」)当结果按类别和等级分组时,可以改善效果。 我们怎么分组呢?明显的方式都没什么用,我们可以使用现有的元数据,诸如文件类型以及文件建立/修改时间,让我们把搜索结果分成几个组。比较有用的事从手工添加的元数据衍生出来的组群,诸如主题、用户、语言、以及产品家族。可惜价格昂贵。

8.8.5 导出结果

你已经提供了一组结果给用户了,接下来呢?显然,他们可以继续搜索,沿路修改他们的查询以及他们搜索思路。或者他们已经找到了想要的东西。情境式的询问和任务分析技术可以帮你了解用户对结果做些什么。 • 打印、寄送或储存结果 显然他可以打印,并非所有文件的设计都是可以打印的。使用 print.css 来对打印进行友好的排版。 • 选择结果的一部分 有时候你想带在身边的文件不止一份。必须有个方法标示出你要的文件。 • 储存搜索 在某些情况下,你想保留的是搜索本身,而不是结果。保存搜索,在通过 feed 来订阅搜索结果。

8.9 搜索界面设计

虽然信息检索的文献包括很多搜索界面设计的研究,但是很多变量会阻碍设计搜索界面的正确做法: • 搜索的专业水准和冬季 用户习惯特殊额查询语言吗,或者他们宁可使用自然语言?他们需要简单界面或高级界面?他们会努力去做而成功的搜索吗,或者只是有够好的结果就满足了?他们愿意尝试反复搜索多次吗? • 信息需求类型 用户只是想尝一口,或者他们是想做全面性的搜索?什么样的内容组件可以帮助他们点击文件时作出良好的决策?结果应该简洁,或者对每一份文件都应提供详细的细节?此外,用户愿意提供很详细的查询表达是以表达需求吗? • 被搜索的信息种类 信息是由结构化字段构成或者全由文字构成?那是导航网页,或是目的地网页,还是两者都有?是 HTML 文件还是其它非文本格式?内容是动态的还是比较静态的?是否贴有元数据这类标签?全是字段或者全是文字? • 被搜索的信息数量 用户会受不了搜索出文件的数量吗?多少结果才合适呢? 就目前而言你,假设最好的做法是让搜索界面尽可能简单,是相当合理的。除非你的网站用户是图书馆员、研究人员或特定专家,否则他们不会花太多时间或精力思考完整的查询字符串。因此,最好让你的搜索界面尽可能的简单:提供一个简单的搜索框和一个搜索按钮给用户使用就行了。

8.9.1 搜索框

用户会假设搜索的运作方式,而且在设计搜索系统时,你会想做些测试。一些常见的用户假设如下: • 我只需输入一些术语描述我要找的东西,搜索引擎会把其他事情做好 • 我没有必要输入哪些可笑的 AND、OR 或 NOT • 我不用担心我输入的术语的同义词 • 字段搜索?我没有时间去搞清楚我可以搜索哪些字段 • 我写的查询字符串会搜索整个网站 如果你的用户有这一类的假设,而且没有特别的动机学习你的网站搜索运作上的差异性,那么就请跟着潮流走。 相反的,找机会教育那些已经准备好要学习的用户。最佳的时机是在初次搜索之后,用户无法做决定或感到沮丧的时刻。

8.9.2 高级搜索:说不

和僵硬的搜索框不同,高级搜索界面可以对搜索系统做更多操作,而且通常是由两种类型的用户在使用:高级用户一集受挫的搜索着,需要修改最初的搜索内容。但我们发现,高级功能和我们最初的假设相违背,很少有用户会使用它。

8.9.3 支持修改功能

我们有说过用户找到像红枣的搜索完成之后,还可以做什么。但事实并非总是如此,一下是一些原则可以帮助用户磨练他的搜索: • 在结果中重复搜索 我要找的是什么?有时候用户很健忘,尤其是在成堆结果中转来转去之后。在搜索框中显示最初的搜索字符串会相当有用。 • 说明结果来自何处 让人搞清楚搜索出来的内容是什么很有用处,尤其是如果你的搜索系统支持多种搜索区域。 • 说明用户做了什么 如果搜索的结果难以令人满意,可以说明背后发生了什么事,让用户了解情况,并提供一个跳板让他可以修改。「发生了什么」的设计出了可以参考前两项原则之外,还有下列几点药考虑: • 重述查询 • 说明搜索了什么内容 • 说明任何可用的过滤器 • 显示隐形布尔运算符或其他运算符 • 显示其它当前的设定值,如排序次序 • 提及搜索结果的数目 • 整合搜索与浏览 要找机会把搜索系统和浏览系统连接起来,让用户能在两者之间跳来跳去

8.9.4 用户被绊住时

你可以全力支持反复式搜索,并且和浏览、搜索技术,以及展示算法完全整合,但是用户还是常常得不到他们想要的。当搜索结果是 0,或者结果太多时,你要怎么办?我们建议采用无尽头策略解决这种问题。无尽头就是说用户永远都有别的选择,即使是 0 结果: • 修改搜索 • 提供搜索技巧活其它改进搜索的建议 • 浏览的工具(包含网站的导航系统或网站地图) • 如果搜索和浏览无法运作,就与人联系

9. 叙词表,受控词表,以及元数据

9.1 主题

• 元数据和受控词表的定义 • 同义词环圈、规范文档、分类体系,以及叙词表概论 • 等级、等价,以及相关关系 • 分面分类法以及指南式导航

9.2 元数据

对数据处理而言,元数据是一种用于定义的数据,能够提供其它被某种应用软件或环境所管理的数据的相关信息或者说明。元数据可能包含描述性信息,说明数据的情境,质量和状态,或特征。

9.3 受控词表

受控词表是任何一组自然语言的子集。最简单的说法是,受控词表是一份等价术语(Equivalent Term)清单,按同义词环圈(Synonym Ring)的形式排列,或者是一份优选术语(Preferred Term)清单,储存在规范文档(Authority File)中。定义术语之间的等级关系,就有了分类体系。建立概念之间关系的模型,就是在做叙词表。

9.3.1 同义词环圈

把一组定义为等价关系的词汇连接起来,以供搜索之用。事实上,这些词通常不是真正的同义词。 在检查搜索日志,并和用户对话之后,你将发现不同的人在寻找同样的东西时,会输入不同的术语。也许没有优选术语,或者,至少没有良好理由去定义它们。那么就可以善用搜索引擎建立同义词环圈。最简单的做法就是把一组等价术语放到文本文件中。当用户输入一个词汇给搜索引擎时,就拿这个词汇和文本文件进行比较,如果没有找到词汇,则查询扩展,将所有的等价术语都包含进来。(以布尔逻辑而言是: (kitchenaid) becomes (kitchenaid or “kitchen aid” or blender or “food processor” or cuisinart or cuizinart)) 同义词环圈也会带来新的问题。如果查询术语的扩展是在幕后进行,用户看见一些结果并没有包含其关键词时,会感到困惑。此外,使用同义词环圈可能产生比较无关的结果。 • 查全率 = 相关文件数量/文件总数 • 查准率 = 相关文件数量/系统中相关文件总数 对信息检索而言,通常加强一端,就要牺牲另一端。这点对受控词表的使用也有暗示作用。同义词环圈可以大幅改善检索。在一个小型数据库中使用同义词环圈,可以增加 20%-80% 的查全率。但同时也会降低查准率。良好的用户界面设计以及对用户的目标有了解时,可以帮我们达到最佳的平衡。

9.3.2 规范文档

规范文档放的就是一份优选术语或是可接受值的清单,不含有磁性变化或同义词。规范文档通常也包含优选术语(Perferred Terms)和异形术语(Variant Terms)。也就是说,规范文档时同义词环圈,其中是将术语定义成优选术语或可接受的值。 此时我们可能会遇到问题,有关规范文档在线上环境中的使用方式和价值所在。因为用户可以执行搜索,把很多属于对应到某个概念中,所以我们真的有需要去定义优选术语吗? 首先,有很多有段的原因。规范文档对内容作者何索引者而言都是有用的工具,可以让他们有效且一致的使用认可的术语。此外从受控词表管理的角度来看,优选术语可以视为每一组等价术语中唯一标示,这样在对异性术语进行新增、删除和修改时更有效率。 采用优选术语还对用户有很多好处。某些情况下,你也是在帮助用户修正拼写错误。其他情况下,你可以说明专业术语、或者建立品牌认同感。

9.3.3 分类体系

分类体系(Classification Scheme)就是优选术语的等级式排法。最近很多人喜欢用分类法(Taxonomy)。分类法有很多的好处: • 前端可浏览类似 Yahoo 做法的等级系统,是用户界面中可看的且不可或缺的一部分 • 由信息架构师、作者,以及索引者使用的后端工具,可以组织文件,为文件制定标签。 (比如杜威十进制分类法 DDC,参见:OCLC)

9.3.4 叙词表

我们所谓的叙词表是整合在网站或企业网络内,用以改善导航和搜索效果。叙词表是一种概念的语义网络,把词汇和同义词、同音异义词、反义词、上位类术语的下位类术语,以及相关关系术语连接起来。虽然传统的叙词表可以帮我们从一个词找到好多个词,但是,我们的叙词表所做的事刚好相反。其最重要的目标是同义词管理,把许多同义词或异形术语对应到某个优选术语或概念上,使得语言的模糊性不会妨碍用户找到他们所需的东西。 叙词表构建在较简单的受控词表之上,建立这三种基本类型语义关系模型: • 等价关系:是同义词管理的焦点 • 等级关系:是把优选术语分类成类别和子类别 • 相关关系:是提供有意义的连接,而这有意义的连接,并非由等级关系或等价关系处理。

9.4 技术行话

• 优选术语(Preferred Term, PT):也称为可接受术语、可接受值、标题词,或者描述语。所有的关系都是根据优选术语定义的。 • 异形术语(Variant Term, VT):也称为入口词(Entry term)或非优选术语。异形术语的定义是等价于优选术语,或大致上和优选术语同义。 • 上位类术语(Broader Term, BT):上位术语是优选术语的上层术语,在等级中的较高一层位置。 • 下位类术语(Narrower Term, NT):下位类术语是优选术语的子术语,在等级中较低一层的位置。 • 相关术语(Related Term, RT):相关术语是通过相关关系与优选术语相连结。这种关系通常是「参见」(see also)的方式说明。 • 用(Use, U):传统的叙词表市场采用下面的语法作为索引者和使用者的工具:异形术语用优选术语 • 代(Used For, UF):这是指优选术语代替异性术语的相互关系。这是用来列出在优选术语的记录上所有的异形术语。 • 范围注释(Scope Note, SN):范围注释本质上是优选术语定义的特定类型,用来限定术语的意义,尽可能把模糊性消除掉。

9.5 叙词表的种类

决定要为网站建立叙词表时,有三种类型可以选择:

9.5.1 经典式叙词表

经典式叙词表用于做索引和搜索时。索引者对文件做索引时,以叙词表把异形术语对应到优选术语。

9.5.2 索引式叙词表

建立经典式叙词表常常并不是必要或可能的。但是由索引式叙词表总好过没有: • 索引式叙词表会将整个做索引的过程结构化,提升一致性和效率。 • 索引式叙词表可以让你建立优选术语的可浏览式索引,赋予用户通过单一途径就找到某个主题或产品的所有文件。 这种做索引的一致性,对于那些有固定用户的信息系统而言,有真正的价值。

9.5.3 搜索式叙词表

有时候由于内容上的问题,我们无法对文件做索引,因此,经典式叙词表不见得实用。也许你要面对的是第三方的内容,或者每天更新的新闻。 搜索式叙词表会在搜索时利用受控词表,而不是在创建索引时。(当用户在搜索引擎中输入术语时,搜索式叙词表在使用该查询术语比对全文索引前,会把该术语映射到受控词表。) 搜索式叙词表也可以提供更多灵活的浏览方式。你可以让用户去浏览部分或全部的叙词表,导航等价、等级和相关关系。术语可以作为预先定义的或预知的查询,以其对比全文索引。 搜索式叙词表的主要优点是其开发和维护的费用与内容的数量无关。另一方面,搜索式叙词表的确在等价和映射的质量上要求较高。(更多搜索式叙词表参考:< Building End User Thesauri From Full Text > by Anderson & James D. & Frederick A. Rowley, < Design For a Subject Search Interface and Online Thesaurus For a Very Large Records Management Database > by Bates Marcia J.)

9.6 叙词表标准

善用其标准的优点如下: • 这些原则中包含很多考虑和智慧 • 大部分叙词表管理软件的设计都是兼容 ANSI/NISO,所以从技术整合观点来看,和标准走在一起是有用的 • 和标准兼容可以提高跨数据库兼容的机会,所以当你的公司和竞争者合并时,你就有从容的时间把两种词汇合并起来

9.7 语义关系

叙词表与简单的受控词表的不同之处,就是语义相当丰富。

9.7.1 等价

等级关系连接优选术语和异性术语。目标是把语义聚集起来,定义为「搜索目标的一致」。其中包含同义词、近似同义词、反义词、缩写、词语变体,以及常见的错误拼写。 对于一个存放产品信息的数据库而言,可能还包含过时的产品信息,一集竞争者的产品信息。根据你所需的受控词表的具体程度,可以把一般化和更具体的术语挤入等价关系中,以免太多层次。目标是建立丰富的入口词。

9.7.2 等级

等级关系把信息空间分成类别和子类别,通过父子关系把上位类概念和下位类概念连接起来。等级的关系有三种: • 属(Generic):B 是 A 的成员,并继承 A 的特征 • 整体-部分(Whole-Part):B 是 A 的一部分 • 实例(Instance):B 是 A 的实体或实例。 卡片分类可以帮你根据用户的需求和行为决定你的等级层次。

9.7.3 相关

在叙词表结构上,相关关系通常定义为强烈暗示其语义的连接关系,但是它们无法在等级关系或等级关系中表现出来。 在电子商务领域,相关关系提供了相当棒的工具,可以把顾客喝相关的产品与服务连接在一起。相关关系可以让营销人员进行所谓的「交叉销售」,让电子商务网站能够显示诸如「你穿这件裤子真好看,和这件衬衫很搭配」如果做的好,相关关系可以提升用户体验和商业目标。

9.8 优选术语

9.8.1 术语形式

尚未定义的优选术语的形式之前看起来都很简单。但是如果你掉入语法细节的争议,我们要用名次还是动词?什么是正确的拼写?我们要用单数还是复数?简写可以当优选术语吗?索性 ANSI/NISO 的叙词表在这方面有很多说明:

9.8.2 术语选择

文献保障和用户保障,两者间的张力能够解决,依赖于你的目标以及叙词表如何与网站整合。

9.8.3 术语定义

对于叙词表而言,我们是尽全力让语言的使用达到尽可能的专指。我们是试着去控制这些词汇。除了选择这些独特的优选术语之外,有一些工具可以控制模糊性。 括号式术语限定词(Parenthetical Term Qualifier)提供了一种控制同形异义词的方式。根据叙词表的情境,你可能必须以下列方式为术语「Cells」限定范围: • Cells (biology) • Cells (electric) • Cells (prison) 范围注释可以帮助索引者选择正确的优选术语,这是相当有用的。有时候,还可以在搜索或显示结果时帮助用户。

9.8.4 术语专指度

术语的专指度是所有叙词表设计者必须面对的难题。你必须根据你的情境取得平衡,最重要的是网站的大小。当内容的数量成长时,使用符合术语增加专指度就有必要性。

9.9 复合式等级体系

在严格的等级体系中,每一个术语出现在一次且只能出现在一个地方。然而事情往往和计划背道而驰。当你在处理大型信息系统时,复合式等级就无法避免。文件数目增长时,就必须使用更高层次的预先协调以增加专指度,结果就形成了复合式等级系统。

9.10 分面分类法

印度图书馆管理员 S.R.Ranganathan 设计出一种新的分类系统。根据文件和物体都具有多维度或分面的特征,建立了她的分类系统。他建议了五种全方位的分面,能够阻止任何事物: • 本体(Personality) • 事物(Matter) • 动力(Energy)(能量) • 空间(Space) • 时间(Time) 在我们的经验中,分面式分类的做法很有价值,商业界常见的分面如下: • 主题 • 产品 • 文件类型 • 用户 • 地理位置 • 价格

10. 研究

10.1 流程概观

研究 ➡️ 策略 ➡️ 设计 ➡️ 实施 ➡️ 管理 • 研究阶段是从查阅现存背景材料,以及的策略小组开会开始的,目的是获得对目标和商业情境、现有信息架构、内容和主要用户有较多的了解。然后马上进行一系列研究,采用各种方法探索信息生态。 • 这样的研究对开发信息架构策略的基础情况将有所了解。从自上而下的观点来看,此策略将定义出网站的组织和导航结构中最高的二货三层。从自下而上观点来看,这种策略会提示出合适的文件类型,以及粗略的元数据纲要。这种策略为信息架构提供了高层的框架,建立方向和范围,通过实践引导整个项目。 • 设计是你把高级策略付诸于信息架构,建立蓝图细节、框架,一集元数据纲要,让图形设计师、内容作者及生产小组得以运用。这个阶段通常也是信息及狗狗是最有用之处,但是量不能驱动质。不良的设计结果会破坏最佳的策略,对信息架构师而言,牛肉摆在中间,难处理知识都在细节之内。 • 最后还有管理,这是网站信息架构持续烟花和改善指出。管理包括为新文件定制标签一集淘汰旧文件的例行性工作。同时也需要监控网站的用法和用户的反馈,找出网站需要做修改的地方从二进一步改善它。有效的管理可以让好的网站更出色。

10.2 研究框架

好的研究就是提出对的问题。选择对的问题需要对更宽广的环境建立一个概念性的架构。我们发现,我们践行的三圈图再找出研究的平衡做法是无价之宝。 我们先看研究的工具和方法。显然,每个项目中用到所有的共识没有意义的,也是不可能的。我们的目标是为你提供地图和罗盘,旅行就是你的事了:

10.3 情境

为达到实践的目的,先调查商业情境是好的开始。对目标有清楚的了解,也嗅出政治环境的味道,是项目开始的重点。把以管理层为中心的设计钟摆开,但是不要让钟偏离太远,换做以用户为中心的设计到目前为止仍有其价值。情境不仅仅是政治,我们也必须了解目标、预算、计划、技术基础架构、人力资源和公司文化。

10.3.1 令人信服

当你进行调查时,要认识到,为你的项目争取认同和支持的价值是相当重要的。你研究的对象是人,他们有他们的问题和关心的重点: • 你是谁,为什么要问我这些问题? • 什么是信息架构?为什么我要在乎? • 你的方法是什么?和我的工作有什么关系?

10.3.2 背景研究

项目开始时,信息架构师的脑袋被塞满了各式各样的好问题: • 短期和长期目标是什么?(* 长期的功能规划,同时有助于后期信息架构的稳定) • 商业计划是什么?政治因素如何? • 计划和预算呢? • 观众是谁? • 观众为什么要访问这个网站?为什么会常来? • 用户应该能做什么事? • 内容怎么建立?怎么管理?谁来做? • 技术基础架构为何? • 以前有什么行得通?什么行不通? 只问对问题还不够。你必须在对的时间以对的方式问对人才行。你必须专注如何占用别人的时间,而且了解谁可以回答什么问题。 因此,查阅背景资料是好的开始。拿起与网站的任务、愿景、目标、用户及内容相关的文件。此外,试着找到能够提供有关管理结构和文化的更宽广的能够反映全貌的文件。如果你是个外来的顾问,组织图就真的很有价值。组织图是捕捉用户对组织的心智模型的重要组件,而且可以帮你找出潜在的投资人和用户,让你面谈和测试。

10.3.3 初步演示报告

当你进行一项信息架构项目时,花时间做演示报告是值得的。把作者、软件开发人员、图形设计者、营销人员一集管理者都找来齐聚一堂,了解下列议题是好的。 • 什么是信息架构?为什么很重要? • 信息架构和网站其他组件有什么关系?和组织本身又有什么关系? • 主要的里程碑和可以做到的事有哪些? 这些演示报告和讨论可以找出潜在的地雷,并培养小组间的合作关系。尤其是这样做可以让彼此往共同的词汇靠拢,帮助它们更能有效的沟通。

10.3.4 研究会议

子啊今天,网站的设计和生产通常更为复杂,牵扯到好几个部门的小组。这种分散性的现实需要一系列有针对性地研究会议。请考虑下列三种会议及其行程: • 策略小组会议 策略小组要设定高层次目标,定义任务、愿景、观众、内容和功能。这个小组要处理的就是在中央集权和地方自治之间取得平衡。因为要建立信任和尊敬,所以和小组面对面的会议是必要的。让这些会议又小又自然是很重要的,5-7 人是最理想的,如果小组太大,政治意识会掌控一切,而成员不肯讲真话。一旦开始实施后,再来解决下列问题: • 网站的目标是什么? • 用户是谁? • 规划中的内容和功能是什么? • 谁要参与? • 何时需要展示成果? • 预期有哪些障碍? 然而,会议的关键之处在于你嗅到了什么。随时准备往最有趣和最重要的主题中钻进去,最糟糕的事就是你坚决找计划走,把你想成是促进者,而非独裁者。不要怕让讨论偏题,你会了解更多,而每个人都会有更愉快的会议体验。 • 内容管理会议 内容的拥有者和管理者是你想与其共同讨论细节的人,一边礼哦啊姐内容的本质和内容管理的流程。这些人通常有很多亲身经验,而且可以提供从细节到整体的观点。如果你可以和他们建立友善的关系,就能顺便了解组织的文化和政治: • 有关内容的部分,正式和非正式的政策为何? • 是否有关内容管理系统处理学做和出版的事? • 这些系统使用受控词汇和属性管理内容吗? • 内容如何输入系统? • 采用的技术是什么? • 每个拥有者都是处理什么内容? • 内容的用途为何?建立次内容区域的目标和愿景为何? • 谁是用户? • 内容的格式为何?动态或静态? • 谁来维护内容? • 未来要规划什么内容或服务? • 内容来自何处?要如何淘汰? • 哪些法律议题会影响内容管理流程? • 信息技术会议 你应该早点喝系统管理者一集软件开发人员开会,了解网站或企业网络现存何未来的技术基础架构。这样可以提哦你更好的机会,讨论信息架构和技术基础架构之间的关系,一集建立信赖并相互尊重: • 我们能善用内容案例软件吗? • 我们能建立元数据注册机制,以支持分布式的标记吗? • 内容管理软件可以处理文件的自动分类吗? • 自动化的可浏览式索引呢? • 个性化呢? • 搜索引擎的灵活性如何? • 搜索引擎能和叙词表整合吗? • 我们可以定期去的搜索记录和访问量拥挤数据吗?

10.3.5 投资人面谈

与有主见的领导或投资人会谈,通常是商业情境研究中最有价值的成分。与不同部门及单位的资深执行长一集管理者会谈,可以把流程中的参与程度扩大,把新的观点、想法和资源摆到桌面上。面谈的时候,信息架构师要问这些领导者一些没有限制的问题,例如他们对当前信息环境的评估,以及他们对组织和网站的愿景。花时间想这些人说明的项目是值得的,他们在政治上的长期支持,比起他们在会谈时要给你的答案要重要许多。可行的问题如下: • 你在组织中的角色为何?你的小组做些什么? • 在理想世界中,你的公司会怎么用企业网络建立竞争优势? • 就你的观点,什么是你公司的企业网络所面对的主要难题? • 企业目前有哪些创新提案是企业网络策略小组应该知道的? • 你有使用现存的企业网络吗?如果没有,原因是什么?如果有,你是用那部分的企业网络?使用频率如何? • 部门和员工共享知识的动机为何? • 企业网络成功的关键因素为何? • 这些因素如何被度量?投资回报率 ROI 为何? • 企业网络重设计时最重要的三件事是什么? • 如果你要告诉企业网络策略小组一件事,那会是什么? • 有什么问题时我们该问却没问的?

10.3.6 技术评估

你会想知道有哪些现存的东西,流程中有什么,谁可以帮的上忙。然而,你可以做差距分析(Gap Analysis),找出商业目标、用户需求和现存技术基础架构的实际限制之间的缺口。然后可以找鞋是否有现成可用的商业工具帮你消除这些差距,接着就可以初步创建一个流程,考虑在当前项目的情境中整合这些东西是否契合实际。

10.4 内容

我们把内容大致定义为「网站上的东西」。我们谈的内也包括未来的东西和现在的东西。用户必须要找到内容才能使用,可寻性位于可用性之前。如果你想建立可寻性对象,必须花时间研究这些对象。必须找出对象之间的区别,一集文件结构与元数据如何影响可寻性。你会想在这种自下而上地研究与对网站现存信息架构自上而下的观点之间取得平衡。

10.4.1 启发式评估

启发式评估(Heuristic Evaluation)是一种专家判断,以一组正式或非正式的设计准则测试网站。最简单的启发是评估是由一名专家检查网站找出主要的问题和改进的机会。

10.4.2 内容分析

内容分析是自下而上的,仔细检查信息架构中现存的文件和对象。网站中的东西,可能和策略小组与领导人说的愿景不一致。你必须找出自上而下的愿景与自下而上的真实两者间的差距,并予以解决。内容分析可以采用非正式调查或详细的审计。 在研究阶段初期,高层次的内容调查,是为了了解内容的范围与本质的一个有效工具。到了后面的流程一页一页的内容审查或庆典可以产生一个一致的路径,把内容一直到内容管理系统,或者至少一个便利的组织化方法,进行网页层级的写作和设计。 • 收集内容 为了开始实施,必须找出、打印、分析网站内容中具有代表性的样本。不要以过于科学的做法看待样本的定义,相反,你必须使用一些直觉和判断,平衡你的样本大小与项目的时间限制。 下面几个维度,应该可以让你分辨出不同的内容: • 格式:目标是各种格式的混合,诸如文本式的文件、程序、图像和语音等。试着加入离线的资源(网站内由记录表示的书籍、人群、设备、组织) • 文件类型:最高优先权应该是找出一群多样的文件类型。 • 来源:你的样本应该反映出内容来源的多样性。这样的内容会反映出组织性猫。 • 主题:找些专门针对业界设计可用的功用分类体系或叙词表。试着展露出宽广的主旨或主题 • 现有架构:网站现存结构是去的多样内容类型的指南,必须和上述其他维度共同运用。 考虑还有其他哪些维度,可以为网络战建立具有代表性的内容样本是有帮助的。可能的维度包括用户、文件长度、动态性、语音 • 分析内容 内容分析时,你是在找什么?你想知道什么?内容分析的边际效应之一,就是让你对题材有熟悉感。内容分析的重要目的是提高信息架构件事发展所需的重要数据,能帮助你找出内容和元数据内的模式与关系,为内容做更好的结构、主旨,以及访问途径。也就是说,内容分析是相当不科学的。我们的做法是先从少部分东西开始找起,然后,当继续做下去时,让内容调整流程。 对每一种内容对象而言,开始时可以先记录下类事项: • 结构化元数据:描述该对象的信息等级。有没有标题?内容有没有分节或分块?用户想直接获取这些信息吗? • 描述性元数据:想一想你会描述该对象的各种方式。主题?用户?格式?至少有几十种方式可以描述你正在研究的对象 • 管理性元数据:描述该对象和商业情境的关系。谁创建了这个对象?谁拥有这个对象?何时建立的?何时应该移除? 这鞋间断的问题让你跨出第一步。在某些情况下,对象已经有了元数据,这些元数据资料要抓紧来。然而,不要被预定的元数据字段集帮助。一直问自己下列问题是有帮助的: • 这个对象是什么? • 我能怎么描述这个对象? • 这个对象和其他对象有何差别? • 我怎么把这个对象让人找到? 跳过个别项目之后,也应该是研究众多内容对象的时候,要找出它们之间的模式和关系。内容的某些分组方式是否显而易见?你是否看见清楚的层次关系?你是否看出相关关系的潜力?它可能是找出由商业流程连结起来的各个数据条目? 由于你必须在样本的情境中找出模式,因此,内容分析铁定是反复性过程。可能是到了第二轮活着第三轮,才看出某文件的亮光,而且找到真正创新而有用的解决方案。 • 内容映射 启发式评估提供我们自上而下的观点,内容分析提供我们自伤而上的观点。现在可以开发内容映射图,把这两种观点连接起来了。 内容映射图(Content Map)是对现存信息环境的可视化表达方法,通常是相当高层次的,而且本质上是概念性的产物,是认知的工具,而非具体的实施蓝图。 内容映射图各有千秋。有些焦点是放在内容的拥有者和发布流程上,有些事表达内容类别之间的关系,其他的则是探索内容区域内的浏览途径。建立内容映射图的目的是帮你和同事对现存内容的结构、组织和位置有一定程度的理解,最后,才能激发改善信息存取途径的想法。 • 标杆法 标杆(Benchmark)是指要做一些比较性衡量或分析的时候。在此情境下,标杆法牵扯到系统性的鉴定、评估,一集网站和企业网络的信息架构特色的比较。这些比较可能是定量的或是定性的。可以评估用户在使用对手网站只从任务时所需的秒数,或者加下每个网站最有趣的特色。 • 竞争式标杆法 借用好想法对我们而言是很自然的事,无论是来自对手、朋友、或陌生人。重点是,从竞争对手那儿借用信息架构是有价值的。 优点: • 列出信息架构特色表,把新的想法带上桌面 • 从宽泛的一般化描述,转变成特定而且可以行动的定义 • 挑战深陷脑中的假设,避免因错误理由把错误特色复制过来 • 以竞争者为准,建立当前的位置。建立参考点,以评估改进的效率。 • 前后式标杆法 标杆法也能运用在单一网站,看网站随着时间也没有任何的改进。我们可以根据此回答投资报酬率(ROI)的问题: • 企业网络重新设计,可以减少员工获取重要文件的平均时间是多少? • 网站重新设计之后,是否改善了顾客找到他们所需产品的情况? • 重新设计的哪些方面对用户的效率或性能产生了负面冲击? 优点: • 在现存网站中,可以找出信息架构特色,并凸显其优势地位 • 从宽泛的一般化描述,转变成特定而可行动的定义 • 建立你正要改进之处的参考点

10.5 用户

没有单一的方法可以视为为了解用户及其需求、优先事项、心智模型,以及信息搜寻行为的唯一正确方法。这是多维度的蜜语,你得从各种角度去看,才能抓出对整体的感觉。最好是采用 5 次面谈和 5 次可用性测试,而不是统一测试跑 10 次。每一种做法都符合收益递减律的法则。 当你考虑把这些用户研究方法整合到你的设计流程中时,心中一定要记住一些事情。首先,奉行打折可用性工程的黄金法则:有测试总比没测试好。用户研究是极为有效的政治工具。 (有关用户研究的参考文献:< User and Task Analysis for Interface Design > by Joann Hackos & Janice Redish,以及 Jakob Nielsen 的网站:http://useit.com/

10.6 使用量统计

网站的使用量统计数据是开始工作的合理地点,大部分统计软件会提供一下报告: • 网页信息 网站中每一网页每天的点阅次数。这些数据显示出那些网页是最受欢迎的。随着时间追踪这些网页的点阅次数,就能观察出趋势,把网页的受欢迎程度、广告活动或网站导航系统的重新设计联系起来。 • 访客信息 统计数据产品可以告诉谁正在使用网站,以及他们来自何处。 用户在网站中移动的路径称为点击流(Click Stream),如果你想从使用量统计资料中得到高度精确的信息,可以购买那种能够处理点击流分析的软件。追踪用户来自何处,在网站中浏览的路线,接着去哪里。这样可以得知他在每一页花了多少时间。

10.6.1 搜索日志分析

一个比较简单但相当有价值的做法,就是去追踪和分析搜索引擎所获的查询内容。研究这些查询内容就能找出用户在搜索什么,以及他们用哪些字词寻找,当你在开发受控词表时,这是相当有用的数据。 但是如果可以和 IT 小组合作,建立更精确的查询分析工具,能让你通过日期、时间以及 IP 地址进行过滤。这个工具可以回答问题: • 哪些受欢迎的查询找不到结果? • 这些找不到结果的用户是不是输错了关键词?或者他们要找的东西不在你的网站上? • 哪些受欢迎的查询回去出好几百条结果? • 这些找出好几百条结果的用户实际上是在找什么? • 哪些查询越来越受欢迎?或越不受欢迎?

10.6.2 顾客支持数据

从服务人员,客服中心获取丰富的信息

10.7 参与者的定义和招募

接下来所有的用户研究方法都试必须从用户种选择一些代表来参与研究,包括调查、焦点小组、面谈,以及人类学研究。网站用户的定义与优先级,显然是关键因素。正如你得为网站定义主等级系统一样,也必须为参与者的选择,定义一个主等级系统。这个等级系统必须在组织看待其顾客的传统方式(如家庭用户、商业用户、增值型经销商)与信息架构师感兴趣的独特部分之间取得平衡。

10.7.1 问卷

问卷(Survey)是一种宽而浅的研究工具,它提供一种从一大群人快速而廉价的获取输入数据的机会。 设计问卷方式时,如果你想得到合理的响应率,必须限制问题的数量,也不必须保证匿名,并提供动机。因为很少有机会可以追踪问题或进行对话,问卷并不能让你得到有关用户信息搜寻行为的详细数据。相反的,问卷最适合用来确认: • 哪些内容和任务时用户认为最有价值的? • 用户对当前网站最感失望的是什么? • 用户对改进提案有何想法? • 用户当前的满意度? 除了用户意见的价值外,问卷也提供一个强有力的政治工具。

10.7.2 情景式调查

实地考察是各学科研究课题中相当重要的部分。这些情景式调查(Contextual Inquiry)方法对信息架构师而言也有用。 • 例如只要观察用户工作空间(计算机、电话、便签上记下的事情),就可以显示出他们每天用到的信息资源范围。 • 如果可能的话,观察人群在正常的商业流程中如何与网站交互 • 如果你要重新设计一般的商业网站,这种观察方法可能会因为使用网站的偶然性而变得不实际。大部分的用户每隔几个星期货几个月才会再来拜访一次。这样你就必须依赖于用户测试,虽然还是可以在用户自然居住的环境内执行测试。 • 在理想世界里,部门、小组和个人的角色与责任都是以整合的方式设计的。在真实世界里,大部分项目会因为这些不同部门的范围、计划和预算而受限。

10.7.3 焦点小组

焦点小组是对网站内容和功能产生各种想法的好工具。公开的展示并没有办法复制用户实际浏览网站时的实际环境。因此焦点小组中的建议通常不太有分量。

10.8 用户研究会议

面对面的会议包含一次一名用户,这就是用户研究会议的中心部分。你应当试着整合两到三种研究方法,才能在研究会议中得到最大的价值。

10.8.1 面谈

用户研究会议中通常是问一系列的问题: • 背景 • 你目前的角色是什么? • 你的背景是什么? • 你在这家公司多久了? • 信息使用 • 你的工作需要什么信息? • 什么信息最难找? • 找不到时你怎么办? • 企业网络使用 • 你使用企业网络吗? • 你对企业网络的印象如何?好用或难用? • 你如何在企业网络上找信息? • 你使用定制化或个性化功能吗? • 文件发布 • 你做的文件会被别人或其他部门使用吗? • 告诉我们你的文件之生命周期?做好之后会发生什么? • 你有用内容管理工具在企业网络上发布文件吗? • 建议 • 如果可以改变企业网络的三件事,你会更改什么? • 如果可以增加网站的三种功能,你会加什么? • 如果可以告诉网站策略小组三件事,你会说什么?

10.8.1 卡片分类

卡片分类的研究可以让我们了解用户的心智模型,揭开用户通常在哦脑中默默编组、排序、为任务和内容制定名称的方式。 卡片分类时要考虑下列几点: • 开放/封闭:开放式卡片用户与发现。封闭式卡片用于验证。 • 措辞:卡片上的标签可能是一个字、一个词、一句话,或者具有样本子类别中的一个。 • 粒度:卡片高度抽象或者非常具体。可能是主页类别,或是子网站的名称,或者特定文件,甚至是内容元素。 • 异质性:一开始,你肯呢个像包含很多层面,混合各式各样的东西以揭示定性数据。这样会让用户在解开异质性卡片的迷惑时说出心里话。稍后,你肯能像拥有高度一致性,以产生定量数据。 • 交叉列出:你是在充实网站的主要等级,还是探索另一种替代的导航路径?如果是后者,你可能想让用户复制一些卡片,在多类别中交叉列出。你也可能要求他们在卡片上或类别标签上写下描述性术语(如元数据) • 随机性:你可以有策略性的选取某些卡片标签证明某种假设,或者也可以从一组可能的标签中随机抽取。 • 定量/定性:从定性的观点来看,在测试期间,当用户大声说出他们的推理、问题和挫折时,你就应该从中学习和形成想法。接着询问后续追踪的问题时,你可以深入某些特定事项,这对于组织内容和为内容制定标签,能获得更进一步了解的机会。 从定量的观点来看,显然有一些尺度要把握: • 用户把两行卡片放在一起的时间百分比。当数据之间有高度关联时,用户的心智模型就会反映出相似性。 • 特定卡片放到相同类别中时间百分比。在封闭式排序中行得通,对开放式排序而言,你必须把类别的标签标准化才行。

10.8.2 用户测试

已基本的用户测试而言,你要让一名用户坐在计算机前面,打开浏览器,试着在你要研究的网站上早信息或完成任务。如果你处于探索阶段,可以考虑眼下列路线细化你的工作: • 容易到不可能 • 已知项目到详尽的 • 主题到任务 • 人工到真实

10.8 研究保卫战

要设计或重新设计任何复杂的网站,都应该从研究开始,才能导致信息架构策略的形成,通过研究,我们可以吧目标集中在了解商业目标、用户、一集信息生态,开发坚实的策略。只要做出策略,予以呈现,在进行提炼,就能在网站的结构与组织的范围和方向上取得共识。这种策略可以作为后续设计的是新的准则。

11. 策略

11.1 主题

• 信息架构策略的元素 • 从研究走向策略的要领 • 使用隐喻、场景,一集概念图来实现策略 • 项目计划、演示文档,以及策略报告

11.2 什么是信息架构策略

信息架构策略是一种高层次的概念型架构,可以让你构建组织网站或企业网络,提供坚实的方向和必要的视野,让你有信心能够进入设计和实施阶段,同时也能简化讨论,在进入更花钱的设计阶段前,协助众人都站在相同基准之上。 信息架构策略能够提供高级建议事项如下: • 信息架构管理 向远一点,建立出一种实用的策略用户用于开发和维护信息架构非常重要,其中包括了是否中央集权的问题,这是难以避免的,而且和公司政治、部门结构及内容的拥有者有密切关系。你要采用中央集权模式,或者联邦模式?你的架构会把用户带到各个子网站,活着就是让用户自行使用内容和应用程序?我们可以信任作者尤其自定义元数据吗?谁来管理受控词表? • 技术整合 策略必须提出善用已有工具的机会,而且要找出是否利用其他技术开发或管理信息架构的需求。关键的技术种类包括搜索引擎、内容管理、自动分类、协同合作过滤机制,以及个性化。 • 强调自上而下或自下而上 很多因素都会影响你把精力放在哪里,包括网站当前状态、政治环境以及 IA 管理模式。 • 组织系统和标签系统(自上而下) 这会牵扯到定义网站的主要组织体系(例如用户必须能以产品、任务或顾客类型浏览),然后找出优先地组织体系作为主要等级体系。 • 文件类型识别(自下而上) 这会牵扯到识别出一组文件和对象类型(例如文章、报告、白皮书等)而且必须和内容写作小组,以及内容管理小组密切合作。 • 元数据字段定义 这部分必须定义管理性、结构化,以及描述性的元数据字段。有些字段是全域的,有些是区域的。 • 导航系统设计 策略必须说明整合后的导航系统和辅助导航系统如何善用自上而下,以及自下而上的策略。(例如,搜索区域可依然用户善用自上而下的产品等级体系,而字段式搜索可以让用户搜索特定的白皮哦书。这一部分包含了定制和个性化功能) 策略通常会在信息架构策略报告中作详细说明,用演示文稿沟通,再通过项目计划决定信息架构设计的实际工作。然而不要花太多精力想做出完美的东西。信息架构策略必须然设计师、开发者、作者、投资人,以及任何参与设计、建造、维护网站的人都能了解和接受。让别人能接纳你的愿景是成功的关键。

11.3 策略受到质疑

开发信息架构策略是找出商业策略和内容间隙的好方法。商业策略和内容方针之间也有类似的双向关系。

11.4 从研究到策略

好的信息架构师甚至会在研究开始前,就开始构思架构和组织网站的可行策略。在研究阶段中,通过用户面谈、内容分析及标杆发分析,你应该经常利用正在整理的数据测试和调整植根于脑海中的假设。 无论如何,不要等到策略阶段才开始和你的小组讨论策略之事。当你在研究过程中,体验到收益递减律时,就会碰到问题。你会急着做出一两个等级体系,这都是你从研究专项策略的时刻了。重点是从开发式的学习转到设计与测试。

11.5 开发策略

从研究转向策略,就是把焦点转向流程和产品之间的平衡。对信息架构师而言,要从吸收模式转移到创造模式。 下图是策略开发流程的纲要,以及最后可以得到的结果。 • 思考 采用你最合适的方式,消化你在研究中了解的所欲呕东西。 • 表述 当你在观念开始形成时,能将他们清楚地表述出来是最重要的。 • 沟通 最后你必须找出最有效的方法,把这些独特的想法传达给你的听众。 • 测试 无论预算够不够,开始采用某种信息架构策略钱,不能有借口不去做测试。 不过我们发现,在这个阶段中,最有效的测试方法就是各种卡片分类和任务性能分析。封闭式卡片分类提供很好的机会,让你光差用户对你的高层次组织和标签体系的反应。任务性能分析是在纸上原型或者 HTML 原型让用户浏览。设计这种原型测试有点困难,你的仔细考虑要测试的是什么,一集如何搭建测试,以产生可信度高的结果。 在分析的一端,你可能想把高层次的信息架构从界面组件中独立出来。你可以进一步展示等级菜单给用户看,测试纯粹的信息架构,要求他们找出某些内容或者完成某种任务。 当然不可能完全和界面设计脱节。只要改变类别的次序,就会影响结果。更重要的是,当你展示这些等级体系时,必须决定次级类别样本的界面形式。研究显示,次级类别的界面形式,实质上会增加用户了解主类别内容的能力。次级类别会增加信息的线索(Information Scent) 这些逐步拆接下来的信息架构原型测试的优点包括: • 建立原型所需的工作很少 • 这些测试可以保证用户的焦点是放在信息架构的浏览,而非界面上。 缺点包括: • 危险之处时你以为已从界面中把信息架构独立出来,其实却不然 • 你错事了了解界面如何改变用户对信息架构体验的机会 另一端是设计完整的网站原型。在大部分情况下,这种测试是在流程的后面阶段才发生的。开发这种原型需要花费很多工夫,有些会牵扯到界面设计者软件开发者。 我们通常会做组合式的测试,有些是集中把在等级系统中独立出来,有些事用简单的框架图。

11.6 工作产品与成果

11.6.1 隐喻探索

隐喻是传达复杂想法、产生热情的有力工具。根据提出熟知的食物与未知事物两者间的对应及创意关系,隐喻能够解释说明、引发兴趣,并产生说服力。(参考:Geogre Lakoff & Mark Johnson < Metaphonrs We Live By >) 有很多隐喻能用在网站设计上,让我们看其中三个最重要的: • 组织型隐喻:这是善用某哥系统的组织熟悉度,快速理解新系统的组织。 • 功能型隐喻:这是哪些你能在传统环境中执行的任务,一集哪些你能在新环境之行的任务之间建立联系。 • 视觉型隐喻:这是善用对某些图形元素的熟悉度,诸如图像、图标,一集颜色,建立对新元素之间的连结。 隐喻探索的流程可以让创意流动。和你的同事一起合作,运用头脑风暴法找出适合于项目的隐喻。思考这些隐喻能否以组织型、功能型或视觉型的方式应用。进行头脑风暴之后,你要把每个人的想法做更严格的检查。开始先从期待到的内容中随机挑出几样,放到这个由隐喻而生的粗糙框架中,看是否有用。尝试杰哥用户场景,看隐喻撑不撑得住。

11.6.2 场景

场景时帮主人了解用户如何在你设计的网站中浏览和体验的最佳工具,而且也能为你找出有关架构和澳航系统的新想法。(参考:http://www.usecase.org) 为了提供多为题呀,显示出网站真正的潜力,最好是写一些场景,先是人群不同的需求一集浏览网站的不同行为。你所做的用户研究是刺流程中非常有价值的数据来源。在开始问这些问题及回答这些问题之前,先确定你真的有花时间沉侵在这些数据中。 谁在用你的网站?他们为什么用?怎么用?很着急?还是想要探险?试着选取三四种用户类型,各类型用户都已非常不同的方式使用网站。创建一个人物角色代表一个类型。

11.6.3 案例研究和情节

案例研究和情节是啊信息架构概念带进现实生活的好方法。当你是这说明一种推荐的信息架构策略是,我们发现拿这个案例与过去经验作比较和对比,讨论过去的项目什么可行,什么不可行,这是相当有帮助的。

11.6.4 概念性图示

图示是另一种把抽象概念带进现实生活的方法。身为信息架构师,你通常必须解释组织体系和标签体系背后的高层次概念和系统。

11.6.5 蓝图和框架图

蓝图显示出网页和其他内容组件之间的关系,框架图显示出网上主要网页的内容和链接的原型。

11.7 策略报告

经验告诉我们,提出策略报告是把信息架构策略的细节讲清楚讲明的最有力的催化剂。把先前的结果、分析和想法整合陈单一文件的过程,必须采取有魄力的决定,以才智为依据,还要有明确的沟通。模糊宽泛的想法必须切割成各种细节予以说明,这样所有参与其中的人员才能了解其意图和意欲何为。 写策略报告通常使的小组成员对信息架构的看法趋向一致,而且他们也必须找出各种方法说明此愿景,这样客户和同事才会了解他们到底在说些什么。薤白高最难的事情之一是组织报告的内容。

11.7.1 策略报告样本

• 执行摘要 执行照耀应该提出目标和方法的纲要。执行摘要为整份文件确定基调,撰写的时候要格外谨慎。 • 网站的用户 & 使命/愿景 界定出网站的用户和目标,以确保报告和读者都能融入较宽广的情境中,这是相当重要的。这里是说明网站使命的好地方。 • 学习而得 这一节是把你的研究、分析与你的建议是想连接起来。只要显示你的建议事项是植根于竞争式研究(标杆法)、用户面谈以及内容分析的,你就能建立信息和信任, • 架构策略和方法 报告的重心所在,我们要说明建议的架构策略和方法。 • 内容管理 报告的最后一节提供了一个真实的检验,讨论这些信息架构建议是想,如何影响内容管理基础架构。内容管理的讨论都和情境有关,需要根据人、技术和问题所在的内容而定。这份报告中,我们说明了信息架构和内容管理之间大致的关系,一下简要介绍有效的呢日哦难过管理的三个组件: • 规则 这些是管理内容的流程。通常是工作流程,员工据此在网站上建立、发布和管理内容。工作流程可以是内容管理软件饿一部分,或者在其外。外围的流程文件包括了风格指南和标准。 • 角色 这些事指执行内容管理流程的员工。这些人回遵照流程和指南,而且绑满建立流程并予以维护。可能有专职的人建立元数据、审查内容、撰写内容、作为与外来内容供应者的联系人,或者修复软件。 • 资源 这些包括内容本身的各种不同形式,包括建立、修改或删除,一集储存静态内容和动态数据的场所,此外,也包括管理软件,使的规则和角色能轻易发挥功效。 • 模版 网站上大部分的内容都是从外部资源中取出的动态数据。数据很适合先做个模版,建立共享的结构性网页,让相同的数据嫩能够重用。文字内容不容易犯在模版中,因为其本质是变量。静态和动态内容都需要结构化的导航模版,一个一致的框架让用户能轻易看见导航类型:全站、区域和情境式。 • 元数据 为了让网站架构更抑郁以相关内容天课,需要建立描述性元数据。 • 叙词表 为元数据建立叙词表,可以帮助用户更轻易找到信息。

11.8 项目计划

除了讨论内容管理之外,为信息架构设计产生项目计划,作为策略阶段成果的一部分,是相当有用的。 此项目计划可以达到连个目标,首先,与策略报告平行发展时,可以迫使该小组不断提出下列问题: • 我们怎么做? • 要花多久时间? • 谁来做? • 需要哪些成果? • 前提是什么? 这样可以确保信息架构策略植根于实际中。第二个目标是搭起策略和设计之间的桥梁,可以和其他小组的计划整合,为整个网站的设计,取得完善的结构化时间安排。

11.9 演示

通常来讲,对一些需要了解你建议事项的人做一些演示文稿,这是好主意。在某些情况下,可能是对网站的小组或企业网络策略小组做一次演示。在其他情况下吗,你得对不同部门做好几十次演示,让整个组织都能了解,从而相信你。 首先要确定最基本的事情都完成。选出建议事项的重点,让你能够抓住听众的注意力。然后将你的想法为有逻辑的组织起来,做出流畅的演示。 举例来说,我们为一家全球 100 强公司的网站设计信息架构策略,我们开发了三种可能的策略,下列的工作标题: • 雨伞壳式以容纳各种中心 开发个宽而浅的伞式网站,把用户引导到各自维护得网站或中心。分布式的控制。低成本,低可用性。 • 整合式内容仓库 建立一个统一、结构化数据库存放内容,提供强有力的、灵活的、已知的搜索和浏览。中心集权式的控制。高成本,高可用性。 • 中心联邦式管理 建立全站元数据标准,但是也接纳区域子网站的属性。把中心之间和中心对全站之间的管理原则融合在一起。联邦模式中度成本,中度可用性。

12. 设计和文件说明

12.1 主题

• 设计阶段中图表的角色 • 开发蓝图和框架图的原因、时机,以及方式 • 如何进行网站内容映射以及编织目录清单 • 链接和管理网站内细小内容的内容模型和受控词表 • 改善与其他设计小组成员协同合作的关系 • 总结过去决策的经验,以指引未来的决策

12.2 制作信息架构图的原则

当你撰写文件解释信息架构师,还是有一组原则可以遵循的: • 提供信息架构的各种「观点」 一张图无法让所有人都看懂,因此考虑使用各种不同技术显示架构的各个层面。 • 为特定的用户和需求制定不同观点 只要有可能,左图之前,要确认别人需要什么样的图形。(参考:< Communicating Design: Developing Web site Documentation for Design and Planning > by Dan Brown)

12.3 蓝图

蓝图绘现实出网页和其他内容组件之间的关系,可以用来塑造组织、导航以及标签系统。

12.3.1 高级架构蓝图

高级蓝图式自上而下的信息架构流程的一部分。从主页开始,信息架构师可以使用开发蓝图的流程,不断补充架构细节,加上附属页面,新增细节层次,自上而下地做出导航层次。 在设计阶段,高级蓝图式探索主要组织体系和方法中最有用的工具。蓝图会反映出主要区域的组织和标签,通常是从制高点看网站的主页开始。

12.3.2 深入蓝图

当我们往下挖时,会从高级蓝图转移到架构中各个具体方面的图标,而不是和网站的真题方向沟通。你也会注意到,这些蓝图有很多信息没有传达出来,他们的焦点是网站的主要区域和结构,忽略了很多导航元素和页面细节。对蓝图以及网站设计而言,少即是多

12.3.3 详尽的蓝图

详尽的架构蓝图能反映出整个网站,是的生产小组可以完全实施你的项目。蓝图必须展示主页到目的页之间完整的信息层次,必须足够详细,使得能在网站各区域中建立标签和导航系统。 另一个重要观念是内容组件或内容块(Chunk)。为了满足实施过程的需要,通常要把内容和容器分开。由很多段落组合而成的内容区域,是可以作为独立的信息包裹而单独存在的。围绕这些内容块的巨型基础他们的关系很密切,利用这个方法,信息架构师提供给设计师很多定义版面布局的灵活性。

12.3.4 组织蓝图

让蓝图模块化。最订单的蓝图连接到次级蓝图,以此类推。这些图要通过一系列的唯一 ID 号码联系起来。

12.4 框架图

框架图是从架构观点出发,用来描绘单个网页会模版。框架图为与网站信息架构机器视觉与信息设计之间的交叉点上。开发框架图也可以帮助信息架构师决定如何编组内容组件,如何拍定次序,以及哪一组的组件拥有优先权。

12.4.1 线框图的种类

• 低精度的线框图,没有图形元素,没有真实的内容。这样可以让视觉设计师专注于全站、区域和情境式导航系统的设计。 • 中等精确度的相框,有相当程度的细节。这个框架图是这引入内容、布局及导航的许多方面,以供进一步讨论,而且是产品经理、图形设计师和程序员讨论信息架构的框架图之一。 • 高精确度的线框图,已经很接近网页实际的样子。这样的高精度的线框图有下列优点: • 内容和颜色让网页有了生命,可以抓住客户和同事的注意力 • 模拟实际网页宽度和自行尺寸,框架图可以让你了解 HTML 的限制。 • 精确度足以让用户进行纸上原型测试 另一方面,也会有一些缺点: • 高精确度需要付出更多。 • 把视觉元素和内容整合进结构化布局时,焦点从信息架构转移到界面和视觉设计

12.4.2 线框图原则

做线框图时需要考虑以下原则 • 一致性是关键,尤其是展示许多线框图时。 • Visio 和其他标准绘图工具可以支持背景图层,让你可以重复利用导航条河页面布局,一共网站上多个页面使用。 • 留白时记下网页元素功能的有效方法,记得在线框图周边和顶端留出空间 • 就像其他输出结果一样,线框图应该可用而且要进行专业的开发 • 一旦有一名以上的信息架构师在做项目的框架图,要确立开发、共享和维护公用模版的程序。

12.5 内容映射和清单

在研究和策略阶段,你的焦点是放在采用自上而下的方式定义信息架构。当你进入设计和生产阶段时,要完成自下而上的流程,收集和分析内容。内容映射表格就是信息架构自上而下和自下而上两种流程结合之处。 详尽的内容映射流程包含把现存内容拆开或结合成内容块,使你能够把它们引入网站中。 内容通畅来自各种来源,而且很多格式。内容必须映射到信息架构,此案能清楚看到在生产流程中什么东西应该放在哪里。因为个时间差异性颇大,你不能依赖来源网页和目的地网页之间由一对一的映射关系。有鉴于此,把来源和目的地的内容及其容器分开时很重要的。此外,结合 XML 或数据库方法管理内容时,内容和容器分开,更可以简化内容块在夸网页之间的再利用过程。 即使你是在为网站建立新内容,内容映射仍然有必要。当新内容是有多位作者共同建立时,谨慎的内容映射的需求会更大,映射流程会变成重要的管理工具,以追踪这些不同来源的内容。 定义内容块的主管流程应该由下列问题来决定: • 这份内容应该分成用户可能像分别存取的几小块吗? • 需要个别做索引的内容的最小部分是什么? • 内容在多份文件之间,或多次处理是需要变更用途吗? 内容映射的副产品就是内容清单,描述可用内容,一集哪里可以找到这些内容,另外也可以知道哪些内容空白需要填充。(参考:< Doing a Content Inventory > by Jeff Veen)

12.6 建立内容模型

内容模型是微信息架构,构成了许多互相连接的小块内容。内容模型仍然依赖协调的一组对象,以及鼻息间的逻辑链接才能运作。 • 支持情境式导航 水平跳跃横跨层级就是有一种情境式导航,而用户的移动更多是根据用户自身所表达的需求而决定的。此外,内容模型的存在主要是为了支持这种导航,无论是交叉销售零售产品或是把用户引到产品规格的页面。 • 对抗大量内容 内容模型也有有助于我们应付内容的规模。制作内容清单时,看见内容管理系统和数据库中长则大量同质信息并不常见。如果每种内容块的运作方式都相同,为什么不利用这种可预测性而将其连接起来?让内容块之间的链接自动建立,意味着你的用户将受益于更多而且更棒的方式进行情境式导航,而你的结构也将从其对内容的投资而获得更多的价值。

12.6.1 实践

这些对象应该怎么链接?不见得总是能得到如此显著的链接,即使相当明显,还是必须做一些用户研究以验证你的做法。 可以考虑各种卡片分类方法。打印出每个内容对象的样本,剪下导航选项(以防止对当前信息架构有偏见的用户)。然后要求实验对象看一看每个内容对象,想想他们接下来想往哪儿,然后吗,让他们手机对象,在对象间画线,以指出导航方向。尖头指出用户是否想做双向导航或偏爱单向链接。 要进行简单的差距分析,可以向实验对象询问那些遗漏的内容对象可以放进来。 那么,内容对象间的链接该怎么做? 一般都是依赖元数据,作为连接内容块的逻辑基础。共享的元数据可以做到廉洁一对内容块的工作。 If album page’s album name = album preview’s album name And album page’s artist name = album review’s artist name Then link album page and album review 无论任何大小的信息架构项目,元数据的可用性都是考虑因素之一。内容模型建立流程可以协助你决定要投资那些元数据属性。可以做个简单的表格,列出每个内容对象,以及其应该连接的其他对象,还有做出这些链接所需的元数据属性:

12.6.2 有价值的流程

内容模型和具体产出图标的活动很类似。主要的输出结果是很有用的 IA 具体产出图标,可以指出网站深度情境导航的设计,但是这个流程也会产生两个次要的优点。 • 首先,建立内容模型时,可让我们确认哪些内容对内容模型而言是最重要的。很可能你无法为所有内容建立内容模型。所以要知道哪些内容可以满足同质、高容量,以及高价值这些条件。 • 其次,建立内容模型时,也会强迫你从众多元数据属性中,选出可以让你的内容模型运作的那些元数据。对关键内容和关键元数据做聚焦河窄化后,表示把大型而复杂的问题空间给简化河清晰了。这就是所谓的帕累托法则(80-20 规则)

12.7 受控词表

有两种主要产品与受控词表的开发有关。首先,你需要元数据矩阵,这样可以简化词汇优先权的讨论。其次,你需要应用软件来管理这些词汇和关系。 元数据矩阵可以帮你和客户以及同时度过困难的决策制定过程,权衡每一次会对用户体验的几十种,以及开发和管理所需的费用。 当你把焦点从选择词汇转向建立词汇时,就必须悬着一种数据库方案用户来管理术语河术语关系。如果你在建立一个很轻质的叙词表,它有等价关系、等级关系以及相关关系,就应该慎重开旅是否投资购买汇叙词表管理软件。

12.8 设计的共同合作

12.8.1 设计草图

在研究阶段,设计小组开发所需的图形特征,或者外观和操作方式。技术小组评估组织的信息技术基础架构,一哦集用户的平台限制,然后他们就可以了解有关动态内容管理和交互性的特色是否可行。当然,架构师需要设计网站的高层信息架构。设计草图是初步试着把这三个小组的知识集合起来,开始设计网站顶层网页界面的好方法。 从草图开始着手对于跨领域会议的成功是很重要的,草图提供了每位参与者共同的焦点,把桌边每个人个性减到最小。此外,也比较可能让参与者使用相同的话语讨论设计;设计概念的共同术语通常直接出租草图本身。

12.8.2 网站原型

网站原型常常可以让我们发现之前没有发现的信息架构问题。一旦架构和导航系统以改进实际的网页中,你和同事就能看出实际上是否真的可行。

12.8.3 信息架构实施时机

很多决策都必须在实施过程中决定。这些内容块是否够小,以便我们可以将其他全部安排在一页之内?或者应该以单独网页存放?我们应该在网站的这一届嘉善区域导航吗?可以缩短这一夜的标签吗?你必须平衡客户的要求,以及生产小组的精神压力、预算和时间安排,还有你对网站信息架构的愿景。

12.9 整合:信息架构风格指南

网站总是在成长和蜕变。身为信息架构你必须引导其发展,不然架构可能会乱掉。网站维护着加紧内容,不会考虑架构问题,使得你谨慎设计的组织、导航、标签河索引系统乱掉。虽然全面避免是不饿坑的,但是有了架构风格指南后,就可以让维护着走在正确的方向上。(参考:< Best Practices for PBS Member Stations > by Adaptive Path) 架构风格指南是一份文件,说明网站的组织方式,为何以此方式组织,以及架构随着网站称夯实应如何扩展。指南应该先说明网站的使命和愿景,这是因为了解最初目标很重要。接着要说明有关用户的信息。这网站是为谁设计的?对于用户的信息需求做了哪些假设?然后,接着是内容发展方针的说明。引入了哪些类型的内容?哪些类型的内容没有引入?为什么?更新频率如何?何时要移除?谁来做?

12.9.1 原因所在

要记录研究、策略和设计阶段中学到的教训和所做的决策。这些隐含的哲学观不仅驱动架构的设计,未来对架构做出要的修改也会受其影响。

12.9.2 办法所在

你的风格指南应该包含一些基本的具体组件,以协助众人维护汪涵。考虑到谢列几个部分: • 标准 维护和改变网站时,通常至少有些规则必须遵循。例如,新建文件在发布之网站前,必须先意识到的受控词表术语编织索引。或者有特定的程序必须遵循,以确保新内容会立刻被网站的搜索引擎里遍历到和编制索引。 • 指导方针 指导方针建议的信息架构应该怎么维护。这些可能是来自于信息架构最佳时间,而且通常需要针对每个情况作解读。例如,建立如何避免过度冗长饿链接清单,以及网页标题建议。(参考:< IA Heuristics > < IA Heuristics for Search Systems > by Lou Rosenfeld; < Intranet Review Toolkit > by James Robertson) • 维护程序 网站生存所必备的日常任务应该完整做说明,诸如合适一集如何把心术语加紧受控词表。 • 模式库 考虑建立模式库,说明网站设计可重用的方面,诸如协助用户滚动结果页的导航组件,以避免重新发明轮子。 你的风格指南应该引入蓝图、架构图、受控词表信息,以及其他来自于涉激流冲中,整个网站生命周期内可重用的文字说明。此外,也必须建立新增内容的原则,以确保组织、标签、导航以及索引系统的完整性。

REFERENCES

  • 有关搜索分析法,可以阅读 Rosenfeld & Wiggins 合著的 <Search Analytics for Your Site: Conversations with Your Customers>
  • 有关情景式询问,可以阅读 Beyer & Holtzblatt 合著的 <Contextual Design: Defining Customer-Centered Systems>

• < Modern Information Retrieval > by Ricardo & Berthier • < Concepts of Information Retrieval > by Miranda Lee Pao • < On Search, the Series > by Tim Bray • Searchtools.com • Search Engine Watch 除了受控词表的实践逐渐成为主流外,我们也很高兴看到这方面的参考资源也越来越丰富: • < Guideline for the Construction, Format, and Management of Monolingual Controlled Vocabulares > • < Controlled Vocabularies: A Glosso- Thesaurus > by Fred Leise & Karl Fast • Dublin Core Metadata Initiative • Flamenco Search Interface Project • Glossary of Terms Relating to Thesauri • Taxonomy Warehouse • ThesauriOnline