Sign Up or Log In
Privacy and TOS
Contact Us

bansi

中文搜索引擎用户体验比较

Provided by : bansi » Folder : websites operation » Category : Document » (no category)

"第 20 卷 第 08 期 2008 第 08 期 年 08 月 农业图书情报学刊 Journal of Library and Information Sciences in Agriculture Vol.20, No.08 Aug. 2008 中文搜索引擎用户体验比较 吴 宏 ( 巢湖学院 图书馆, 安徽 巢湖 238000) 摘 要: 提出了中文搜索引擎的评价指标: 索引库、检索功能、检索效果、用户交互以及 站 点 流 行 度 , 并 据 此 从 用 户体验的角度对常用中文搜索引擎进行了分析比较, 进而指出中文搜索引擎存在着自然语言搜索 、 版 权 、 个 性 化 搜 索和协作搜索等方面的问题。 关键词: 搜索引擎; 评价指标; 信息检索; 检索工具 中图分类号: G354 文献标识码: B 文章编号: 1002-1248 ( 2008) 08-0125-06 User experience and comparison on Chinese Search Engine WU Hong (Library, Chaohu College, Chaohu, Anhui 238000, China) Abstract: This article thinks of the index database, search function, search effect, user interaction and website popularity as the evaluation index of the Chinese search engine, according to these indexes, the article analyzes and compares the main Chinese search engine, and then points out the Chinese search engine exists the natural language search, copyright, characteristic search and cooperation search problem. Key words: search engine; evaluation index; information retrieval; search tools 随着互联网的发展, 网络中文资源的日益丰富, 中文搜索引擎已越来越成为人们获取网络资源不可或 缺的重要工具。根据 CNNIC2008 年 1 月发布的 《 中 国互联网络发展状况统计报告》显示: 截至 2007 年 擎—— 爱问” 2005 年 8 月 5 日 , 百 度 在 美 国 纳 斯 —“ ; 达克上市, 股价最高达 429 美元; 面对庞大的中国搜 索引擎市场, 各搜索引擎们自创立之日起, 就处于不 断变化之中, 以变求生存、求发展; 以雅虎为例, 自 一搜”后, 2005 年 11 月 9 日, 阿里巴 2004 年推出 “ 巴公司在完成对雅虎中国的收购与整合之后, 启动其 崭新的雅虎搜索, 2007 年 6 月 5 日, 又 推 出 全 球 首 个 实 现 了 “ 页 到 位 ” 全 新 体 验 的 搜 索 平 台 Om- 一 12 月我国互联网用户总人数已达 2.1 亿人, 搜索引擎 使用率达 72.4%, 已成为网民在互联网上搜寻信息的 不可或缺的重要工具和基础应用之一; 另据艾瑞咨询 研究显示, 截至 2007 年底, 中国搜索引擎市场规模 预计将达 28.1 亿人民币, 相比 2006 年的 13.9 亿人民 币, 年同比增长 102.2% 。搜索引擎已被认为是继电 [1] niSearch。中国搜索市场硝烟四起、群雄逐鹿, 试问 谁是中文搜索市场的霸主。 子邮件、短信和网络游戏之后的互联网市场的第四桶 金。 2004 年 6 月 21 日, 雅虎在中国推出全新的独立 搜索门户—— 一搜” 2004 年 8 月 3 日 , 搜 狐 公 司 —“ ; 推出了完全自主技术开发的全球首个第三代互动式中 文搜索引擎—— —搜狗; 2004 年 8 月 19 日, Google 在 纳斯达克挂牌, 随后股价节节攀升, 其名利双收的示 范效应, 更加剧了中文搜索市场对搜索力的追逐; 1 构建评价指标 1973 年, 美国著名图书馆学家 Lancaster[2]提出了 评价联机检索系统的六项指标: 涵盖范围、查全率、 查准率、响应时间、用户方便和输出格式。尽管已经 过去了 30 多年, 但究其本质而言, 对当今搜索引擎 的评价仍有一定的借鉴作用。曾民族 [3]在综合国内外 搜索引擎评价研究成果的基础上, 提出了以下评价指 标: 数据库规模和内容 ( 覆盖范围、更新周期、索引 2005 年 6 月 30 日, 新浪推出中文智慧型互动搜索引 收稿日期: 2008-04-11 作者简介: 吴宏 ( 1967-) , 男, 副研究馆员, 发表论文数篇。 126 农业图书情报学刊: 工作研究 第 20 卷 组成) 、索引方法 ( 自动索引、人工索引、用户登 概念检索、词语加权、词语限定、特定字段限定、缺 省值、中断退出、重复辨别、上下文关键词、查询集 操作等) 、检索结果 ( 相关性排序、显示内容、输出 数据库和检索功能说明、查询举例) 和其它 ( 查准率 和响应时间) 。陶 跃 华 、 孙 茂 松 、 王 锡 钢 根 据 对 搜 索引擎基本结构、基本原理和主要功能的分析, 把搜 标引范围、更新频率) 、检索功能 ( 基本检索、高级 检索) 、检索效果 ( 查准率、检索时间) 、检索结果 ( 显示内容、显示结果数限制、相关性排列) 和用户 交互 ( 用户界面、 帮 助 信 息 、 检 索 技 巧 ) 。 刘 正 春 [5] [4] 检索功能: 这一指标与上面所提到的检索功能 逻辑等基本检索应属检索技巧, 其不合理性在前面业 已说明, 至于概念检索等高级检索应属搜索引擎的技 术范畴, 是目前几乎所有中文搜索引擎都无法实现, 其目前能否或有无必要作为搜索引擎的评价指标尚待 商榷; 本文所提出的检索功能指标是指搜索引擎依据 内容所提供的网页、新闻、图片、音乐、视频搜索等 度, 在一定程度上决定了检索效果的优劣。 检索效果: 在对检索效果提出评价指标前, 应先 明确两个指标: 查全率和查准率, 查全率是指检索出 的相关文献数量与文献空间中所有相关文献之比, 查 准率是指检索出的相关文献数量与检索出的文献总量 之比 [6]; 因网络资源的丰富性和复杂性, 检索出相关 文献数量和文献空间中相关文献总量皆难以计量, 因 此, 查全率和查准率这两个指标显然不具有可操作 性 ; 有 鉴 于 此 , 美 国 研 究 人 员 H.Vernon Leighton 和 相 前 Jaideep Srivastava [7] 提 出 了 “ 关 性 范 畴 ” 和 “ X 命中记录查准率”的概念, 另据彭波 《 中文搜索引擎 用 户 日 志 分 析 》 ( 2004-11-15) : 约 有 一 半 的 用 户 只 查看了第一个结果页面; 据此, 为更便于操作, 本人 提出评价搜索引擎检索效果指标: 首页相关度和响应 时间, 将首页记录分为完全相关、部分相关和完全无 关, 以期在一定程度上反映搜索引擎的相对查准率。 用户交互: 指搜索引擎为用户提供一个人机交互 有搜索提示词、个性化设置和互动问答等, 前两项属 于人机交互, 搜索提示词是搜索引擎针对用户在搜索 时所输入的检索词而提供的相关搜索词, 以帮助用户 更准确地表达自己的信息需求, 从而使用户能更快更 准地找到所需信息; 个性化设置是搜索定制, 以反映 用户个性化需求; 互动问答属人机交互和用户之间交 互, 其重点在用户之间交互, 是搜索引擎为用户提供 的知识问答平台。 站点流行度: 就是与站点做链接的网站的数量, 是搜索引擎对站点排名时要考虑的一个很重要的因 素; 借用这一指标作为对搜索引擎的评价指标, 只是 将与站点做链接的网站的数量, 变更为搜索引擎的用 户链接数, 亦即用户使用搜索引擎的数量, 这一指标 可 通 过 专 门 发 布 网 站 世 界 排 名 的 Alexa 公 司 ( http: 录 ) 、 检 索 功 能 ( 布 尔 查 找 、 截 词 查 找 、 字 段 查 找 、 ( 基本检索、高级检索) 有所不同, 本人认为像布尔 数 量 选 择 、 显 示 格 式 选 择 ) 、 用 户 界 面 ( 帮 助 文 件 、 并亟待解决的问题, 也是搜索引擎的未来发展方向, 索引擎评价指标定义为五类: 索引构成 ( 标引数量、 专项检索功能, 其所提供的这类功能的多少和便利程 提出了以下评价指标: 索引库评价指标 ( 索引标引数 量、标引的文件种类、标引深度和更新频率) 、检索 功能评价指标 ( 基本检索和高级检索) 、亲和度指标 ( 检索中与用户的交互情况和智能信息技术) 、检索效 果评价指标 ( 查全率、查准率和检索时间) 。 客观地说, 上述各家所提出的观点, 在一定程度 上比较全面地反映了对搜索引擎的评价; 但究其对中 文搜索引擎而言, 我个人认为一些指标尚有不甚合理 之处, 如用户界面、检索技巧、查全率等; 关于用户 界面, 无论是 google 中文、百度, 还是搜狗、爱问, 就连昔日的雅虎中文, 也在马云对其整合后变脸, 检 索界面简洁友好、结果界面所显示信息丰富详细, 这 一指标对于中文搜索引擎而言已无多少可比性; 关于 ( 2004-11-15) : 87.04%的查询不含空格, 这表明多数 中文用户只输入一个词项; 对于普通用户而言, 搜索 引擎所提供的布尔检索、截词检索等检索技巧又有多 少可用性呢? 至于查全率, 本文将在下面提到, 在此 不再赘述。然尽管如此, 上述各家所阐述观点对中文 搜索引擎评价指标的构建, 仍有很多可供借鉴之处; 因此, 综合上述各家观点, 并依据对搜索引擎评价的 科学性、合理性和有效性原则, 我认为对中文搜索引 擎的评价应包括索引库、检索功能、检索效果、用户 交互和站点流行度等 5 项指标。 索引库: 是搜索引擎提供搜索服务的基础, 对它 的评价, 应包括索引库规模、标引范围和更新周期, 规模是数量的多少, 范围是标引网络资源的种类, 而 更新周期是整个数据库更新一次所需时间, 周期越 短, 网页更新越及时, 网页新鲜度越高。 检 索 技 巧 , 据 彭 波 《 文 搜 索 引 擎 用 户 日 志 分 析 》 或用户之间交互的平台, 以提高检索效率, 包括是否 中 //www.alexa.com/) 的 “ Traffic Rankings”中的全球互 第 08 期 吴 宏: 中文搜索引擎用户体验比较 127 联网用户使用该搜索引擎的百分比来反映。搜索引擎 作为搜索门户, 其流行度、受用户欢迎度在一定程度 上也反映了其搜索性能的优劣。网络时代, 先发不一 定能成为优势, 但若先发而又能赢得眼球, 赢得用户 的欢迎, 进而进入用户的心智, 才能成为优势, 而优 势往往又会为后来进入者设置壁垒; 后发的搜索引擎 由于缺乏用户, 其技术往往还没有被用户所体验和认 同, 就被既有居于领导地位的搜索引擎所效仿, 如爱 问推出 “ 爱问知识人”后不久, 百度就推出 “ 百度知 道” 。 索。 ●雅虎全能搜索 ( http://www.yahoo.cn/) [10] 一搜”中文搜索网站。 2004 年雅虎中国推出的 “ 2005 年, 阿里巴巴公司收购雅虎中国。2007 年 5 月 15 日, 雅虎中国宣布, 从即日起正式更名为中国 雅 虎; 同时, 中国雅虎全新的业务体系也调整完毕, 搜 索引擎成为其 “ 三驾马车”之一; 6 月 5 日, 推出全 球首个实现了 “ 一页到位”全新体验的、称之为 360 度 雅虎全能搜的搜索平台 OmniSearch。 ●搜狗 ( http://www.sogou.com/) [11] 搜狐公司于 2004 年 8 月 3 日推出了完全自主技 2 中文常用搜索引擎比较 2.1 中文常用搜索引擎介绍 ●Google 中文 ( http://www.google.cn/) [8] Google 创 建 于 1998 年 9 月 , 创 始 人 为 Larry Page 和 Sergey Brin, 是 一 个 用 来 在 互 联 网 上 搜 索 信 息的 简 单 快 捷 的 工 具 。Google 是 万 维 网 上 最 大 的 搜 术开发的全球首个第三代互动式中文搜索引擎—— —搜 狗 。2007 年 1 月 1 日 正 式 推 出 搜 狗 网 页 搜 索 3.0 版 本, 成为全球首个中文网页收录量达到 100 亿的搜索 引擎。搜狗以网页搜索为核心, 在音乐、图片、新 闻、地图等领域提供垂直搜索服务, 通过说吧建立用 户间的搜索型社区; 桌面应用则旨在提升用户的使用 索引擎, 用户能够访问一个超过 80 亿个网址的索引。 体验。 Google 坚 持 不 懈 地 对 其 搜 索 功 能 进 行 革 新 , 始 终 保 持着自己在搜索领域的领先地位。google 在网页级别 技术、动态摘要、网页快照、多文档格式支持、图像 搜索、多语言支持、用户界面等方面进行革新, 它以 检索功能强大、搜索信息准确而倍受赞誉。 ●爱问 ( http://www.iask.com/) [12] 2005 年 6 月 30 日, 新浪发布自主研发的搜索引 擎产品 “ 爱问” 。作为首个中文智慧型互动搜索引擎, 新浪 “ 爱问”在保留了传统算法技术在常规网页搜索 的强大功能外, 以一个独有的互动问答平台弥补了传 统算法技术在搜索界面上智慧性和互动性的先天不 足。为了加强搜索结果的权威性, “ 爱问”还携手中 国大百科全书推出 “ 中国大百科在线搜索” 这是国 , 内搜索市场上第一个以百科全书为依托的知识搜索服 务产品。 ●百度 ( http://www.baidu.com/) [9] 百度是资深信息检索技术专家、超链分析专利的 唯一持有人李彦宏和在美国硅谷有多年商界成功经验 的徐勇博士于 2001 年 10 月创建的中文搜索引擎。百 度一词源于宋・辛弃疾 《 青玉案》中的 “ 众里寻他千 百度” 。2005 年 8 月 5 日, 百度在美国纳斯达克成功 上市。百度提供网页、MP3、文档、地图、传情、影 视等多样化的搜索服务, 率先创造了以贴吧、知道为 代表的搜索社区, 将无数网民头脑中的智慧融入了搜 2.2 列表比较 表 1: 从索引库的规模看, 搜狗、百度、Google 中文网页数最多; 从标引范围看, 除 Google 中文没 标引音乐外, 标引范围大多相差无几; 从网页更新周 表 1 中文搜索引擎之索引库、检索功能和站点流行度比较 128 农业图书情报学刊: 工作研究 第 20 卷 期看, 百度、雅虎全能搜索、Google 中文排名前三; 从所提供的专项检索功能的多少看, 百度最多; 从站 点 流 行 度 ( 查 于 2008 年 1 月 26 日 18 时 35 分 ) 来 看, 为避免突发事件对搜索引擎的影响, 以保证访问 量的相对客观性, 我们通过 Alexa 公司 ( http://www. 因此, 其相关数指标与 Google 完全一致。 表 3: 在 个 性 化 方 面 : 除 雅 虎 全 能 搜 索 和 爱 问 外, 其它 3 个都可进行个性化设置; 5 家都有相关搜 索词; 只有百度、雅虎全能搜索和爱问提供了互动问 答。 表 4 ( 查 于 2008 年 1 月 26 日 ) : 从 搜 索 提 示 词 的质量来看, 百度的相关搜索词质量最高, 雅虎全能 搜索最低。 表 5 ( 查 于 2008 年 1 月 26 日 ) : 从 软 件 下 载 来 看, 5 家都能提供至少一个有效下载链接地址; 从音 乐 搜 索 来 看 , 除 了 Google 中 文 不 提 供 该 项 功 能 外 , 其它四家都提供了相关的下载链接点; 从自然语言检 索来看, 几家在对自然语言的理解上已有一定的进 步, 都能提供至少一个答案。 alexa.com/) 的 “ Traffic Rankings” 中 的 全 球 互 联 网 用户使用该搜索引擎的百分比 ( 周均值) 来反映站点 流行度, 百度、Google 中文、搜狗排名前三。 ( 注: 索引库规模、更新周期的数据皆搜自网络, 因散见于 多处网页, 不便加注, 仅供参考。 ) 表 2 ( 查 于 2008 年 1 月 26 日 晚 7 时 ) : 从 检 索 结 果 的 首 页 完 全 相 关 数 和 部 分 相 关 数 来 看 , Google 中文和百度的首页相关度较高, 其检索效果较好; 从 检索时间来看, 百度最快; 从网页的新鲜度来看, 几 家搜索引擎的网页更新都比较及时。同时我们也注意 到爱问的网页搜索是由其合作伙伴 Google 来执行的, 3 结论 第 08 期 吴 宏: 中文搜索引擎用户体验比较 129 通过以上比较, 我们可以看出百度无论是在索引 检索效果、用户交互以及站点流行度方面, 都表现比 较出众, 百度无可争辩地居于中文搜索引擎的霸主地 位, 这一结论不仅和 Alexa 公司所提供的全球互联网 用 户 使 用 百 度 的 百 分 比 最 多 相 一 致 ; 也 与 CN- 索的, 这也是为什么每次搜索时都会返回大量的用户 最能准确地反映用户的检索需求, 对自然语言的理解 是搜索引擎保证其搜索结果准确性的根本保证, 因 此, 对搜索引擎们来说, 实现自然语言检索依然是一 个现实而又亟待解决的问题。 库的规模、标引范围、更新周期, 还是在检索功能、 不需要的信息。自然语言更加符合人类的生活习惯, NIC2007 年 9 月 发 布 的 《 2007 年 中 国 搜 索 引 擎 市 场 调查报告》相一致, CNNIC 报告显示, 在用..."

You need to upgrade your Flash Player , or try to enable javascript in order see this document properly.

中文搜索引擎用户体验比较

(no description)
more

File Name: 中文搜索引擎用户体验比较.pdf
Provided by: bansi
Folder: websites operation (websites)
Category: Document » (no category)
Size: 772.34 kb
Extension: pdf
Rating: 0
Views: 704
Downloads: 12
Uploaded: 19/12/08 20:17
Tags: (no tags)


Embed:
Link:
Forum:

Submit to digg
digg stumble reddit Submit to del.icio.us delicio furl facebook
comments Comments : 0
No comments yet..

Add comment: (Sing Up or Log In)

基于用户体验的搜索引擎有效性评估研究 (pdf document)
基于用户体验的搜索引擎有效性评估研究
(no description)
pdf document From: bansi
楼兰汉文简纸文书集成.pdf (pdf document)
楼兰汉文简纸文书集成.pdf
(no description)
pdf document From: shaside
Marcy Nopi  Chic  Swimsuits  Bikini Contest (お宝)相澤仁美 よつんばい (flv video)
Marcy Nopi Chic Swimsuits Bikini Contest (お宝)相澤仁美
Import2Race.com (お宝)相澤仁美 よつんばい
flv video From: emilex
真・仮面ライダー 序章 Memorial Interview & Trailer (flv video)
真・仮面ライダー 序章 Memorial Interview & Trailer
Shin Kamen Rider Prologue Memorial Interview & Trailer
flv video From: mixa
周易与经营之道+吴世彩,张卫军著.四川人民出版社.2001 (pdf document)
周易与经营之道+吴世彩,张卫军著.四川人民出版社.200
(no description)
pdf document From: shaside
虚构的权威 女性作家与叙述声音 (pdf document)
虚构的权威 女性作家与叙述声音
(no description)
pdf document From: shaside
马友友《繁花似锦巴罗克》01 以榮耀稱頌主第一部份,改編巴哈作品(湯.庫普曼改編) (mp3 audio)
马友友《繁花似锦巴罗克》01 以榮耀稱頌主第一部份,
(no description)
mp3 audio From: shaside
马友友《繁花似锦巴罗克》02 主啊請憐憫(選自馬太受難曲) (mp3 audio)
马友友《繁花似锦巴罗克》02 主啊請憐憫(選自馬太
(no description)
mp3 audio From: shaside
马友友《繁花似锦巴罗克》07 讓我成為主的器皿 (mp3 audio)
马友友《繁花似锦巴罗克》07 讓我成為主的器皿
(no description)
mp3 audio From: shaside
马友友《繁花似锦巴罗克》09 歌調,第三號管弦樂組曲 (mp3 audio)
马友友《繁花似锦巴罗克》09 歌調,第三號管弦樂組
(no description)
mp3 audio From: shaside
哈贝马斯 作为“意识形态”的技术与科学 (pdf document)
哈贝马斯 作为“意识形态”的技术与科学
(no description)
pdf document From: shaside
自我与世界:以问题为中心的现象学 (pdf document)
自我与世界:以问题为中心的现象学
(no description)
pdf document From: shaside
镜与灯——浪漫主义文论及批评传统+(艾布拉姆斯) (rar archive)
镜与灯——浪漫主义文论及批评传统+(艾布拉姆斯)
(no description)
rar archive From: shaside
发现自由意志与个人的责任---里奇拉克 (pdf document)
发现自由意志与个人的责任---里奇拉克
(no description)
pdf document From: shaside
发现自由意志与个人的责任---里奇拉克.pdf (pdf document)
发现自由意志与个人的责任---里奇拉克.pdf
(no description)
pdf document From: shaside
《唐代交通图考·第1卷:序言总目·京都关内区》 严耕望 著 中研院史语所1985年 台北.djvu (zip archive)
《唐代交通图考·第1卷:序言总目·京都关内区》 严
(no description)
zip archive From: shaside
书趣文丛第一辑《脂麻通鉴》 扬之水 著 辽宁教育出版社.1995年 (pdf document)
书趣文丛第一辑《脂麻通鉴》 扬之水 著 辽宁教育出
(no description)
pdf document From: shaside
[【民国风云秘录丛书】龙争虎斗:北洋军阀秘录] (pdf document)
[【民国风云秘录丛书】龙争虎斗:北洋军阀秘录]
(no description)
pdf document From: shaside
[中国历代书法家系列Ⅰ-翁同龢.exe] (zip archive)
[中国历代书法家系列Ⅰ-翁同龢.exe]
(no description)
zip archive From: shaside
[上海书店丛书集成初编-0285 懒真子 肯綮录.djvu] (zip archive)
[上海书店丛书集成初编-0285 懒真子 肯綮录.djvu]
(no description)
zip archive From: shaside

© 2009 Fliiby LLC