怎样量化评价搜索引擎的评价标准结果质量

梦幻西游电脑版 | 三国人物 | 网络推广 | 剑侠情缘网络版叁 | 武侠 | 总决赛 | Legion | 牛魔王 | 游戏策划 | unity（游戏引擎） | Xbox One | 电子技术研发 | 高中 | 街机游戏 | 钢铁雄心4 | iOS应用 | 海贼王 | 桌面游戏 | 一体机 | 冬奥会 | 校服 | 数学建模 | 秦时明月之天行九歌 | 陶渊明 | 营销策划 | 洛奇英雄传 | 极限挑战(综艺节目) | Overlord（动画） | galgame | 热血传奇（游戏） | 掌上游戏机 | ps3 | ios游戏 | 春节联欢晚会 | 室内设计 | 任天堂 | 对联 | 杨紫 | 公积金 | 进击的巨人 | 休闲游戏 | 算法 | 搜狗输入法 | 超级机器人大战 | 书法 | 化妆品 | 游戏手柄 | 西瓜视频 | 歌曲 | O2O | 彩虹六号（游戏） | 字幕 | 配音 | 男性 | 天下2（游戏） | 衣服 | 日本漫画 | 虎牙直播 | 中国中央电视台 | 梦三国（游戏） | HTML | 经济学 | 300英雄 | 免费软件 | 斗鱼直播 | 刀塔（dota2） | 高中英语 | 命令与征服：红色警戒2（游戏） | Flash | 命运-冠位指定 | 冷知识 | 智能眼镜 | 川酒 | 网站运营 | Internet Explorer | 火影忍者手游 | acg | 火柴人系列游戏 | 任天堂wii | 啤酒 | 一级方程式赛车（f1） | 流星 | 街头霸王（游戏） | 格斗游戏（ftg） | 导航 | 孙悟空 | 女生 | 完美世界（游戏） | 手机游戏开发 | 游戏攻略 | 英雄传说：闪之轨迹（游戏） | 食物 | 任天堂3ds | 超级战队 | 微软（microsoft） | 演员 | youtube | 小米科技 | 花千骨 | 记忆 | 日历 | 刺客信条2 | 哔哩哔哩 | 花样姐姐 | 农业 | 生死狙击手游 | 身高 | 酒吧 | 任天堂switch | 香水推荐 | 编辑器 | 用户界面 | QQ飞车（游戏） | pdf | 飞船 | 勇者斗恶龙（游戏） | 星际战甲（游戏） | 整容 | 流氓软件 | 金庸 | 优酷视频 | 面相 | 生存游戏 | 笔记本 | 华为路由器 | 动画制作 | 网吧 | 软件开发 | macos | 移民 | 烹饪 | 天蝎座 | 意大利 | 赛车游戏 | 雷欧奥特曼 | 香水 | 冰雪奇缘（电影） | 微信群 | 背景音乐（bgm） | 李信 | 刺客信条起源 | 中药 | 炉石传说 | 凹凸世界 | 男生 | 率土之滨 | 祛痘 | 人生 | 辐射防护 | 即时战略游戏（RTS） | 乌贼 | 名言 | 网址导航 | ansys | 输入法 | 海南 | 李小龙 | 武侠小说 | 食用油 | 最强大脑（电视节目） | 飙酷车神 | 海关 | 扫雷（游戏） | 仙剑 | 大话西游之大圣娶亲（电影） | 网球 | 闺蜜 | 科学 | NBA 2K | 战神（游戏） | 取名 | 龙之谷（游戏） | 巧克力 | 球球大作战 | 乐器 | 英雄无敌3（游戏） | 酵素 | 尧山 | root | 李白 | 猴子 | 缝纫机 | 花卉 | 最终幻想（游戏） | 舰队 collection | 星系 | 美术 | 足球游戏 | 新剑侠情缘 | mugen | 中国 | 日本代购 | 南昌市 | 暴雪游戏 | 生化危机7 | 饥荒（游戏） | 孤岛惊魂5（游戏） | 画师 | 地图应用 | 仁王（游戏） |

你的位置：网站首页 >> 频道首页 >>游戏 >>怎样量化评价搜索引擎的评价标准结果质量

怎样量化评价搜索引擎的评价标准结果质量

来源：蜘蛛抓取(WebSpider) 时间：2016-01-10 09:39 标签：搜索引擎评价指标

&p&相关利益：知乎基础产品负责人。目前知乎搜索是我的主要工作。（承认这点需要勇气。）&/p&&br&&p&&b&第一部分，回答「是不是」
&/b&&/p&&br&&p&尽管指向「知乎搜索结果很烂」的个案事实可以看到很多，但个案再多也难以得到整体结论。回答「是不是」的问题，我们仍需要想办法得到一个全面的、定量的结论。&/p&&br&&p&目前，整体衡量搜索服务的效果好坏，或者说相对客观的比较任意两个搜索服务，搜索行业中有很多种量化衡量搜索结果的办法，其中使用最广泛的两种是「DCG 评测」和「SBS 感知评测」。参考：&a href=&/question/& class=&internal&&搜索引擎评价体系应该分几个方面？建立怎样的指标？ - 搜索引擎优化（SEO）&/a&前者重点考察单条结果的位置和需求满足度。即：最好的结果是否被搜索出，是否排前。后者作为「DCG 评测」的补充，把搜索结果页看成一个整体，除了同样考察单条相关性之外，额外考察结果综合体验、展现丰富度、多样性等结果展现及结果页配合等整体效果。作为对这个问题的回答，我们选取相对适合知乎搜索现状的「DCG
评测」。&/p&&br&&p&让我们一起看一看，知乎搜索在 DCG 评测中的表现。&/p&&br&&p&&b&样本&/b&：不去重随机抽取知乎问答搜索词 200 个。&/p&&br&&p&&b&打分标准&/b&：&/p&&p&对每条结果逐个采用 0~3 分 4 档打分：&/p&&ul&&li&3 能基本满足用户需求或回答内容对该次搜索用户有非常高的信息价值。&br&&/li&&li&2 能满足用户部分需求或回答内容对该次搜索用户有较高的信息价值。&br&&/li&&li&1 只可能满足少数特定用户需求或回答内容对该次搜索用户可能有一定信息价值。&br&&/li&&li&0 不相关，不满足需求，对该次搜索用户没有帮助。&br&&/li&&/ul&&p&&b&计算方法&/b&：&/p&&p&简化版 DCG 算法，对前列结果得分位置加权，综合计算总分。1 分为绝对满分。&/p&&br&&p&&b&评测结论&/b&：&/p&&p&知乎搜索得分：
&b&0.39&/b&&/p&&p&主流搜索平均得分：
&b&0.63&/b&&/p&&p&（主流搜索平均得分：对多个主流通用搜索，用SITE语法，不去重筛选出问答网页）&/p&&br&&p&所以最后，「烂不烂」这个问题的结论是：——是的，&b&真是很烂&/b&。&/p&&br&&p&从这个结论来看，&b&大家对于知乎搜索功能「如此之烂」的评价都非常中肯。&/b&而且，确实如大家所说的，在通用搜索使用SITE语法的搜索效果更好。（群众的眼光雪亮雪亮的）&/p&&br&&p&&b&亲爱的知乎用户们，对不起！ &/b&&/p&&br&&br&&br&&p&&b&第二部分，回答「为什么烂」&/b&&/p&&br&&p&通过评测看到的具体问题，我们归纳了导致搜索效果烂的几类原因：&/p&&br&&p&&b&问题 1，自然语言处理（NLP）类问题&/b&&/p&&p&CASE #1：&a href=&/search?q=%E9%81%BF%E8%B0%B7&type=question& class=&internal&&避谷&/a&&/p&&p&「避谷」是一个独立词，居然在某些结果中被切分成「避」和「谷」。&/p&&img src=&/4f377b286c_b.png& data-rawwidth=&688& data-rawheight=&163& class=&origin_image zh-lightbox-thumb& width=&688& data-original=&/4f377b286c_r.png&&&br&&p&CASE #2：&a href=&/search?q=101%E5%A4%A7%E5%8E%A6&type=question& class=&internal&&101大厦&/a&&/p&&p&问题：前列无相关结果。切词、丢词、同义词问题。&/p&&ol&&li&「101 大厦」不可切分，&br&&/li&&li&结果中需要含有 101，&br&&/li&&li&「101 大厦」需要与「台北 101 大楼」作为同义词或自动纠错映射。&br&&/li&&/ol&&img src=&/fd8cad1c2d655_b.png& data-rawwidth=&662& data-rawheight=&243& class=&origin_image zh-lightbox-thumb& width=&662& data-original=&/fd8cad1c2d655_r.png&&&br&&p&CASE #3：&a href=&/search?q=%E4%BB%80%E4%B9%88%E5%90%8D%E5%AD%97haoting&type=question& class=&internal&&什么名字haoting&/a&&/p&&p&问题：结果未正确纠错&/p&&img src=&/aa36edcc0cd1b7cbd184acd_b.png& data-rawwidth=&660& data-rawheight=&140& class=&origin_image zh-lightbox-thumb& width=&660& data-original=&/aa36edcc0cd1b7cbd184acd_r.png&&&br&&p&问题 1 原因分析：&/p&&p&自然语言处理技术是一个难点，主要的问题是：&/p&&ol&&li&各种大规模语料库的持续积累和建设。分词、同义词、纠错、丢词等等。&br&&/li&&li&根据具体场景和效果，持续优化的处理算法和策略。&br&&/li&&/ol&&p&对比通用搜索引擎，相对年轻的知乎在这方面的积累还是明显不够的，对全网语料数据的收集也不是强项。因此，不可避免时不时总会看到一些让人无语的烂结果。&/p&&br&&p&&b&问题 2，排序算法类问题&/b&&/p&&p&CASE #4：&a href=&/search?q=%E6%96%B0%E8%82%A1&type=question& class=&internal&&新股&/a&&/p&&p&问题：零回答结果排序过于靠前&/p&&img src=&/8cb0bf395_b.png& data-rawwidth=&707& data-rawheight=&304& class=&origin_image zh-lightbox-thumb& width=&707& data-original=&/8cb0bf395_r.png&&&br&&br&&p&CASE #5：&a href=&/search?q=%E6%9C%BA%E6%B2%B9%E5%A4%9A%E5%B0%91%E9%87%8C%E7%A8%8B%E6%8D%A2%E4%B8%80%E6%AC%A1&type=question& class=&internal&&机油多少里程换一次&/a&&/p&&p&问题：1、前列多条命中0赞同回答。2、轮船、摩托车并不是查询主需求。&/p&&img src=&/f4711960fad1fc9a2f6af_b.png& data-rawwidth=&667& data-rawheight=&348& class=&origin_image zh-lightbox-thumb& width=&667& data-original=&/f4711960fad1fc9a2f6af_r.png&&&br&&p&CASE #6：&a href=&/search?q=%E4%B8%BA%E4%BB%80%E4%B9%88%E8%A6%81%E6%9D%A5%E5%8C%97%E4%BA%AC&type=question& class=&internal&&为什么要来北京&/a&&/p&&p&问题：第二条结果标题不包含北京，而是法国&/p&&img src=&/8b41428a1ecad8acb658f18_b.png& data-rawwidth=&670& data-rawheight=&176& class=&origin_image zh-lightbox-thumb& width=&670& data-original=&/8b41428a1ecad8acb658f18_r.png&&&br&&br&&p&问题 2 原因分析：&/p&&p&搜索结果通过「权重」排序。权重一般由两部分组成。&/p&&ul&&li&一部分与「用户输入的搜索词」有关。&br&&/li&&/ul&&p&比如通常，完全匹配用户搜索词的结果，得分比部分匹配的要高。搜索词中每一个词语的权重也是不同的，重要词语的权重更高，例如「为什么要来北京」中「北京」比「为什么」重要。&/p&&ul&&li&另一部分与「用户输入的搜索词匹配」基础上，与知乎特点相结合。&br&&/li&&/ul&&p&比如通常，一个 1000 字，482 赞同的结果，得分天然比一个 20 字 0 赞同的结果要高。&/p&&p&好的搜索可以很好的平衡二者，给出理想的整体排序权重。而知乎搜索目前的排序算法本身仍然存在不足，在两种权重因子的计算上都有一些问题。&/p&&p&尤其是第二部分，尽管知乎拥有丰富的用户内容评价数据，到目前为止的权重策略很不理想，繁复冗余，没有最终取得应有的理想效果。&/p&&p&而问题3中的一些原因实际让这个问题雪上加霜，大幅恶化，导致了大量无答案或者无赞问题排序过于靠前的严重问题。&/p&&br&&p&&b&问题 3，性能和稳定性问题&/b&&/p&&p&目前知乎平台的优质回答已经达到了千万量级，包括搜索请求量在内的所有访问指标都取得了超预期增长。&/p&&p&这种迅猛增长的情况极大考验了按照之前数据规模和请求规模设计的整体搜索系统。众多的权重因子随着规模增加复杂度大幅提升，短期内性能和稳定性成为很大问题。所以最近一段时间为了保证对每次搜索请求都能正常返回结果，我们不得不对权重算法做了简化，这也就部分导致了问题2中结果权重出现的问题。&/p&&p&「知乎的搜索功能如此之烂」的背后的技术原因分析大概就是这些。&/p&&p&综上，确实没有做好。所以「被骂也是应该的」。&/p&&br&&br&&br&&p&&b&第三部分，我们为什么没有接入 SITE（通用引擎的站内搜索）&/b&&/p&&br&&p&尽管线上问题很多，解决起来也不容易，但考虑从知乎搜索能到达的理想状态，我们仍然不甘心简单接入一个 SITE 语法搭建的站内搜索了事。&/p&&p&一个重要原因是，知乎搜索是贯穿整个知乎平台的重要基础功能。用户在提问时用到，在找人时用到，在邀请回答时用到，在引用答案和公共编辑时也都会用到。搜索对于整个产品的效率都有很大影响。&/p&&p&另外一个重要的原因是：&b&知乎的内容不仅仅是一个个网页。&/b&知乎上用户与内容之间丰富的互动信息可以帮助搜索引擎识别哪些内容更为重要，数据富集度和准确度远远高于「PageRank」，同时，知乎的内容天然有人的属性，而这应该被用来满足知乎特有的搜索需求。比如：&/p&&br&&p&&b&个性化&/b&&/p&&p&与你相关的内容可以有更好的排序，你曾看过的、点过赞同反对的、关注过的话题里的内容等，搜起来应该更容易。&/p&&br&&p&&b&社会化&/b&&/p&&p&你关注的圈子中用户的赞同、反对、感谢和评论可以更好的帮助你定位你找的内容。&/p&&br&&p&通用引擎的站内搜索确实能简单快速解决目前很多的搜索痛点问题。但对知乎来说它是没有生命力，或者说提高空间非常有限的。我们希望知乎上的内容能被更好的搜索，知乎独有的用户需求能被更好的满足，所以我们并没有选择这个明显更为容易，也是一部分网友建议的方案。&/p&&br&&br&&br&&p&&b&第四部分，我们正在做什么&/b&&/p&&br&&p&是的，我们正在酝酿一次搜索改进，针对上面提到的问题，期望能一次性解决大部分。它将是知乎搜索一次比较大的变动，除了使用量最大的问答搜索之外，用户和话题搜索也在改进范围之内。&/p&&br&&p&当然，新的搜索只是一个起点，它一开始只是解决了上面提到的搜索效果问题，界面和功能不会发生任何变化，只是搜索效果会变好一些。但我们希望它会在逐步发展中，对知乎内容和知乎用户的理解更充分，也更为灵活，逐渐明显不同与「SITE 语法搜索」的效果，让知乎用户用起来会更爽。&/p&&br&&p&一切顺利的话，新搜索很快会与大家见面。希望各位届时能再次试用。同时，也恳请知友们继续多多通过回答、评论或私信向我反馈你遇到的效果不好的搜索词，这对我们正在进行中的搜索效果整体改进帮助很大。&/p&&br&&p&-----------------------------更新分隔线-------------------------&/p&&p&新搜索效果已上线，参考：&a href=&/zhihu-product/& class=&internal&&这不是文本框，是搜索框 - 知乎产品专栏 - 知乎专栏&/a&&/p&&p&希望大家继续多多关注和吐槽知乎搜索，谢谢！&/p&
相关利益：知乎基础产品负责人。目前知乎搜索是我的主要工作。（承认这点需要勇气。）第一部分，回答「是不是」
尽管指向「知乎搜索结果很烂」的个案事实可以看到很多，但个案再多也难以得到整体结论。回答「是不是」的问题，我们仍需要想办法得到一个全面…
说不客气一点，感觉还不如一些信息检索课上见到的学生项目好。&br&我输入关键字“知乎的搜索功能”，&img src=&/3b15f697bdbb5846bdd36a3e758ffe5c_b.jpg& data-rawwidth=&666& data-rawheight=&742& class=&origin_image zh-lightbox-thumb& width=&666& data-original=&/3b15f697bdbb5846bdd36a3e758ffe5c_r.jpg&&&br&1. 从结果看，是没有做全文索引的，只有问题被索引。&br&2. 前三条完全包含整个关键字但是排序莫名其妙，既不是根据关注数也不是根据回答。鉴于不是全文索引（没有什么看不见的段落被纳入排序score），我怀疑就是自然检索到的顺序就拿来当作最终排序了，这简直不可理喻。&br&3. 分词似乎是有做的，但是知乎两个字只有知高亮是怎么回事？&br&&br&3 是小问题。&br&1 是可以改进而且是喜闻乐见的改进。&br&2 简直是关键。关注和Timeline的确是一个用法，但是作为一个知识交换的场所，无法高效找到自己需要的东西就是致命的。知乎这样的结果排序，连最基本的根据关注度和回答（赞同数）检索都没考虑，这是要闹哪样？自己家做自己的数据，你都不用爬虫爬，数据是天然有结构的（知乎自己的系统很容易知道每个答案多少赞多少关注多少评论）而不是象专业搜索引擎一样拿到的只是文本需要自己分析。这样都能做出这么弱的排序结果，简直无法理解。唯一的可能就是，管理者根本不在乎搜索功能。&br&&br&－－－－－－－－－－－－－－－－－－－－&br&Update :&br&&a data-hash=&b490e042dd1e6cad6af4993eee223699& href=&///people/b490e042dd1e6cad6af4993eee223699& class=&member_mention& data-tip=&p$b$b490e042dd1e6cad6af4993eee223699&&@王明辉&/a& 提到Q社也有差不多问题，也许是为了让一些不为人知的问题和答案被人发现。我觉得兴许这是知乎设计的考量。&br&不过：&br&搜索结果很难让所有人都满意，不过如果大多数人都需要翻几页才能找到要的东西，那就不是好搜索。让不为人知的问题被人发现，不应该牺牲大多数人的用户体验。如果真的要做，可以分栏，比如搜索结果加个tab：等待回答的问题之类的。而且这些责任应该让其他功能去承担，而不是牺牲搜索。搜索本身就有不确定性，你不知道用户真的希望搜索什么，在这样的前提下，还按照知乎自己的立场来排序，结果就是用户根本找不到自己要看的东西。&br&用搜索的人都是希望找一些什么东西吧。在知乎上搜索大多是2种情况，搜索感兴趣的问题，希望看到有意义的回答；或者搜索自己擅长的问题希望给予回答（这个比前者少吧）。如果我的假设成立，那对第一种用户，知乎的搜索体验是及其糟糕的，就算对于第二种用户，知乎也没有方便他们。知乎的搜索结果是，你都猜不透它为什么这么做，方便了什么用户。
说不客气一点，感觉还不如一些信息检索课上见到的学生项目好。我输入关键字“知乎的搜索功能”，1. 从结果看，是没有做全文索引的，只有问题被索引。2. 前三条完全包含整个关键字但是排序莫名其妙，既不是根据关注数也不是根据回答。鉴于不是全文索引（没有…
&p&谢邀！（潜水员终于有可以专业回答的问题了）
&/p&&p&利益相关：搜狗搜索工程师，对搜索技术「略懂」&/p&&p&搜索是技术方向辐射相当广的一个复杂系统，其技术门槛之高，在众多的互联网产品中能与搜索比肩的是少之又少。要想玩转这套系统，拥有一批最优秀且懂搜索的工程师和研究员是必不可少的。我看到之前 &a data-hash=&bd9e16d5c0f6a8329205& href=&///people/bd9e16d5c0f6a8329205& class=&member_mention& data-tip=&p$b$bd9e16d5c0f6a8329205&&@熊辰炎&/a&
同学也提到说想解决的话，知乎可能需要5个熟练工干大半年。在我看来，这种团队配置作为站内搜索差不多能解决大部分基础问题，即达到不被“到处”抱怨。但如果要求再高一点点，能稍”智能”地处理用户查询，那么这种团队配置恐怕还是望成莫及。 &/p&&p&当然搜索也绝不仅仅是一个人力问题，支撑搜索的人工智能技术正在”经验主义”(以统计学为代表)的道路上享受着大数据（特别是用户行为数据）的红利。从一个特定站点出发，即使是一个格调高、深受用户喜爱的站点，其能够接触到的数据无论是用户群体行为数据还是全网的信息资源都是十分有限的。用户对于全网通用搜索和站内搜索的期望的差别仅在于搜索范围从全网变为这个特定站点，但搜索用户天生的”懒惰”、表达含糊以及对搜索结果智能的期待&b&从未改变过&/b&。而且由于用户对他所喜爱的站点的了解、熟悉程度远远超出其对全网的了解，所以用户对搜索服务所存在的各种问题更为敏感，从而也有更高的要求。正是这种数据局限所带来的技术水平局限与用户需求之间的矛盾，使得原生站内搜索注定就是一件不太可能成功的路。&/p&&p&扯远了，回到作为一个技术人员解释为什么知乎站内搜索没有通用搜索(例如百度、搜狗)的site查询好用吧。&/p&&p&&a data-hash=&aaee0d952a58f75427e2& href=&///people/aaee0d952a58f75427e2& class=&member_mention& data-tip=&p$b$aaee0d952a58f75427e2&&@张前川&/a& 关于搜索效果的评测解释得已经比较完善了，下面我就以这几个case为例解释一下通用搜索是如何解决背后的技术问题吧。主要分为NLP/相关性计算/排序这几个方面。 &/p&&p&&b&1.
&/b&&b&NLP&/b&&/p&&p&&b&1.1
&/b&&b&分词(Word Segmentation)&/b&&/p&&p&搜索中的分词是指将文本切成多个独立的语义单元以作为检索的最小单元，然后分词后的词串建立倒排索引以加快检索服务的速度。这是信息检索最基本最重要的架构，这里不详细展开。&/p&&p&先看看张前川提到的“避谷”这个case，正如张前川所说，避谷应该切成一个独立的词。为了解释后面的算法，我把case改成“避谷方法”，更容易说明问题，它的正确切词方法是【避谷】【方法】。如果把避谷分成【避】【谷】两个单字，就容易出现知乎站内搜索这种【避】【谷】两字分开出现的结果，也是我们常说的结果发生语义漂移。那么如何知道【避谷】应该是个独立的词呢？&/p&&p&最经典的分词方法有基于词典的前向/后向最大匹配或基于语言模型的分词等等，其中如何构建准确而全的词典，用什么语料统计适用的语言模型都是算法成功的关键所在。&/p&&p&&b&问&/b&&b&: &/b&&b&通用搜索如何解决这个问题呢？&/b&&/p&&p&&b&答：挖掘网络语料或用户行为数据！&/b&&/p&&p&a.
对于基于词典的方法，由于“避谷”是个道家的一个术语，有可能分词词典里不包含这个词。那么通用搜索通常可以通过挖掘网络语料（例如百科词条）来补充词典。&/p&&p&b.
对于语言模型或其他统计方法，用户群体历史的行为数据就是一种非常有价值的数据。这里仅提一个思路。历史上搜索“避谷方法”的用户，所点击结果的标题中“避”与“谷”很大概率彼此紧邻，“方“法”很大概率紧邻，而“谷“与”方法”很小概率紧邻。由此可以推断【避谷】【方法】应该相互连接组成一个词，而“避谷”与”方法”之间切分开来更合适。利用用户历史行为数据的方法还有很多，大家也可以打开思路。&/p&&p&&b&1.2 &/b&&b&查询纠错(Query Correction)&/b&&/p&&p&
再看“什么名字haoting“这个case，非常直观，大家都能看出来是用户把查询词的一部分敲成拼音了，需要系统自动纠错。当然这是个简单的纠错，只要找到haoting对应的上下文语言模型概率最大的汉字“好听”即可纠正过来。&/p&&p&有些需要纠错的case就不那么容易了。例如“哦泡手机”，原意是找“oppo手机。”人脑能够非常快速准确的完成这一个纠错过程，但对于不具备智慧的机器，这个转换过程并不那么容易。针对这个case算法纠错的过程大致应该是这样：首先把”哦泡”转换成拼音“opao“，然后计算“opao”和“oppo”之间的编辑距离（一种度量文本串之间相似程度的方法），然后通过多种数据和模型计算出来“哦泡”纠错成“oppo”的概率，特别是在上下文为“手机”的条件下“哦泡”纠错成“oppo”的概率。这里面的每个步骤都同时需要算法与数据的支撑，通用搜索面对更多的数据和更更多的用户，显然有非常大的优势。&/p&&p&&b&1.3
&/b&&b&查询理解(Query Understanding)&/b&&/p&&p&查询理解这个概念比较广，广义上前面提到的分词、查询纠错也可以纳入查询理解的范畴，这里我们主要用查询理解来概括查询改写、词间紧密度、词赋权等一系列的对查询的理解以帮助获得更好的搜索结果。前川前面给出的“101大厦”就是一个比较综合的例子，但是这个case我有些不同看法。&/p&&p&首先“101大厦”合在一起表示一个完整语义的实体，所以相关的结果中101和大厦应该紧邻在一起。前川说应该分成一个词，但出于搜索查全率的考虑，即尽可能找到更多的相关结果，它们还是分开比较好，因为“101大厦”还有很多种其他的叫法，例如“台北101””101大楼”等等。挖掘出101大厦的这些等价(或同义)说法对于搜索效果至关重要。这种等价或同义的算法用在搜索中就是查询改写一种最常见的形式。&/p&&p&但是“101”和“大楼”之间又存在非常紧密的关系，两者如果在文档中相距太远，结果通常是不相关的。这里涉及的是另一个概念——&b&紧密度&/b&，即既需要切成两个独立的词，但又要求结果中这两个词之间的距离足够近，某些情况要求一定紧邻。&/p&&p&查询改写、紧密度同样依赖于网络资源的挖掘以及历史用户行为的挖掘，例如用户在同一个session内的主动改写、用户查询后的点击、具有相似点击结果的多个query等等…每种数据的合理应用，都能让搜索效果有所提升。通用搜索正是利用其数千亿网页索引库以及每日数亿次的用户查询及后续行为，在大数据上逐渐积累对查询理解的智慧。这些恐怕任何一个站点都无法触及的。&/p&&p&&b&2.
&/b&&b&相关性(relevance)&/b&&/p&&p&前面提到的都是NLP相关内容，我们再来看看搜索里另一个核心技术—相关性计算。相关性计算通常指给定一个查询和一篇文档，计算两者是否语义相关。语义相关是个非常大的挑战，从技术的发展历程来看，从早期的统计词出现的频率，例如tf.idf、BM25、到language model、proximity等等都试图从查询词在文档中出现的次数、位置、词的权重、文档的长度等等多个角度去估计查询与文档之间的相关度。近来在深度学习的影响下，基于深层神经网络的词嵌入、语义表示、语义匹配等新兴技术的涌现，正在带领相关性计算由匹配统计迈入“语义计算”的大门。搜狗、百度已经在这这方面取得了阶段性的成功，同时这个方向还有很多问题待解决，让我们拭目以待吧。&/p&&p&就前川提到的“为什么要来北京”这个case，可以从多个角度解决。例如通过查询理解，我们可以知道“北京”在这个查询中是个非常重要的词，而标题包含重要的词的文档相比于仅正文包含重要词的文档中有更大概率与查询词先关。前川提到的第二条结果不相关，”北京”即仅仅出现正文里。解决这个问题的思路还有很多，要想做个搜索，需要从多个维度去阐述查询与文档之间的关系，这是一项需要相当深积累的工作。&/p&&p&&b&3.
&/b&&b&排序（ranking&/b&&b&）&/b&&/p&&p&排序，望文生义即将搜索结果按照满足用户需求的程度从高到低排序，以便最满足用户需求的结果能够排在搜索结果列表的最前面，让用户能够最先浏览到。排序主要涉及两大问题：用于排序的多维特征以及多维特征的融合以决定最终的顺序。&/p&&p&相关性无疑是搜索排序的一类非常重要的纬度，我们前面也提到相关性自身也需要从多个更细纬度去剖析。正如很多用户提到的，知乎是问答社区，有人提问、有人回答、还有人点赞、关注，为什么知乎返回的结果很多都零回答、零关注。其实问题的回答数、关注数、点赞数都是衡量一个文档质量非常客观的指标，这些对于衡量问题是否能够满足用户需求都是非常有价值的，也就是说这些都应该成为排序所考虑的特征。&/p&&p&那么这么多特征相互如何融合来决定最终的顺序呢？有很多基于规则或线性融合的方法，近年来排序学习(Learning to Rank)的方法已经无数次在各种竞赛、学术论文、工业界产品中将排序多特征的融合的结果带入或逼近局部最优解或全局最优解。&/p&&p&无论是排序特征的准确与丰富还是排序融合，都是搜索工程师们孜孜不倦地不断优化的方向，经验与积累也是非常重要的。&/p&&p&&b&4.
&/b&&b&搜索架构&/b&&/p&&p&张前川提到了搜索性能与稳定性问题，足以证明他确实是搜索的专业人士。呵呵。大部分用户会认为搜索效果和搜索性能没有什么关系，但实际上两者是紧密联系在一起的。由于服务负载的压力、用户响应时间的限制，分给每次用户查询的计算资源和时间是非常有限的。底层的检索的性能越好，所能查找的候选文档越多，所留给排序优化的时间越多，越能使用更丰富的特征和更复杂的算法，达到更好的排序效果。简而言之，性能越高，效果提升空间越大。&/p&&p&除了最基本的倒排索引，架构上还有很多可以优化的点。例如对历史数据的批量倒排和针对新数据或更新数据的实时倒排的设计，其次针对标题、正文等重要度不同字段的处理、倒排的压缩，快速交并算法、灵活的多机分环架构等等这些都是一个好的搜索架构需要考虑的问题。而好的架构的设计也是来源于对于搜索这个任务足够深刻的理解，如果没有对搜索多年的打磨，一名再优秀的架构师也是不可能设计出一套完美的搜索架构的。&/p&&p&啰嗦很多，总结一下，知乎搜索体验不理想，存在多种问题，但这些问题绝不是知乎仅有的问题，也不仅仅是人力投入的问题。搜索一个异常复杂的系统，好的搜索体验需要技术的沉淀与积累，需要海量数据特别是海量用户行为数据的支撑。站内搜索就于其在搜索方向的积累、其能接触到的数据，像知乎这样面对高标准严要求的用户，注定不易做到用户满意。&/p&&p&当然凡是问题，是都能够被解决的~~&/p&
谢邀！（潜水员终于有可以专业回答的问题了）
利益相关：搜狗搜索工程师，对搜索技术「略懂」搜索是技术方向辐射相当广的一个复杂系统，其技术门槛之高，在众多的互联网产品中能与搜索比肩的是少之又少。要想玩转这套系统，拥有一批最优秀且懂搜索的工程师…
觉得在百度搜知乎的内容都比在知乎搜知乎的内容快的多得多。
觉得在百度搜知乎的内容都比在知乎搜知乎的内容快的多得多。
我也觉得搜索功能相当糟。&br&首先是这种下拉菜单给出候选项的形式（请原谅我讲的很layman），有时候网速慢，输个了关键词就得等着，不能像常见的搜索那样回车一下然后先干别的，过一会儿再回来；&br&然后就是好像不够模糊，我有一次试着换了几个关键词的顺序，出来的结果是不一样，好像关键词的顺序要跟问题里的顺序一样；&br&再然后就是，我不知道，现在的搜索把答案包括进去了吗？&br&&br&更新：&br&放在「」的词好像是搜不到的。&br&有时候某个关键词明知道有的，比方说我答过的一提，但就是搜不出来。
我也觉得搜索功能相当糟。首先是这种下拉菜单给出候选项的形式（请原谅我讲的很layman），有时候网速慢，输个了关键词就得等着，不能像常见的搜索那样回车一下然后先干别的，过一会儿再回来；然后就是好像不够模糊，我有一次试着换了几个关键词的顺序，出来…
“因为我能！”
“因为我能！”
知乎的搜索也很不智能，建议在 Google 的搜索栏这样搜：&br&&br&「尼玛」是关键词&br&&br&无类别搜索：&尼玛 site:&a href=&& class=&internal&&&span class=&invisible&&http://www.&/span&&span class=&visible&&&/span&&span class=&invisible&&&/span&&/a&&&br&&br&搜人：&尼玛 site:&a href=&/people& class=&internal&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/people&/span&&span class=&invisible&&&/span&&/a&&&br&&br&搜问题：&尼玛 site:&a href=&/question& class=&internal&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/question&/span&&span class=&invisible&&&/span&&/a&&&br&&br&……
知乎的搜索也很不智能，建议在 Google 的搜索栏这样搜：「尼玛」是关键词无类别搜索："尼玛 site:"搜人："尼玛 site:"搜问题："尼玛 site:"……
搜索答案甚至搜索自己赞同过的答案等等，都是我们认为非常重要的功能，已经在研发测试阶段，估计在十月份末和大家见面。&br&在这也向一直以来想搜自己回答过的答案、看过的答案而不能的同学，表示歉意，希望将来的新搜索能让你满意：）
搜索答案甚至搜索自己赞同过的答案等等，都是我们认为非常重要的功能，已经在研发测试阶段，估计在十月份末和大家见面。在这也向一直以来想搜自己回答过的答案、看过的答案而不能的同学，表示歉意，希望将来的新搜索能让你满意：）
&a href=&///?target=http%3A//iwo.im/%3Fq%3D%25E9%25A2%%25AF%25BC%25E4%25BA%25BA%25E5%259C%25A8%25E4%25BC%259A%25E8%25AE%25AE%25E4%25B8%258A%25E7%259A%%258F%%25A8%%25A8%25BF& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&这里&i class=&icon-external&&&/i&&/a&&br&准确搜索：&a href=&///?target=http%3A///%3Fq%3D%25E9%25A2%%25AF%25BC%25E4%25BA%25BA%25E5%259C%25A8%25E4%25BC%259A%25E8%25AE%25AE%25E4%25B8%258A%25E7%259A%%258F%%25A8%%25A8%25BF& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&这里&i class=&icon-external&&&/i&&/a&
准确搜索：
开源的东西真的那么好吗？&br&&br&我本来对知乎的技术架构并不是很了解，可是自从我看了下面这个知乎架构演讲之后我觉得他们在技术方面的探索还是很深的，对性能的追求也是孜孜不倦。&br&&a href=&///?target=http%3A//q.com/cn/news/2014/12/zhihu-architecture-evolution& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&从0到100——知乎架构变迁史&i class=&icon-external&&&/i&&/a&&br&&br&至于为啥不用开源的而要自己写，我觉得是知乎网站架构的特殊性所导致的必然结果，虽然我也不是很明白的样子，但我觉得他们这样做肯定是有道理的。&br&&br&你没有架构过这种大规模系统，你不懂。
开源的东西真的那么好吗？我本来对知乎的技术架构并不是很了解，可是自从我看了下面这个知乎架构演讲之后我觉得他们在技术方面的探索还是很深的，对性能的追求也是孜孜不倦。至于为啥不用开源的而要自己写，我觉得是知乎网站架构…
这一套叫法原先在军队使用，为避免混淆近音的字。所以除「幺」字之外，其他数字都有类似的叫法：&br&&br&【中国人民解放军】&br&国語：洞幺两三刀五六拐八勾&br&数字：０１２３４５６７８９&br&&br&【中华民国国军】&br&国語：洞么兩三四五六拐八勾&br&数字：０１２３４５６７８９&br&&br&〔注〕「4」在台湾听说已不读「刀」&br&&br&「幺」字为什么写成「么」？这是汉字的正异问题而已。「么」的传统正字是「麼」，俗字有「麽」又有「庅」，偶尔还看见更省略的「么」字。在用法上，使用「么」字来表示普通话的虚词「me」属假借字。&br&&br&在俗书上，「么」不仅是「麼」的简笔字还是「幺」的异写俗体，所以以前的俗书抄本很混乱，两种用法都有。现时在大陆的规范里，选择了「么」为规范字，而「麽」就是《简化字总表》指定的相对于规范字的繁体字。其他的字未被提及的异体字属于『不规范』的现象，通常被叫做「错别字」。而台湾的国字标准就淘汰了「幺」，反而选用了「么」（yāo）作为标准正字。于是，「幺」字在台湾成为了『异体字』而「么」就成了『正字』。&br&&br&从此两岸的「么」字在用法上就出现了分歧：&br&&ul&&li&大陆的「幺」在台湾是「么」，而「么」才是「麽」的简化字。&br&&/li&&li&台湾的「么」在大陆是「幺」，而「麽」字就没有被简化。&br&&/li&&/ul&&br&简而言之，在知乎搜索输入「幺」字而得出「么」，是繁简转换的错误。
这一套叫法原先在军队使用，为避免混淆近音的字。所以除「幺」字之外，其他数字都有类似的叫法：【中国人民解放军】国語：洞幺两三刀五六拐八勾数字：０１２３４５６７８９【中华民国国军】国語：洞么兩三四五六拐八勾数字：０１２３４５６７８９〔注〕「4…
搜不到&br&&br&想在知乎搜点啥，打开Google，写上问题，加上“知乎”，一般足够了
搜不到想在知乎搜点啥，打开Google，写上问题，加上“知乎”，一般足够了
知乎使用mmseg做中文分词，对应的词根存在redis中作为key，数据库id作为value，每个数据项是一个zset集合。查询时根据key找到对应的value。 &br&&br&update: 上述答案已过期，2012年年中已经改为lucence了。
知乎使用mmseg做中文分词，对应的词根存在redis中作为key，数据库id作为value，每个数据项是一个zset集合。查询时根据key找到对应的value。 update: 上述答案已过期，2012年年中已经改为lucence了。
有问题需要问的时候再来知乎，而不是天天泡在知乎上看所谓有趣的问答。大数据时代，不要让自己的注意力被过度耗费。有问题，查维基或百度，建立一种学术上系统的了解，再通过咨询知乎互动知乎建立更深入的理解。总之，主动用知乎，不要陷于被动的境地。知乎其实更多的是通过一种有趣主观的互动达到对枯燥学习的一种推力。林子大，什么都有，心不定，知识不牢固，逻辑不强大，上知乎可能就跟听算命的瞎扯一样
有问题需要问的时候再来知乎，而不是天天泡在知乎上看所谓有趣的问答。大数据时代，不要让自己的注意力被过度耗费。有问题，查维基或百度，建立一种学术上系统的了解，再通过咨询知乎互动知乎建立更深入的理解。总之，主动用知乎，不要陷于被动的境地。知乎…
searchWords.Replace(&!@#$%^&*&.ToCharArray(),&&) &br&&br&我一直不觉得知乎的程序员有多聪明。
searchWords.Replace("!@#$%^&*".ToCharArray(),"") 我一直不觉得知乎的程序员有多聪明。
我们的新版搜索已经开发完成，目前在A/B测试中，接下来我们会根据测试中出现的问题进行修改和完善，我不敢保证几号上线，但我们会尽己所能，让新搜索尽早的为所有知友们服务，请大家再耐心等待一些时间~~&br&我们希望给大家一个更好的知乎搜索，相信这也是大家想要看到的~&br&当然，上线后也非常欢迎大家就使用等各个方面向我们提出自己的意见和看法~相信有你们的帮助，我们的搜索一定会越来越优质~&br&------------------------15号更新进度----------------&br&第一轮A/B test已经完成，我们获得了很多反馈，如今已经对其中多数Bug和发现的效果等问题做了修正，目前的测试结果我们还算满意，不过为了更可能的模拟贴近广大知友使用的多样性，我们将在下周进行一次二轮测试，如果有愿意参加并愿意就使用过程给我们相应的反馈和感受的知友，可以私信联系我~我可以给部分知友提供测试权限~&br&请期待新搜索~&br&----------------------已上线---新变化可前往 &a href=&/question/& class=&internal&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/question/2067&/span&&span class=&invisible&&9069&/span&&span class=&ellipsis&&&/span&&/a&
我们的新版搜索已经开发完成，目前在A/B测试中，接下来我们会根据测试中出现的问题进行修改和完善，我不敢保证几号上线，但我们会尽己所能，让新搜索尽早的为所有知友们服务，请大家再耐心等待一些时间~~我们希望给大家一个更好的知乎搜索，相信这也是大家…
NICE！&br&--&br&因为csp缘故，知乎其实存在多处跨站，只是不能被轻易利用。&br&搜索这个也是之前就存在的：&br&&img src=&/2e2bbde5d8d94f_b.jpg& data-rawwidth=&551& data-rawheight=&362& class=&origin_image zh-lightbox-thumb& width=&551& data-original=&/2e2bbde5d8d94f_r.jpg&&又一个待触发，消失掉了：）&br&&br&&blockquote&&b&知乎工程师正在修复&/b&&/blockquote&
NICE！--因为csp缘故，知乎其实存在多处跨站，只是不能被轻易利用。搜索这个也是之前就存在的：又一个待触发，消失掉了：）知乎工程师正在修复
要不是题主提出这个问题，我都没发现换新版搜索了
要不是题主提出这个问题，我都没发现换新版搜索了
个人感觉，真的很弱。尤其是如果希望搜索的关键字是文章内容的时候就几乎无能为力了。&br&精准性的话…有时候我还是改去google指定域名搜索，效果好一些。
个人感觉，真的很弱。尤其是如果希望搜索的关键字是文章内容的时候就几乎无能为力了。精准性的话…有时候我还是改去google指定域名搜索，效果好一些。
为了在知乎搜索到自己，我在知乎改了名字
为了在知乎搜索到自己，我在知乎改了名字

怎样量化评价搜索引擎的评价标准结果质量

我要回帖

更多关于搜索引擎评价指标的文章

随机推荐

怎样量化评价搜索引擎的评价标准结果质量

我要回帖

更多关于 搜索引擎评价指标 的文章

随机推荐

更多关于搜索引擎评价指标的文章