04Nov/09

在云中搜索

自从07年米国上空升起了云,谷歌将亚马逊的云概念放大提升,云就主宰了互联网的上空。 这团云1年多后飘到了神奇国,有嘴喷上天的,有图上画的,有扔泥巴拍张泥巴空中飘浮的有图有真相的泥巴云,还有昨天搜狗拼音的云输入法,这个是近期看起来最靠谱的云了。自从搜狗发布了搜狗拼音,搜狐在俺的心目中地位直线上升,拜托了过去烧钱吹牛催肥的路数,走上了创新的道路,俺甚至觉得假以时日,百度都将败于搜狐体系-看看百度最近的各种创新,无不是追风之举。 借着团团热云,俺也从搜索性能的角度也云一把, tag cloud search, 通过标签云的搜索。典型的TCS是 Quintura, 也有人称之为有视觉的搜索(Visual Search), 看看针对俺的网名的搜索的视觉效果吧。   可以看到的云,不是么?choubb是初次的搜索词, 根据这个搜索词,引擎动态生成了一个相关性的标签云。可以在这个标签云里继续拓展搜索的内容。让我们来看看到底会发生些什么结果。光标移到标签“购物”, 标签变得高亮, 同时搜索列表也自动变化了。光标离开,则高亮消失,返回上一个页面-不论搜索结果还是标签云。 返回到第一次搜索choubb的页面, 点击另一个标签“9月,1st”,标签高亮保持,同时搜素结果跟随变化。点击搜索流程导航的返回箭头(向左),可以返回上一个画面。 如下图(注意标签大小的跟上一个搜索的不同对比): 继续搜索-选择第三个标签,试了差不多一大半的标签,都没有结果(如下图)。既然没有结果,为什么还要显示这一层的标签?第一个bug发现了,哈哈 观察,Quintura有两个创举 标签云的搜索, 有点类似搜索鼻祖雅虎的目录是搜索,但是雅虎做的是树状结构,Quintura采用的是标签,是平行的,并列式的关系。目录和标签云的UI也截然不同 搜索流程。将搜索根植于应用之中 的博客中阐述的概念类似。在线行为无非是三种:在一个有限开放的环境中搜索知识,人机信息交互;其二,在一个封闭环境中完成人机信息的交互;其三则完全利用在线环境做人与人的信息互动。那么第一种在线流程从本质来说都是搜索。 初初感觉Quintura 非常直观易用,不像google有cheat sheet之类,把搜索变成了很专业很神秘的事情。来Quintura上手就用,眼见为实,不藏猫腻。 发散性搜索。恰好今天看了篇博客,责备谷歌搜索局限了人们的思维。而在Quintura,标签和标签的关系是发散的。 搜索结果。可以说不尽如意,搜索的相关性比较低。这也很自然,发散性的搜索自然相关性比较低。。相信Quintura还有大量的细节需要发展和优化。 再来看看Quintura公司本身 05年8月创立:有些历史了Read More…

01Nov/09

翻译练习:Twitter, 提纲, Lists, 目录, Y!ou

很喜欢看Anil Dash的博客,就如这一篇。时而细细的抚摸着互联网的脉搏,突然又将互联网的部分解剖开来;时而跳动在最潮的浪尖,一转身也可以回到互联网的侏罗纪。大洋彼岸的互联网已经柳暗花明又一村,中国的互联网任重道远仍然踯躅在原始的丛林里。就像本篇,互联网已经进入到了chapter3, 从人工到机器再到人工,而看看国内,大部分的站点甚至还未明辨人工还是机器方法区别。同发译言:http://www.yeeyan.com/articles/view/56852/66168?yeeyan=1 人类创造的web,但我们已经在很大程度上放弃了构建web的内容的权利, 而把它留给了软件。 此种现状可能会改变。 本周全面推出了新功能-列表(Lists)。 列表,可以让你列举了一些你所跟从的Twitter用户,然后轻松地阅读这些帐户的更新。 其他人可以查看您的列表,也可以选择订阅它们。 不仅如此,名单也可用被其他应用程序所使用,修改和共享。 从另一个角度来看,名单可以看成是给任意实时网络的聚合(feeds)打的一个标签(Tag) 。 我刚刚添加的列表作可以被看做是描述我的twitter聚合的一组标签。 共享聚合的(非实时)早期概念来自提纲,并由 的工作创造出了OPML。 虽然最初设计它的作用是交换提纲,OPML已经变成了用于共享任意聚合的最流行的方法。 (尽管专业计算机人士仍然诟病OPML的技术问题,就像丘吉尔的对民主的评论-这是最糟糕的形式,除了任何其他的可选形式。)有意思的是,这个协议用在twitter类似的实时聚合是,竟然不用做任何协议的改变。 事实上,在几个星期前,我曾将150个所跟随的聒噪,无足轻重的Twitter用户转移到了谷歌阅读器,将他们输出成OPML文件。 Twitter开始变得更令人愉悦,同时我仍然可以保持跟踪那些用户的动静,点进谷歌阅读器就成了。 名单有一些特点,比看起来还要有趣;我们可以把这些当成列表的定律。 首先,你必须登录一个有效的Twitter帐户才能创建它们。 (这似乎是显而易见的,但非常重要的。)其次,将一个Twitter的用户加入你的列表,你将在查阅该列表的时候看到该用户的更新。 将账户认证和关系的绑定 ,是一个减少垃圾邮件的好方法。 最早的分类组织网站的内容的方法之一是人工编辑目录。 类似开放式目录项目(Open Directory Project)的计划依然存在,但该模型侧重于定义主题和结构,以及为所确定的编辑确定各自的编辑权限。 这跟默认公开编辑权限的项目-比如维基百科形成了鲜明对比,可能是“编辑的内容”和“用户生成内容”的web时代的重大的区别-从来都不缺乏人们贡献内容,区别是我们是否信任信任他们及他们产生的内容。同样,越来越多的提纲式的目录内容出现了,像已经停服Halley Suitt的十大主题,都是基于主题的聚合内容的思维。在任何情况下,试图招募一个编辑队伍去支撑不断成长的web被证明是注定失败的。但是,我们已经看到像美味(Delicious)的网站通过给网页或者帖子打标签所显示出的价值-一个新一代的目录已经显示出给所有的帖子打标签的价值,或者如我们所称,聚合。 谈到web的目录和列表, 我们不能不谈到雅虎。雅虎的原罪是在试图建立一个人工编辑的网站目录,在实现成为唯一成功的门户网站的不幸的目标之前,目录就是雅虎的标签。(即使到今天,雅虎一直维持了一个类似雅虎最初格式的目录页,即使这成了一个跟博客差不多的东西。)非但没有采用账户验证和关系绑定,以免网络垃圾压垮了网站,雅虎主要依靠向列表的公司收费,因而限制了它的功用。人工编辑目录差不多成了雅虎的脚注,也同时成了web历史的脚注。Read More…