All posts by choubb

06Dec/09

搜索引擎的中式困境:谷歌,必应,百度,搜狗,搜搜及有道

中式的竞争,注重的是市场宣传,口碑,跟官方的合作,跟“主体思想”的一致性,这在内容,媒体相关的产业圈里是颠簸不破的真理。 从谷歌百度进入中国的历史来看,前者带着对中国市场的轻视,对GFW的迟疑(谷歌进入中国,遵循中国政府的互联网的内容过滤,其实已经违背了其“不作恶/Don’t be evil’的信条,其光辉形象已经在广大谷米心目中蒙上了阴影-谷歌的中国困境啊),对中文搜索技术的缺失,在相当长的时间里留下了市场的真空,这个局面一直到2005年正式成立谷歌中国公司才开始逐渐改观。 反观百度,自2001年10月发布搜索服务之时,明确专注于中文搜索,得到了民族情绪日渐上升的早期网民的绝对拥护-俺也是其中一员。到2005年上市的4年间,百度攻城掠地,不断提高技术功力,占领市场份额,一跃成为一家独大的中文搜索服务。 自从俺也开始了解了一些搜索技术,才慢慢了解到搜索其实也是体力活。爬虫去爬网页,是机器的体力活,热门词汇的分析和生成,也是一半机器一半人工体力活,搜索框的输入自动完成,也一半机器一半人工的体力活。基本原理都是系统做统计,人工做内容(关键词,热词)终审。 可以考察一下搜索第一牛人的谷歌,看看到底其在搜索技术上有什么绝活,以下摘自中文维基 他们开发了一个对网站之间的关系做精确分析的搜寻引擎,此搜索引擎的精确度胜于当时使用的基本搜索技术。当时项目被称作BackRub,因为系统会检查backlinks(反向链接),以评估站点的重要性。 Google搜索引擎以它简单,干净的页面设计和最有关的搜寻结果赢得了因特网使用者的认同。搜索页面里头的广告以关键字的形式出售给广告主。为了要使页面设计不变而且快速,广告以文本的形式出现。这种以关键字卖广告概念本来是Overture[1]开发的(即原来的Goto.com)。当大部份的网络公司倒下时,Google则一直安静地在稳步发展着并开始盈利。 2001年9月,Google的网页评级机制PageRank被授予了美国专利。专利正式地被颁发给斯坦福大学,Lawrence Page作为发明人列于文件中。[2] PR,唯一被谷歌提及的搜索技术,目前面临着逐步被淘汰的可能性(本博经过三个月的艰苦努力PR从0变到了3),以下摘自中文维基 2009年10月14日,Google员工苏珊·莫斯科(Susan Moskwa)确认该公司已自其网站管理员工具部分移除 PageRank。她对这部分移除的公告表示:“我们长久以来一直在告诫人们不应该过分注重 PageRank;很多网站站主似乎认为对他们来说得时时追踪的网站最重要指标,而这简直是个误解。”[2]然而在苏珊确认后两天, PageRank 仍旧在Google工具栏上显示。 搜索,核心技术有三个方面, 其一, 网络爬虫技术,抓取网页内容。其二:分析内容,确定抓取的网页的关键字或者元数据(meta data),并生成索引. 其三:客户搜索时, 根据关键字和元数据正确的识别客户的请求,同时输出合理的诸多结果的排序。 谷歌引以为傲的专利,仅仅只在第三步的搜索内容排序环节起作用,而且需要大量的人工干预去消除PR的作弊行为(谷歌的另一项专利, adwords/adsense更多的是商业创造的成分,跟搜索技术没有太多的相关)。从网民们的经验上看,PR技术似乎也并不理想。搜索结果过多,相关性太低是普遍的搜索体验。 可以想见,决定搜索技术命运的核心技术,在此之前,并未出现在任何一家。竞争的层面还处于角力的方式,花更多的服务器去爬网页,请更多的蓝领工程师更快的分析审核关键词,热词,内容。。。谁的人力更多,更勤奋,更受管理层重视,谁的搜索结果就会更实时,更准确一些。群众运动,是国人的强项,难怪百度会一鸣惊人,独占鳌头。等谷歌,搜狗明白过味来,市场,口碑皆为百度占有。曾经一时,搜狗拼音刚出现的时候,我顺带对比了一下搜狗的搜索和百度搜索(搜狗拼音应用了相当的搜索技术,也符合俺所定义的群众运动),80%的时间比百度要准确。最近感觉搜狗搜索质量急剧下降,应该是搜索部门人力减少了吧-我猜测应该是转移到搜狗拼音的部门继续搞群众运动去了-没有觉得最近搜狗词库的更新非常频繁么?仔细看我的上文,搜狗拼音也是搜索,更是群众运动!  跟百度断绝关系,大概有两年多。最终从搜狗转到了一圈回到了谷歌, google.com, 而不是被阉割了的google.cn。近期有了惊人的发现-谷歌搜索越来越实时,越精确了。 差不多一个月前,意外做了刚刚发布不到10分钟的博客标题的搜索,谷歌的搜索结果里第一个返回了我的博客。今天扩大了对比范围。针对刚发布的我的搜狗博客(搜狗应该占了先天优势)做标题搜索, 只有谷歌,中搜返回了我的博客,其余百度,搜狗,必应,有道,统统都不合格,没有返回俺的搜狗博客。Read More…

30Nov/09

己屋不扫何以扫天下

楼下的葡国鸡吃中饭,还是冷冷清清。一点才过,就空无一人了。门口的小姑娘殷勤的招揽着来往客人,却无一人问津。 这不也是网络商家的典型困境么?每月大把的银子送给百度,谷歌,EDM, CPC,Banner种种,以期客人走进你的餐厅。跟现实餐厅略有不同的是,一般走进餐厅了,除非菜式和服务极端的不合意,客人不做任何消费而离开餐厅;在网络商家,客人来的随意,走的就更随意了。大多数的情况是SEO,Ads带来了不少的流量,而并没有带来多少成交。就像今天再商派看到的一个帖子,号称已经玩了xxx诸多种网推,效果均不理想。现在每月准备砸2万大洋继续推广,请高人指点迷津。楼下的跟帖也很直接,该玩的你都玩了,还想怎样!互联网大大降低了客户进入的门槛,同样也大大降低了客户流失的门槛。如果只是一力的开源,而不注意修炼内功,流进来的客户同样会轻易的流出去。 既然到了这个份上,为何不换位思维,问问客户的感觉呢?俺是因为对葡国菜的个人偏好,加之与该店葡国老板有两面之缘,习惯性的选择。不过每次都觉得该店小姑娘服务员们表情相当的平淡,业务也马马虎虎,点餐没笑容,没推荐,结账磕磕巴巴的。都2个多月了,还似新手似的。看似不大的磕磕绊绊,汇聚起来就是感觉不好,行话就是客户体验不佳。刚开店时俺还介绍同事,甚至请同事去吃喝,嗨,啥也不说了。 每个月2万大洋,一年24万大洋,足够将网站,后台和客服全部改造优化一遍了,还可以直接投资用户,让利促销,或者社会化网络的客户内容(CGC)的奖励返券。 也许是中西有别。我们的思路是摸着石头过河,走到哪里再说哪里的话。对系统性科学性的知识则很少重视。电商的草台班子常常是这样搭起来的: “哥们,别打工了!累得跟骡子一样,得到的跟奶牛一样” “那干什么呢?” “听说电子商务很火,是未来啊.” “那就整呗” 数日后 “网站架起来了,有顾客上门订货了” “真有人敢来啊,看来电子商务不是盖得,准能骗不少人啊。” “钱咋收呢?” “赶紧注册公司去,把支付宝,快钱,VISA都给我连上。” 数日后 “大哥,发错了10单货,这帮小猴子就没长人脑啊。客服说整天就接投诉电话了” “找库房库管,上ERP” 数日后 “老板,咱到底赚了钱还是亏了钱?” “???,当然赚了!”。。。。“会计,ERP你到底会用不会用啊,明天给我出财务报表。不会赶紧学去!” 数日后 “老板,最近流量不少,就是没人下单啊,给百度的钱一分没少,转化率节节下降啊。是不是换谷歌好一点?” “听说choubb大侠说一(己)屋不扫何以扫天下,先练练内功吧。前端的UI/UE,后端的客服和物流,限期整改!”

29Nov/09

Twitter Weekly Updates每周推客集锦 2009-11-29

时寒冰博客:http://shihb.blog.sohu.com/137940661.html # #杨宪益传 一位香港记者对杨宪益的评价:他的一颗心,只为中国跳动。 # # 杨宪益传 后来执政的共产党也不容许其存在,两个政党尽管互相打的你死我活,但在对待人民的态度上却是高度一致的。 # 读 #杨宪益传 在杨宪益看来,各个政党都有平等的权力,公开竞争,人民才是裁判官,人民有权对他们作出自由的批评和取舍。但是,这种政治观点不仅独裁的国民党不容忍其存在,后来执政的 # 如果你要去日本, 请查#冯正虎 先。滞留成田机场,有家不能回,请带问候和食物。 # Powered by Twitter Tools