Tag Archives: 谷歌

16May/21

网站去谷歌化第一步

今天做了去谷歌第一步,停用了User Registration插件,新装了腾讯云验证码(CAPTCHA)插件。腾讯插件安装简单,5分钟连腾讯API申请和插件安装设置一并搞定。想两年前安装User Register, 设置Google API和CAPTCHA, 那可是好好折腾了一大壶,头一次没搞定。隔了一两个礼拜回过味来,才设置成功。装User registrationde的目的并不是有管理用户的需求,仅仅为了其自带的reCAPTCHA功能。 今天因为发现Post SMTP不工作了,这个也是谷歌的API之Auth 2.0和SMTP服务之上的wordpress插件,昏头昏脑搞了半天,一怒之下决定全面去谷歌化。否则回国后进wordpress还有不少麻烦。 反复试验,163和QQ的SMTP服务都没试成功,换了SMTP Mailer插件也不行,可能要等回国申请app验证才可以。不过折腾过程中把谷歌reCAPTCHA给顺利换掉了,大快人心。算是走一步看一步吧。最后Post SMTP的问题也解决了:在谷歌API里重新授权给Post SMTP就OK了。但是之前好好的,为啥就需要重新授权呢?也许永远是个谜了。 诸位高人志士,请问国内的SMTP服务和SMTP插件可有推荐的?某人不胜感谢! 5.27后记, 正好十天,因mac自动更新重启,必须重新登录wp的dashboard,呵呵悲剧了,不工作了。还好WP有应急机制,自动发了一封电邮给管理员邮箱,能应急登录,也能看到故障代码。大概如下: Since WordPress 5.2 there is a built-in feature that detects when a plugin or themeRead More…

06Dec/09

搜索引擎的中式困境:谷歌,必应,百度,搜狗,搜搜及有道

中式的竞争,注重的是市场宣传,口碑,跟官方的合作,跟“主体思想”的一致性,这在内容,媒体相关的产业圈里是颠簸不破的真理。 从谷歌百度进入中国的历史来看,前者带着对中国市场的轻视,对GFW的迟疑(谷歌进入中国,遵循中国政府的互联网的内容过滤,其实已经违背了其“不作恶/Don’t be evil’的信条,其光辉形象已经在广大谷米心目中蒙上了阴影-谷歌的中国困境啊),对中文搜索技术的缺失,在相当长的时间里留下了市场的真空,这个局面一直到2005年正式成立谷歌中国公司才开始逐渐改观。 反观百度,自2001年10月发布搜索服务之时,明确专注于中文搜索,得到了民族情绪日渐上升的早期网民的绝对拥护-俺也是其中一员。到2005年上市的4年间,百度攻城掠地,不断提高技术功力,占领市场份额,一跃成为一家独大的中文搜索服务。 自从俺也开始了解了一些搜索技术,才慢慢了解到搜索其实也是体力活。爬虫去爬网页,是机器的体力活,热门词汇的分析和生成,也是一半机器一半人工体力活,搜索框的输入自动完成,也一半机器一半人工的体力活。基本原理都是系统做统计,人工做内容(关键词,热词)终审。 可以考察一下搜索第一牛人的谷歌,看看到底其在搜索技术上有什么绝活,以下摘自中文维基 他们开发了一个对网站之间的关系做精确分析的搜寻引擎,此搜索引擎的精确度胜于当时使用的基本搜索技术。当时项目被称作BackRub,因为系统会检查backlinks(反向链接),以评估站点的重要性。 Google搜索引擎以它简单,干净的页面设计和最有关的搜寻结果赢得了因特网使用者的认同。搜索页面里头的广告以关键字的形式出售给广告主。为了要使页面设计不变而且快速,广告以文本的形式出现。这种以关键字卖广告概念本来是Overture[1]开发的(即原来的Goto.com)。当大部份的网络公司倒下时,Google则一直安静地在稳步发展着并开始盈利。 2001年9月,Google的网页评级机制PageRank被授予了美国专利。专利正式地被颁发给斯坦福大学,Lawrence Page作为发明人列于文件中。[2] PR,唯一被谷歌提及的搜索技术,目前面临着逐步被淘汰的可能性(本博经过三个月的艰苦努力PR从0变到了3),以下摘自中文维基 2009年10月14日,Google员工苏珊·莫斯科(Susan Moskwa)确认该公司已自其网站管理员工具部分移除 PageRank。她对这部分移除的公告表示:“我们长久以来一直在告诫人们不应该过分注重 PageRank;很多网站站主似乎认为对他们来说得时时追踪的网站最重要指标,而这简直是个误解。”[2]然而在苏珊确认后两天, PageRank 仍旧在Google工具栏上显示。 搜索,核心技术有三个方面, 其一, 网络爬虫技术,抓取网页内容。其二:分析内容,确定抓取的网页的关键字或者元数据(meta data),并生成索引. 其三:客户搜索时, 根据关键字和元数据正确的识别客户的请求,同时输出合理的诸多结果的排序。 谷歌引以为傲的专利,仅仅只在第三步的搜索内容排序环节起作用,而且需要大量的人工干预去消除PR的作弊行为(谷歌的另一项专利, adwords/adsense更多的是商业创造的成分,跟搜索技术没有太多的相关)。从网民们的经验上看,PR技术似乎也并不理想。搜索结果过多,相关性太低是普遍的搜索体验。 可以想见,决定搜索技术命运的核心技术,在此之前,并未出现在任何一家。竞争的层面还处于角力的方式,花更多的服务器去爬网页,请更多的蓝领工程师更快的分析审核关键词,热词,内容。。。谁的人力更多,更勤奋,更受管理层重视,谁的搜索结果就会更实时,更准确一些。群众运动,是国人的强项,难怪百度会一鸣惊人,独占鳌头。等谷歌,搜狗明白过味来,市场,口碑皆为百度占有。曾经一时,搜狗拼音刚出现的时候,我顺带对比了一下搜狗的搜索和百度搜索(搜狗拼音应用了相当的搜索技术,也符合俺所定义的群众运动),80%的时间比百度要准确。最近感觉搜狗搜索质量急剧下降,应该是搜索部门人力减少了吧-我猜测应该是转移到搜狗拼音的部门继续搞群众运动去了-没有觉得最近搜狗词库的更新非常频繁么?仔细看我的上文,搜狗拼音也是搜索,更是群众运动!  跟百度断绝关系,大概有两年多。最终从搜狗转到了一圈回到了谷歌, google.com, 而不是被阉割了的google.cn。近期有了惊人的发现-谷歌搜索越来越实时,越精确了。 差不多一个月前,意外做了刚刚发布不到10分钟的博客标题的搜索,谷歌的搜索结果里第一个返回了我的博客。今天扩大了对比范围。针对刚发布的我的搜狗博客(搜狗应该占了先天优势)做标题搜索, 只有谷歌,中搜返回了我的博客,其余百度,搜狗,必应,有道,统统都不合格,没有返回俺的搜狗博客。Read More…

09Sep/09

李开复博士创业的一个侧面

李博士退出谷歌的行政体系, 投入到激情四溢的创业投资领域,由衷为李博士的胸怀抱负所折服, 也为其人格所折服。 自从微软亚洲研究院始,至谷歌中国,李博士在一个复杂的行政和经济利益体系中,以个人的人格魅力和创造力,将美国佬的资金,技术及管理引来中国,倡导技术创造之风气,培养有世界眼界和水准的中国本土人才, 成绩大家有目共睹。 现在,李博士可以脱离樊笼,完全以自己的意愿来孵化和指导一批有志青年,共同创造,如果俺也是李博士条件所列之年龄,一定会全力争取进入这个团队和平台。而不像现在,以自己偏安一隅之身,善意的记录下也许是片面, 也许是杞人忧天的一些观察。 先看看李博士的资历 Previous jobs founding president of Google China Corporate Vice President, Natural Interactive Services Division (NISD), Microsoft Corp. 2000 – July, 2005 [3] Founder, MicrosoftRead More…