Tag Archives: splunk

21Feb/10

搜索技术在知识库中的应用

几个月前去四大银行之一交流。我们作为搜索技术提供商参与了客服中心方案的讨论,旨在提供web渠道的自助服务。 两次交流后,银行一方问了很多知识库的问题-原来项目中的重头之一是如何修订甚至重建目前已有的知识库-分类混乱,错误多多,更让x行头痛的是多条知识存在一个doc或xls的文档里,如何找到知识,并精确定位,都是传统知识库难以解决的问题,不是么, 面对一个或数个海量知识库, 你有足够的金钱和人力重新修订该知识库么? 还好,俺们公司提供左图的知识库自我学习的机制。前提是有客服机制的系统。当在线知识库查询得不到满足时,系统可以将查询请求转移到客服,客服找到合适的答案,推送回给客户。我们的系统则负责在客户线上搜索的模型和客服推送回的修正的知识建立新的对应。当下一个客户进行同样的搜索时,搜索引擎返回的已经是经由客服更新的知识了。 这样的好处是,客户查询越频繁的知识,被修订的越早。根据power law的定义,应该80%的客户查询都集中在20%的知识上。其次, 知识库的修订跟客服流程相结合,而无需额外的系统和人工。其三,除非新增知识,错误知识的修订并不改变知识库的任何数据,只是改变搜索引擎的索引到新的文档ID或链接。当你有一个海量知识库的时候,以传统技术解决以上三点的工作量可能是你完全不敢想象的。 当让除了上述三点, x行对多数据源的支持也很感兴趣-搜索引擎天生支持多种多个数据源的。这样可以免除了知识库合并的天文数量级的工作量。 大中型企业经过多年的IT建设后,存在各种IT系统,如OA、HR、ERP、CRM、财务系统等,这些系统因为建设时期、项目的不同,形成了一个个数据孤岛。而客户的要求经常要查询多个IT系统,在界面各异,逻辑各异的数据孤岛中寻找相关的内容,基本上成了mission impossible。如何检索,分析和利用分散在不同系统, 不同数据格式的大量已有数据去解决问题, 变成了企业知本能力和行动力的基础。 听起来很玄妙?www.splunk.com就是一个典型的例子。假如你是x电子银行,早上10:30多个客户投诉转账不可用了,你是公司的IT经理,第一反应什么?打电话找集成商和供应商吧。有了 Splunk,可能第一反应是查看splunk并做几个搜索。Splunk 本质就是搜索引擎,将你的IT所有系统的性能,维护,安全等等数据都一网搜尽,不论是底层的数据交换机,路由器,OS,服务器,应用服务器,数据库,web服务器,所有的系统的监测数据和log都为splunk所用。Splunk 将所有的数据进行索引和分类,并提供dashboard,报表等高级功能。所有相关电子银行的异常都将被splunk在一个列表里反映出来, 无论它是防火墙, 路由器, OS, 应用服务器还是数据库等等。 Splunk就是知本经济在IT中的典型应用, 那么你的工作中的知本应用是什么呢?

25Oct/09

将搜索根植于应用之中

Embedded Search in Apps-内置于应用中的搜索,没听说过? 别谷歌百度了, 这个词是俺造出来的。最近哮喘复发,医生开了小菜四碟,水剂,粉剂,片剂尽有,说话也简洁。 “这个血象知道什么意思?” “知道,不是第一次了,离开北京症状就退了。。。” “只有去海南了, 今天开的药治表不治根。” 前后大概就这么几句话,没有安慰,也不夸张,平平淡淡,跟早市买菜买鱼一样。过去是万万不接受这样的方式,今天这个半瘸的中年大夫却让我感觉很对味。开的药也很有效,晚上能气顺能睡着了,白天也昏昏的,隐约记得大夫问过你开车的问题。 早晨无意发现了一个网站。有点俺说的ESIA的意思,www.splunk.com。号称是下一代的IT搜索, 企业内部无处不在的IT搜索。维基的解释很直白:is a monitoring and reporting tool for IT system administrators with search capabilities。以我高度的理论功底,这个Splunk在俺的ESIA的理论框架之下,IT日常的log管理和经常性(错误诊断和维修)trouble shooting and recovery就是Apps, 搜索是贯穿整个Apps的筋络。只有搜索才有能力提供在一个复杂的企业环境里信息的提取,整合,梳理和知识库的检索和方案的行动的形成。当然,这个已经被诸多知名企业采用的系统,在我看来还仅仅在ESIA的理念上开了个头, 原因是它目前的搜索和搜索跟业务流程的集成度还远远做的不够深入,不够完美。可以看出,系统的设计者是资深的IT项目专家和运维专家, 但对搜索的理解和技术的把握还在一般的软件应用水平。 有意思的是,俺实际是在找一个能线上共享知识的网站,从角色关系可以是单个分享者,多个受众,也可以使多个分享着,多个受众,必须有事件时间点(timeRead More…