|
| |
接天莲叶无穷碧,映日荷花别样红————浅谈“拇指搜”手机搜索引擎的异军突起 |
| |
|
拇指搜概念提出的行业背景
随着互联网应用的日益广泛和和信息技术的高速发展,“信息”正以其前所未有的迅猛态势渗透于社会的方方面面,改变着人们原有的社会空间。对互联网用户而言,搜索已经成为必不可少的网络行为。每天数以千万计的网络用户依靠搜索引擎在互联网这个无穷无尽的知识宝藏中如饥似渴地“淘”着自己需要的各种信息,而这一切也成就了中国互联网搜索行业“接天莲叶无穷碧”的勃勃生机。据赛迪顾问《2004中国搜索引擎状况报告》显示,被称为互联网产业第四桶金的搜索引擎市场规模正在迅速壮大,2004年市场规模已达9.4亿元人民币,逼近10亿元大关。报告预计,未来几年该市场将保持60%到70%的高速增长,到2006年将达到约26亿元人民币的规模。艾瑞市场咨询也预测,未来 4年里,搜索市场每年将以35%的速度增长,到2007年,全球搜索市场的规模将达到70亿美元。 然而,人们对搜索市场的挖掘和探索并没有停止在互联网一个层面,2004年,从互联网获得灵感的一项移动增值新业务——“拇指搜”开始崭露头角。当搜索技术的势力“蔓延”到移动通信领域后,将会出现什么样的情形呢?中国有9000万网民,却有4亿移动用户。相比互联网搜索,拇指搜无须上网设备,只要一台普通手机就可以随时随地搜索而不受网络限制。遇到一个难以解答的问题,渴望查找一个重要资料,随时了解衣食住行信息,可身边又没有计算机无法上网,有了拇指搜,用手机也可以搜索各种各样的信息。作为大众移动搜索服务平台,拇指搜与互联网搜索引擎一样方便:不用记忆固定格式,不用背代码。比如“郑州最好玩的酒吧在哪里、本草纲目的作者是谁、国内外任何地方的天气预报、我与女友发生矛盾了该怎么解决”等等, 怎么想就怎么问,用手机编辑任何问题以短信的形式发送到相应的端口号都可得到精确结果。
拇指搜的核心技术
拇指搜采用了当今比较前沿的自然语言分析技术和自然问答技术,使得用户查询变得更加方便和自如。比如:现有的短信查询一般都需要提交固定格式的短信,甚至要用户记代码。例如,“公交查询短信”规定查公交换乘方案的格式是“公交+逗号+起点+逗号+终点”,不能查一条线路有哪些途经站、是否空调车、票价是多少等信息。 而拇指搜所使用的 “自然问答技术”可理解人提出的文字问题,自动从数据库中找到答案,使人机交流更智能化和人性化。采用这种技术后,用短信就不只是查信息,而是可以与人对话,“问”信息了。拇指搜与固定格式的短信查询方式相比,好处是查询人怎么想就怎么问,无需经过培训和学习即可使用。与电话查询相比,好处是不用笔记录,且是自动应答,节省人力成本,又不会出现拨打不通的现象。 拇指搜技术的核心是自然语言处理技术。自然语言处理的核心技术是语言分析技术,即将句子(数量无限)变换成由词语(数量可控)及其抽象形式(数量有限)构成的用某种数据结构(句法树、复杂特征集或语义网络)表示的内部形式(数量有限)。 我们可以通过一个问题的提问和回答过程来形象地描述。 当一个手机用户发送 “红楼梦的作者是谁”这样一条短信时(发送到10620114),该短信首先上行到电信运营商(移动、联通、网通)的网关,从电信运营商网关再发送到SP短信网关,再由SP短信网关传输到SP “拇指搜”语言处理系统,由该系统开始进行智能分析。这种智能分析要完成一个任务,即发短信的人到底问的是什么意思?因为上述那样一个简单的问题其实是有很多种问法的,比如:“谁写的红楼梦”“红楼梦是谁写的”“红楼梦是谁的著作”“伟大的著作红楼梦的作者”“红楼梦是由哪个人完成的”等等,这里多一个字少一个字,错一个字,关系都非常重大,因为计算机不是人,它识别的是一个又一个的字节,当字节稍加变动,它就有可能为你提供一个截然不同的答案或识别失败。因此任何一个问题的问法几乎都是无限的。同时比较接近的问题也要甄别出来,比如:“红楼梦作者介绍”“红楼梦后四十回的作者”“红楼梦有几个作者”“红楼梦故事介绍”等等,又是一个无限级的数字。拇指搜语言处理系统要根据问题的提出通过高度智能的语言分析,得出问话人的真实意思。 完成这个过程以后,拇指搜语言处理系统将依据处理后的结果从拇指搜庞大的资料库中搜索答案。如果资料库中有与之匹配的答案,则拇指搜自动回复系统开始工作,将该答案传送到SP短信网关,再由SP短信网关传输到运营商网关,最后发送到用户的手机上,从而完成整个提问和回答的过程。这个过程看似很复杂,其实都是在几秒之内完成的。 当然,由于人们发送的问题千奇百怪,涉及工作、学习和生活的方方面面,拇指搜的资料库即便浩瀚如海,也不可能满足所有人的需要,因此,拇指搜平台还需要另外一个重要的辅助系统——人工智能辅助系统。笔者曾就此访问过河南从事该行业的某高科技负责人,据他讲:该公司的拇指搜人工智能辅助系统是在长达两年多的时间中不断摸索从而逐步完善起来的。由于此前从来没有人做过类似业务,没有任何资料可以参考,因此系统的开发艰难无比,目前已经形成两大模块30多个功能区域的实用性处理系统,基本上能够满足拇指搜业务的智能辅助工作。
拇指搜实现的困难
首先,自然语言分析技术在国内仍然是格外前沿的技术,尤其是与无线数据技术结合方面,迄今无人突破。汉字同西文字母,有很大差别,西文字母不仅数量少,而且是恒定的,计算机语言又是以英语为基础的。而汉字是大字符集,且随着应用领域的扩展(如古籍整理),计算机系统中需要存储的字数不断增多,自然会有更多麻烦。同时自然语言处理是一门交叉学科,它涉及到语言学、数学、逻辑学、计算机学等等多个学科,现在兼知数学、语言学、计算机科学的人才不多,水平也不算高,因此要在短期内完成这方面的突破几乎是不可能的。尤其更加艰难的是,手机用户发送的问题往往不按照正常的汉语语法发送,主谓宾次序颠倒有之,错别字有之,与所问主题无关的“废话”有之,一条信息问几个问题有之,一些手机不支持的非法字符有之,等等,都给拇指搜语言处理系统带来很多难以克服的困难。 其次,大量的资源数据积累非一日之功可以完成。每个人的大脑都是一个复杂无比的世界,他究竟会提问什么问题,谁也无法预知,因此就要求拇指搜的资料库格外全面庞大,据河南这位高科技企业负责人讲,他们从拇指搜项目设立迄今两年多的时间,数据库的完善一直没有停止,目前已经形成了一个包罗万象、商业价值很高的综合性知识宝库,尤其是来自民间的许多河南省当地便民信息,更是花费了他们无数的心血和巨额的资金。 最后,拇指搜如何通过有效的宣传深入到广大手机用户心中是业内人士普遍感觉头疼的一个大问题(重点是宣传短信发至号码:10620114)。诚然,此类基于短信的应用项目的最佳宣传方式是短信群发,但据电信运营商有关负责人讲,群发短信给广大手机用户带来很多不必要的麻烦,因此大都已经停止这种活动了。这无疑对拇指搜运营商们是一个严峻的考验,他们不得不通过各种渠道进行融资,而融资的主要用途就是宣传。但由于国内的风险投资商大都只关注已经完成孵化期的项目,而对于这种刚刚出现的新兴项目心存疑虑,因而拇指搜开发商们的融资也必然是一个艰难无比的过程。 根据笔者的了解,除了拇指搜概念以外,国内很多公司也提出了基于WAP的手机搜索的概念,但是苦于找不到一个科学合理的运营模式和技术实现模式,因此大都处于探索和观望阶段。基于WAP的手机搜索服务使用起来十分不方便,用户操作的步骤是:手机上网——转到某搜索服务商的WAP网站——输入关键词——漫长的等待(主要是移动网带宽问题)——出现一系列网页连接(通过手机小屏幕看着这些似是而非的网页,人很难一下子找到自己真正需要的东西)——不停地翻页(要找到自己需要的资料)——点开那个网页(又得等待半天)——发现根本不是自己需要的(很多用户都有这种反映)——再也不使用了。这就是一些大型搜索引擎提供商们为什么迟迟没有进行广泛宣传的主要原因。关键是:模式不合理,可操作性差。拇指搜则无疑拥有太多的优势,这也是拇指搜的开发者们有信心将之做强做大的主要原因。
拇指搜的商业模式
任何一个项目,都要确定它的商业模式,即赖以赢利的方式,拇指搜也不例外。根据调查了解,拇指搜的收入模式来自两个方面,一是用户发送问题时的短信收入,二是企业加盟的合作收入。 如前文所述,拇指搜与互联网搜索的不同之处在于,它可以向提问人收取一定的“解答”费用,但据拇指搜的开发者们讲,其实他们首先关注的并不是这部分短信收入,拇指搜所蕴涵的巨大的商业价值体现在与企业的合作。一旦拇指搜成为人们工作生活中难以离开的重要查询工具时,必然会牵动无数企业的加盟。比如,我是郑州一家地板砖生产商,当该企业负责人通过手机在拇指搜平台进行注册以后,该公司的名称、地址、电话、产品等收录进了拇指搜的资料库,当有人发送“请问怎么可以找到地板砖代理”等相关问题时,系统会自动将该企业的资料发送到问话人手机上。当然,系统可能发送的不止一家资料,谁排在第一位发出,这要看合作单位的知名度、信誉度以及交纳的费用高低了,原则上在企业信誉度相当的情况下,谁交纳的费用多,谁排在第一顺序发出。这与一些网络搜索引擎推出的“竟价排名”比较类似。 笔者走访中了解到,目前河南唯一一家拇指搜服务提供商在推出该业务不到两个月的时间里,已经被广大手机用户接受并使用,目前使用人数每天在2万人次以上,按照这个势头发展下去,预计潜在用户将达到五百万人,因此该系统也必然会成为宣传机构或个人服务和产品的优秀平台。在搜索市场“接天莲叶无穷碧”的盛景中,拇指搜正呈现出一派“映日荷花别样红”的另类风光!
国外的成功案例:
去年4月份,英国三家主要的手机运营商——Orange、沃达丰以及O2都分别推出了AQA服务。该服务的名称叫“你问我答”(AnyQuestionAnswered,简称AQA),通过结合计算机自动搜索和人工搜索技术为用户提供问题的答案;二,AQA传送给用户的咨询结果不能超过短信160字符长度的限制;AQA雇用了专门的人员对基于计算机的搜索结果进行整理,之后再发送给用户;三,与GOOGLE等搜索引擎都是免费的相比,AQA则是一种基于短信的付费服务。四,分析人士认为,假以时日,AQA服务将会向传统的互联网搜索引擎发起强有力的挑战。 |
| |
|
|