新闻产经轻工日化电器通讯仪器机械冶金矿产建筑建材石油化工食品医药电子电工能源电力交通运输农业环保图片手机版
当前位置:中国市场调查网>产业>科技>  正文

扇贝网:温故就是知新

中国市场调查网  时间:01/05/2012 11:04:27   来源:DoNews

  DoNews 1月5日特稿 在南京繁华的1912酒吧街对面,有一幢青砖白瓦颇具沧桑的建筑,曾经是前国民政府水利部大楼,这幢房子的某个小房间里,坐着扇贝网(shanbay.com)的六位工程师:

  王捷,之前是社会媒体咨询公司CIC的技术研发总监,比利时鲁汶大学人工智能专业硕士,在CIC负责中文语义分析引擎的研发;

  吴焱红,和王捷在CIC做过同事,后在网易任产品经理,曾经主导过2010年网易广州亚运频道的开发和运营;

  滕之飞,此前是杭州阿里巴巴广告与搜索部门工程师;

  曾鹏轩,美国宾夕法尼亚大学教育科技专业硕士;

  吕经纬,名字很霸气,却是扇贝网唯一的女工程师,此前拿了欧盟的奖学金,在德,意,西三个国家拿了三个硕士学位,办公桌旁放着她的溜冰鞋;

  赵余,东北林业大学计算机系的学生,还没毕业,正在这里实习,不过据说他已经完成了两项功能的上线。

  这六个人扎堆在一起,只为了解决一个小问题——

  英语单词为什么这么难背!

  温故知新

  王捷把记者拉到显示器前,在当当上搜索“英语,单词”,结果出来了:4320种书籍和资料。

  “你说,四级考试的词汇量要求也就是4000,单词书比这个数字还多,是不是很夸张?”

  是挺夸张的,不过这正说明单词难学啊。

  正在写代码的吴焱红探过头来说:“那你觉得单词为什么那么难学?”

  他本科毕业于华东师范大学心理系,凡事喜欢从心理上找原因。

  记者还没开始想,他就自问自答了:

  “首先,几千个单词边学边忘,学习者极易产生挫败感;

  其次,传统的教学方法里,每个单词被作为孤立看待,导致学习者要面对几千上万个知识点,应接不暇;

  最后,语言学习是一个厚积而薄发的过程,只有长期学习后才能够逐渐看见效果,但是大部分人缺乏耐心,时常半途而废。 ”

  那扇贝网打算如何解诸多学习者于倒悬呢。

  他们解释道,扇贝网核心教学理念就是: 温故即知新。

  简单的说,就是将用户需要学习的新词和曾经学过的单词关联起来,变着各种花样重复,同时在学习新知的过程中复习旧识。

  他们主要采用了三种教学方法,并通过技术加以实现:

  1. 间隔性重复 (Spaced Repetition), 俗称遗忘曲线,即在预测学习者即将遗忘某单词的时候,及时进行复习,这种技术基本上已经成为背单词软件或者网站的标配;

  2. 自适应学习(Adaptive Learning),即根据用户的程度和测试结果,动态调整学习材料和学习方式,达到循序渐进的目的。扇贝网会根据用户对某个单词熟悉程度的不同,从易到难的进行复习测试,

  3. 基于数据的学习(Data Driven Learning),即将单词之间的各种联系做为线索,基于用户学习过单词推荐新词,并在学习过程中告诉用户所学词汇和以往的词汇之间的关联,达到温故即知新的目的。说白了,这是一个面向词汇的推荐引擎。

  王捷给记者展示了他正在学习的一个词 pugilism,系统会以词根作为线索,告诉用户曾经学习过的impugn,pugil 等词和pugilism都具有相同词根 pug-,表示“手,拳头,战斗”,同时推荐了一个新的同根词impugner:

  据王捷介绍,譬如自适应学习这样的概念,在70年代即被教育研究者提出,旨在借助计算机技术来记录学习者的大量操作数据,判断个人的程度和学习难点,从而有的放矢的安排学习内容和进程,但是碍于条件不足,因此一直到近几年才开始被真正的投入应用,最近的一个例子是在2011年获得3300万美元融资的Knewton,Knewton采用了自适应学习的方法帮助学生准备GRE,GMAT等考试。

  自娱自乐

  在回答为什么会想到做这样一个网站时,他们说这个想法早就有了,只是酝酿了好几年才开始动真格的。

  王捷硕士毕业后的两年在布鲁塞尔的一家公司上班,每天要坐火车往返两座城市,车上的时间就用来看小说,当时《达芬奇密码》非常火,但是他花了几个月时间才看完,期间最为纠结的就是随处可见的生词,一开始他还能不厌其烦的查字典做记录,但是发现再遇到这些生词时依然不记得是什么意思;屡经挫折后,他希望有一个网站能让他在看书过程中把遇到的生词和例句丢进去,而后只要登录网站,系统就能按照一定规律提醒复习;这样看完一本书后,上面的词也该会了七七八八,再看下一本就容易了。

  而吴焱红也早在大学学习英语时就想找个途径可以把属于某个话题的单词都组织在一起,譬如学finance这个词,能够顺藤摸瓜地接触到金融或者经济相关的其他词汇;如此的词汇学习就不是面对几千上万个孤立的单词,而是一组一组有意义的专题。更有意思的是,还可以由多人来共同编撰这样的专题,添加相关的文章链接和评论,不断丰富专题内容。

  当两人准备把各自想法合二为一,考虑是否要全职创建这个网站时,王捷问吴焱红,如果这个产品上线后,一个用户也找不到,你会继续用下去么?吴说我会用的;王说,我也会用,那只要我们俩用,就值了。

  于是,就有了扇贝网。

  上线三个月之后,他们的用户突破了1万人。

  2011年六月,他们获得了天使湾创投(tisiwi.com)的投资。

  现在,扇贝网注册用户超过50万,每天的使用用户超过1万,其中包括扇贝网工程师自己,以及他们的女朋友或家人们。

  君子爱财

  记者发现扇贝网的页面很干净,除了学习的内容外,没有任何广告。

  “我们不放广告”,王捷说,“你可以把我们想象成一所学校或者一间教室,哪里有老师在上课上了一半的时候突然停下来插播一条广告的呢?”

  那扇贝网准备怎么盈利呢?

  他们说,希望网站最核心的盈利模式就是一手交钱一手交货,即扇贝网提供有价值的服务,用户直接付钱。

  当然,考虑到国内用户的消费习惯和付费意愿,他们还是做了一定的变通,采用了Freemium模式,同时还借鉴了美国一家健身房的办法,让使用越多的用户付费越少甚至不付费。

  这是怎么做到的,记者很好奇,于是看到了下面这张图:

  扇贝网实现了称为“贝壳”的虚拟货币系统,并通过这套虚拟货币形成了一个经济生态圈:用户如果希望得到更多的学习量或者增值服务,就需要支付贝壳;贝壳哪里来呢,用户可以用支付宝充值,但是也可以通过每天学习,推荐新用户等获得系统的奖励;用户还可以通过创造和销售词串(即通过某个主题组织起来的一组单词)从其他用户那里赚取贝壳。

  “通过这套模式,扇贝网每月已经有来自用户直接支付的收入了,但是我暂时不能告诉你有多少”,王捷笑笑。

  他山之石

  记者问,扇贝网的开发过程中, 有没有山寨,哦,借鉴过同类产品。

  吴焱红说,“如果之前已经有了满足我需求的网站,不管国内国外的,那我肯定懒得自己做了。”

  “像我们这样把自然语言处理,文本挖掘这类技术整在一起,杀鸡用牛刀一样,做一个系统的词汇学习产品,全世界不好说,国内还真没看到一家类似的”,王捷补充道。

  但是他们也认可的确在设计思路上参考了其他产品(未必是词汇学习产品)

  王捷说,“你看我们的应用市场,就是学苹果和Android的”

  什么?扇贝网做为一个垂直应用网站,居然也有自己的应用市场,有必要么?

  “背单词看起来是一个很单一的功能,但是实际上用户的层次不一,需求非常复杂,很难用相同的模式满足大部分人,因此我们将一些功能包装成独立的插件式应用,用户可以选择单独购买。”

  他们给我展示了初级用户和高级用户能够看到不同学习界面,前者只要求有词汇的中文解释和一些例句就可以了,当然最好加入图片;而后者则希望看到英文的释义,以及相应的词根信息。

  (初学者界面)

  (高级学习者界面)

  众人拾柴

  相比桌面的词汇学习软件,扇贝网还有一个优势,便是能够汇集众多用户的智慧,譬如用户可以为自己的单词创建笔记和例句,同时和他人分享,当你背到morose(adj. 郁闷的,怪癖的)的时候,看到另一位写的“没肉丝,没玫瑰”,是否会精神为止一振呢;或者学习methodical 这个词,读到同样TBBT粉丝的TA添加的例句“ Sheldon's methodical to the extreme/谢耳朵有条不紊极了”,有没有一声“Bazinga”在你心中回荡?

  另外,还有前面提到的用户可以创建词串,相互收藏或者购买。

  他们说,未来还会进一步增加社会化的元素,但是不会照搬Web2.0的概念,否则做出的东西很可能不是2.0而是2。

  愿乘长风

  记者问,扇贝网接下去的打算是什么呢? 他们回答说主要是产品还有底层架构优化。比方说,一些算法的参数还有模型需要不断进行调整,一些技术还没有完成产品化,当然网站的用户体验也需要进一步提高;更重要的是,随着用户和数据量的增大,扇贝网的服务器已经感受到了压力(譬如用户学习数据已经快要过亿),相应的制定扩展方案正在制定。

  “你们有想过做移动终端产品么?”记者问。王捷回答说,“基于IOs和Android平台的客户端已经在我们的计划当中,但是我们的重心始终还是会放在Web上,原因有两点:

  一,以我们的理解,一般而言,移动互联网中最复杂的一块依然在互联网端,海量的数据,有效的信息结构,以及应对大量的访问,这些都必须服务器端解决,不论客户端是电脑是手机还是平板;

  二, 在产品初期,很多需求和功能都没有确定,需要快速迭代试错,譬如过去的一年里,我们的工程师提交了4300多次代码,完成了200多次在线发布,这样的速度只有Web产品上才能做到。因此我们最重要的目标是要把心目中那个牛逼的东西先做出来,觉得可以接受了,再尝试其他平台”

  最后,记者问他们有什么想和读者说的。

  “我们在找人,如果你是Linux和Python和JS和数据库(他强调‘和’)的编程高手,或者你是一个好美工,碰巧还挺喜欢英语,请联系我们”

  “当然,如果你是一个漂亮女生,这些都不重要”,王捷补充说。