时间:2017-09-23 07:45:46 来源: 互联网 复制分享
调研 | 张扬 东起
撰写 | 东起
2016年成立的享阅教育选择了一条新赛道中文分级阅读。
中文分级阅读赛道几乎还没有开启,其中一个主要原因在于中文本身的复杂程度,使评测体系难于建立。享阅教育创始人赵梓淳介绍,中文分级阅读的难点主要在于三点:一是汉字数量庞大,对于英语基础组成的26个字母,中文常用汉字约有3500个;二是分词,中文没有天然的分词界限,如何分词影响词频,进而关系到难度的定义;三是句法,中文句法结构随性,增加了分析难度。
考虑到使用传统语言学加统计学的方法需要大量的时间、人力和物力,享阅教育通过机器学习的方式搭建中文阅读分级标准。
解决这一技术难题,依赖于享阅教育一支极为“性感”的核心技术团队,CTO任易博士毕业于北京大学,曾在IBM、搜狐大数据部门和微软亚洲研究院工作,有多年数据挖掘经验,首席数据科学家Jake Zhao,师从人工智能“大牛”Yann LeCun教授。
目前,享阅教育已构建起自己的中文分级量化标准(ER Framework),从字词句段篇五个维度,以及下面更细分的几十维特征,对中文文本进行分级。
基于底层技术,享阅教育目前有3款产品:阅读能力测评、考拉阅读和中文分级阅读标准。目前,公司的商业模式主要是To B,为学校提供以上3款产品:阅读能力测评面向学生,提供测评和结果分析报告;考拉阅读包括学生端、家长端、教师端和校长端,教师可以通过软件为学生布置个性化的阅读任务,学生在线上或线下阅读、通过软件完成练习并留下学习数据;中文分级阅读标准则是所有产品的基础。目前,To B产品根据用户数按年收费。建立起品牌背书后,公司也将向C端拓展。
相对于国内,美国分级阅读市场已经十分成熟,其原因主要在于三点,一是社会对于阅读的重视程度较高,二是技术积累,例如被广泛使用的蓝思分级标准已经有30年积累,三是英文的特点和语言学研究积累。据赵梓淳介绍,Renaissance,Newsela和Lightsail等公司都已经得到市场认可。
随着用户意识转变,中文分级阅读市场将逐渐走向成熟,而自主搭建了底层标准的考拉阅读,已经在市场中占得先机。
赵梓淳先后在芝加哥大学和哥伦比亚大学获得硕士学位,是连续创业者。近日,赵梓淳和爱分析分享了对行业和公司商业模式的思考,现节选部分内容,供大家参考。
爱分析:创业之初,对市场如何判断?
赵梓淳:阅读在美国是特别大的产业,无论重视程度还是产业支持都很好,其中分级阅读领域比较亮眼的公司有Renaissance,Newsela和Lightsail。
Renaissance1984年成立,曾拿到Google Capital的4000万美金融资,2014年以10亿美金被收购。公司产品线很丰富,有用于测评的Star Assessment,通过20-30分钟的测试,将孩子的阅读能力量化,判定问题所在,用数据驱动教育发展;有承接测评产品的Accelerated Reader,通过他们自己的一套分级体系测出文本阅读难度,与之前测评的学生阅读能力匹配,保证学生读到最适合自己的文字。
Newsela做新闻分级阅读,B轮是扎克伯格投资,累计融资2600万美金。公司的底层标准是用蓝思分级,核心技术点是有一部分机器辅助新闻改写,同样的主题以不同的阅读难度提供给相应理解能力的孩子;产品大概已经覆盖美国70%以上的公立学校,每所学校收取4000-7000美金。
Lightsail做iPad端的个性化图书馆,B轮是亚马逊创始人Bezos投资,累计融资超过4000万美金。它也是基于蓝思分级,可以在线看书是跟其他机构最大的区别;在中国通常是跟相对高端的辅导班以及国际学校合作。
在美国,分级阅读市场其实已经很成熟。相比来看,国内之前有公司在做分级阅读,但是没做起来,这条赛道基本上没有开启。
因为无论什么样的公司做,其实背后都要有底层标准做支撑,去评估、测量出文本阅读难度。国内迟迟没有开展,是因为缺乏中文阅读评级标准。
爱分析:这个难点在哪?
赵梓淳:首先最大的问题是中文太复杂,传统统计学加语言学的方法有些无能为力。
第一方面是汉字数量多,英语基础组成是26个字母,但中文最常用汉字大概3500个,中华辞海收录的汉字超过8万个,这导致了复杂构成的稀缺性,使我们分析汉语的时候需要更庞大的语料库。
第二方面是分词,英语有天然的分词界限,但中文其实是模糊的,如何分词会极大影响最后对难度的理解。
第三方面是句法,英语句式有先行词和严谨的句法结构,更便于分析语法树和嵌套深度等,但中文其实很松散,结构很随性,这都导致了更大的分析难度。
当时跟很多教授沟通,他们说如果用传统统计学加语言学的方法做这件事情,大概需要10-20年。
爱分析:考拉阅读是怎么做的?
赵梓淳:我跟合伙人任易博士在做这件事的时候,也受到Google Translation的一些启发,通过机器学习来实现。因为直接用深度学习的问题在于没有那么大量的数据,从语料库到学生行为数据等,国内都是一片空白,其实整个都是我们在搭建。
首先,我们打造了大概几百万字的非平衡语料库,主要取材于各种语文教材。语言学家洪明教授和来自人民日报的十几个人组成的标注团队,从字词句段篇五个维度、几十维特征,给文本进行标注。
第二步,用机器学习方法去学习这个语料库中专家打标签的规则,其实这也得益于现在技术的发展,现在有大概处理了几亿次的一个平衡语料库。
再下一步要得出分数,像英语主要考察词频和句长两个特征,它们用手写规则就可以得出公式,但在中文里这两点其实都不太靠谱,所以我们最后需要几十维特征来表征中文的阅读难度,把大概将近五十维的特征,拟合进AI系统,最后得出从200-1300ER的分值。
随着产品层面的数据越来越多,可以反向校准这个标准,类似于AlphaGo,实现自我进化。
这也是我们这套系统相比于英文分级系统的一大优势。
爱分析:K12领域做语文的比较少,是不是也是因为这个技术原因?
赵梓淳:对,K12主要做的就是数学和英语,因为语文无从抓起,没有任何的抓手,传统的话或者是线下培训班,或者是为语文老师提供教案、视频或微课等。但如何通过数据驱动语文教育,提升阅读能力,其实是没有先例的。
我们在做的,就是将本没有被收集的海量语文学习数据进行捕捉、整合以及分析,把语文学习变成自适应学习的过程。
爱分析:现在考拉阅读的分级系统进展如何?
赵梓淳:现在我们打造出了第一套中文分级量化标准,与Yann LeCun教授等行业内专家沟通过,大概可以达到93%的精度。
爱分析:给学校提供的产品包括哪些?
赵梓淳:首先就是考拉测评,从各个维度考察孩子的阅读能力,生成测评报告提供给学校、班级和老师。
我们现在测评了将近十万名学生,覆盖一线城市到四线城市,得到了中国学生阅读能力第一份量表。我们不但能测出学生的阅读能力水平,还能测出背后哪个技能点有欠缺。
爱分析:对孩子的测评结果如何与文本分级标准对应?
赵梓淳:需要用数学模型,将两者拟合进一个体系,使测评分值和ER值对应。同时,还需要大量的实证性研究。
这部分验证研究是测量心理学专业的李国超博士负责。学界做分级阅读主要是认知心理学和语言学专业的人,认知心理学其实一直在做这件事情,之前主要研究方向是测孩子的阅读认知障碍,以及对其的干预,设计各种实验测量信度、效度等。
爱分析:进校产品在测评之外还有?
赵梓淳:考拉阅读,包括学生端、教师端、家长端和校长端四个端口。
通过老师端,老师可以根据每个人的最适发展趋势一键布置阅读任务。目前考拉阅读有几千本课外书,每本书后面有30-100道题目,验证学生是否读懂。另外还有朗读任务,帮孩子纠正读音。
公司的人工智能主要应用在三个层面,一是打造底层分级标准,二是自适应学习系统,就是学生端的自学功能,根据阅读能力推荐相应内容,三是智能语音,在老师和家长没那么多时间的情况下,帮助孩子解决读音问题。
爱分析:基于现在的产品体系,对于商业模式有哪些规划?
赵梓淳:首先是To B,通过To B建立品牌背书;To B站稳后,这条赛道基本就关闭了。
第二步是2C,我们其实是天然适合2C的,阅读产品并不像背单词和学数学,孩子每天晚上要听睡前故事,是客观存在的场景。如何让阅读变得更有乐趣,让孩子读到他们能读懂的东西,获得成就感,从而建立激励体系,这是我们要做的事情。
47岁钟丽缇小腹隆起拼四胎, 考拉变黑, 张伦硕爱她全在图中!
建立中文分级阅读标准, 考拉阅读的野心不止校内市场 | 爱分析访谈
孙俪一件戏服在闲鱼上拍出2万元, 织布料的是个66岁老头, 花10年复原织罗
施耐德电气品牌日 | 天猫聚划三星Note 8未发布就惊现北京地铁, 闲鱼售价13800元算好礼拿到手发软!
47岁钟丽缇小腹隆起拼四胎, 考拉变黑, 张伦硕爱她全在图中!
已经47岁,已经生了生了三个孩子,的钟丽缇,小腹隆起要生第四胎了?还好她及时澄清了,衣服的导致的。 感觉他们就一直无忧无虑都在游玩,这次游玩归来,小腹隆起了,哈哈,是不是一时...【详细】
建立中文分级阅读标准, 考拉阅读的野心不止校内市场 | 爱分析访谈
调研 | 张扬 东起 撰写 | 东起 2016年成立的享阅教育选择了一条新赛道——中文分级阅读。 中文分级阅读赛道几乎还没有开启,其中一个主要原因在于中文本身的复...【详细】
以前看朋友手持三星NOTE7,外观挺惊艳的,进来放假在家,经过一番心里斗争,决定购买一台亲自使用体验一下。 相信在闲鱼翻车的朋友不少吧,小编比较幸运,收到手机经过一番检测,...【详细】
今日小编去闲鱼上出售闲置物品,虽然一直都知道某宝旗下的卖家一直以奇葩文明。想不到他可以开挂成这般模样,没有你买不到的东西,只有你想不到的。 美食篇 . 绝版...【详细】
在上一次写鱼塘升级相关的文章里有一处错误,更正如下! 在收到系统通知可以领取头衔时,还需要头衔页下点击,申请头衔审核,等待头衔审核通过,鱼塘才算升级成功! 原因鱼塘需...【详细】
孙俪一件戏服在闲鱼上拍出2万元, 织布料的是个66岁老头, 花10年复原织罗
《那年花开月正圆》正在热播,孙俪的一套戏服在闲鱼上进行公益拍卖,最终以2.14万元价格成交。 该剧服装化妆道具出自于叶锦添之手,可谓美轮美奂。但这种服装的布料——“...【详细】
闲鱼这个二手平台我用了有不短的一段时间了,从最开始在闲鱼平台上处置一些自己不需要的二手物品(主要以电子产品为主),到最后帮大家处理闲置物品。到现在为止,累计完成了72笔...【详细】
科技的进步越来越快,手机的更新换代也越来越快,由于手机厂商每年都会推出新一代的产品,所以大部分消费者都会选择一年更换一部新的手机。 因为手机的更新换代太快,旧手机...【详细】
夏普S2这款手机貌似是刚发布不久的,全面屏做的蛮炫酷的,闲鱼上搜了下发现居然已经有很多二手货源了,赶紧买了台玩玩 黑屏状态看不出什么特别的 开机了视觉冲击力很强...【详细】
闲鱼发生大事啦! 3月14日,“温州跑路老总”林作敏名下“杭州市西湖区天亿大厦”标的在闲鱼拍卖上演了一场拉锯战:在拍卖即将结束的一刻,三名神秘竞拍人突然发力,之后频频...【详细】
2016年 3月26日,在杭州召开了一个二手平台的塘主大会,并且向各大媒体郑重介绍一个二手平台——闲鱼。 一年前的新闻现在才发?是不是发了假新闻? 其实今天只是引用这篇...【详细】
施耐德电气品牌日 | 天猫聚划三星Note 8未发布就惊现北京地铁, 闲鱼售价13800元算好礼拿到手发软!
上周三星正式发布了今年的最后一款旗舰机,三星Note 8。9月15日将会在韩国正式开售,国内也要等到9月下旬才能发布,至于国行什么时候开售暂时也没有消息。可是今日就有网友在...【详细】
还记得小米Note2的冰川银版本吗,上市至今仍未正式开卖!小米6亮银版也是如此,雷军号称其价值10万,这个也是小米6探索版本!如今,小米6亮银版现身闲鱼,价格仅3999!这个也是全球首卖...【详细】
闲鱼将于9月1日正式启动全国首个“实人认证”。 ■文|网商君 “开通实人认证 共建闲鱼社区”,闲鱼方面称将于9月1日正式启动全国首个“实人认证”,把发布和交易全链...【详细】
前几天闲鱼上卖火车的刷了一波屏,闲鱼上大神真多,什么都能卖。 今天小编又在闲鱼发现竟然还有人卖这东西 什么样的神秘照片呢,难道是传说中的双鱼玉佩? 你们说小编...【详细】
做家电的跨界做手机其实非常多,比如海尔、海信等品牌都有自己的手机,但是无论在品质还是声量上都有任何优势,但是这一情况在2015年得到了巨大的扭转,而这个品牌便是 大名鼎...【详细】
给大家分享一个相对而言,做的人比较的引流平台。但是效果还是挺不错。这个平台就是闲鱼。 这里是阿里旗下专门卖二手产品的地方,先现在好这个软件,安装上之后,直接用淘宝...【详细】
主屏尺寸5.5英寸 主屏分辨率1920x1080像素 屏幕像素密度401ppi CPU型号高通 骁龙801(MSM8974AC) CPU频率2.5GHz 纠错 GPU型号高通 Adreno330 RAM容量3G...【详细】
闲鱼350入手的苹果5C 性价比很高 颜色很骚 日常使用很是流畅
iphone5C 这款机型用的人貌似不是很多,身边都没什么用过,可能塑料机身不是很受欢迎,不过塑料的颜色还是很抢眼的,特别的苹果绿,特别骚气,500元以内的备用机,是很不错的选择 ...【详细】
事情远没有我们想的那么复杂,一切都很简单,而且比想象的更加简单。有好几个人私信让我写利用闲鱼赚钱相关的内容。他们说自己的闲鱼根本没人发消息,浏览量低的可怜,东西也买...【详细】
上一篇:47岁钟丽缇小腹隆起拼四胎, 考拉变黑, 张伦硕爱她全在图中!
本文地址:软件资讯 >> http://www.9xz.net/it/ruanjianzixun/96179.html
下一篇:返回列表