为推动和促进教育科研领域数据资源的汇聚流通和共享开放,鼓励高校师生利用新技术对开放数据进行创新研究与应用,聚合各行业力量培养和提升大学生的数据素养,在上海市教育委员会、上海市经济和信息化委员会的指导与支持下,复旦大学图书馆、上海市大数据中心二中心和上海市科研领域大数据联合创新实验室联合国内多家高校和企业,面向全国高校师生举办第四届“慧源共享”全国高校开放数据创新研究大赛。
获取数据流程: 第一步:查看大赛样本数据集,了解大赛数据基本情况,确定要申请的数据集; 第二步:登录大赛官网,根据提示完成身份验证、提交研究设想、申请数据并提交数据使用协议; 第三步:大赛组委会审批后,将于7—10个工作日内向参赛团队反馈数据申请情况。
大赛数据: ①复旦大学ERU数据 ②上海公共数据开放平台 ③其他数据集请在本页面查看。
中文阅读分级语料集包括了人教版小学语文课文语料库、经典儿童文学作品抽样语料库和接力儿童分级阅读书目抽样语料库。人教版小学语文课文语料库从人教网通过爬虫获取,研究的对象是课本中1到6年级的所有成篇课文,根据小学语文教学大纲,语料分为三级,1-2年级、3-4年级、5-6年级为低中高三级。经典儿童文学作品抽样语料库选取了郑渊洁童话、《中国五十年儿童文学名家作品选》和伍美珍和和曹文轩的童话三部作品作为抽样语料内容。接力儿童分级阅读书目抽样语料库按照年龄分为三级,包含了4部儿童文学代表作品。