toplogo
上海市教育委员会|上海教育科研数据共享平台

为推动和促进教育科研领域数据资源的汇聚流通和共享开放,鼓励高校师生利用新技术对开放数据进行创新研究与应用,聚合各行业力量培养和提升大学生的数据素养,在上海市教育委员会、上海市经济和信息化委员会的指导与支持下,复旦大学图书馆、上海市大数据中心二中心和上海市科研领域大数据联合创新实验室联合国内多家高校和企业,面向全国高校师生举办第四届“慧源共享”全国高校开放数据创新研究大赛。

获取数据流程:
第一步:查看大赛样本数据集,了解大赛数据基本情况,确定要申请的数据集;
第二步:登录大赛官网,根据提示完成身份验证、提交研究设想、申请数据并提交数据使用协议;
第三步:大赛组委会审批后,将于7—10个工作日内向参赛团队反馈数据申请情况。

大赛数据:
复旦大学ERU数据
上海公共数据开放平台
③其他数据集请在本页面查看。

C 自有数据
课题5 | 下载88
描述:

中文阅读分级语料集包括了人教版小学语文课文语料库、经典儿童文学作品抽样语料库和接力儿童分级阅读书目抽样语料库。人教版小学语文课文语料库从人教网通过爬虫获取,研究的对象是课本中1到6年级的所有成篇课文,根据小学语文教学大纲,语料分为三级,1-2年级、3-4年级、5-6年级为低中高三级。经典儿童文学作品抽样语料库选取了郑渊洁童话、《中国五十年儿童文学名家作品选》和伍美珍和和曹文轩的童话三部作品作为抽样语料内容。接力儿童分级阅读书目抽样语料库按照年龄分为三级,包含了4部儿童文学代表作品。

hdl:20.500.12291/10794
6 下载
最新发布: Jun 8, 2023
“双减”政策微博博文数据作者: 王鹏1,靖吉浩2,张梦楠1
描述:

本研究以微博作为数据来源,使用TF-IDF算法对“双减”政策博文进行关键词及词频分析;随后,本文使用动态主题模型对“双减”政策博文的主题热度和演化情况进行了分析。

hdl:20.500.12291/1228
4 下载
最新发布: Jan 11, 2023
2022年上海疫情期间微博签到数据作者: 周钰烨; 王逸文
描述:

微博等社交媒体平台已经成为人们表达自身情感与态度的重要渠道。数据集中包含2022年上海疫情期间微博签到数据,该签到数据主要通过Python爬取,采集的数据字典包括微博文本、地理位置、发布时间等(数据示例如下表1所示)。为保证数据质量,应用噪声过滤方法对数据进行降噪(剔除用户转发的和由机器人发布的微博)。

hdl:20.500.12291/10793
7 下载
最新发布: Dec 19, 2022
新能源汽车用户体验作者: 田亚辉
描述:

以新能源汽车为代表的汽车设施是解决能源环境问题的有效途径,市场前景广阔。但是与传统汽车相比,消费者在一些领域还是存在着一些疑虑,其市场销售需要科学决策。基于此,我们需要对目前的新能源汽车销售以及发展情况进行解析与优化,因此需要大量的新能源汽车发展历程与新能源汽车用户体验数据。新冠疫情期间,我们主要通过发放线上问卷、面访交流的方式进行云实践统计调查,来获取新能源汽车用户的真实评价与体验。本问结合实际情况,查阅相关文献,设计了包括新能源已有用户体验与目标客户自身特性、购买意愿在内的多项指标问卷,从而达到获取新能源汽车用户体验数据。

hdl:20.500.12291/10777
25 下载
最新发布: Dec 7, 2022
城市抖音粉丝量数据作者: Xiaoni Wu
描述:

抖音粉丝量是反映抖音用户被其他用户关注频数的统计指数,本文采用人工检录的方法标识成渝城市群城市地域名词的关注程度,选取自2016年9月20日抖音上市至2021年1月1日为研究时段,具体检录方法如图1所示:首先在抖音搜索栏中输入被关注的城市名词,之后检索与该城市相关的用户栏,点击搜索即可获取该城市的不同用户的粉丝量,逐一排查检录后累加求和得到城市的抖音粉丝总量,以此作为该城市被关注的程度。

hdl:20.500.12291/10776
46 下载
最新发布: Nov 17, 2022