toplogo
上海市教育委员会|上海教育科研数据共享平台

为推动和促进长三角地区教育科研领域数据资源的汇聚流通和共享开放,鼓励高校师生利用新技术对开放数据进行创新研究与应用,聚合各行业力量培养和提升大学生数据素养,在上海市教育委员会、上海市经济和信息化委员会的指导与支持下,复旦大学图书馆、上海市教育委员会信息中心和上海市科研领域大数据联合创新实验室联合长三角地区多家高校和企业,面向全国高校师生举办第二届“慧源共享”全国高校开放数据创新研究大赛。

获取数据流程:
第一步:查看大赛样本数据集,了解大赛开放数据基本情况,确定要申请的数据集;
第二步:进入大赛官网申请数据页面(请先登录,用户名为团队名),根据提示完成数据申请步骤;
第三步:大赛组委会审批后,将于1—3个工作日内将相关授权信息发送至参赛团队队长邮箱,参赛团队即可下载或浏览使用数据。

大赛开放数据集:
复旦大学ERU数据集
当代中国社会生活资料书信数据集(百姓家书)
③其他数据集请在本页面查看~

互联网采集数据
课题4 | 下载8149
上海高新技术企业数据集(2014-2020)作者: 华东师范大学调查与数据中心
描述:

上海高新技术企业数据集2014-2020,共26张表,110万多条数据,涵盖了近8000家上海高新技术企业的相关信息,其中包括10万条裁判文书全文和2万条新闻全文。
数据采集于全国企业信用信息公示系统、中国法院裁判文书网、中国执行信息公开网等多家官方网站,并将各类数据统一处理、分类。

hdl:20.500.12291/10224
3943 下载
最新发布: Jun 10, 2020
百度贴吧自闭症吧用户发帖回帖数据集(2017-2019)作者: 华东师范大学调查与数据中心
描述:

百度贴吧自闭症吧用户发帖回帖数据集为基础数据层数据,为可机读、格式化的原生数据。
本数据集具有数据粒度细、数据量大的特点,对于自闭症患者及其家属在网络健康社区中的发帖回帖交互行为、自闭症症状表现、自闭症发病机理、自闭症治疗方法等研究有重要价值,能够为自闭症患者的情感支持和社会支持研究提供数据依据。

hdl:20.500.12291/10222
858 下载
最新发布: May 31, 2020
上交所科创板企业数据集(2000-2019)作者: 华东师范大学调查与数据中心
描述:

上交所科创板企业数据集2000-2019,共23张表,包含6万多条数据,涵盖了174家上交所科创板企业的相关信息,其中包括1694条裁判文书全文和7519条新闻全文。
数据采集于全国企业信用信息公示系统、中国法院裁判文书网、中国执行信息公开网等多家官方网站,并将各类数据统一处理、分类。

hdl:20.500.12291/10225
3125 下载
最新发布: May 30, 2020
美国新闻记者招聘数据集(2016-2020)作者: 华东师范大学调查与数据中心
描述:

美国新闻记者招聘数据集源自JournalismJobs.com,为可机读、格式化的原生数据。
本数据集覆盖时间长,涵盖2016年11月至2020年3月的数据(现网站仅支持检索三个月内的招聘数据)。
数据集对观测美国新闻记者行业用工特点、用人需求、人才储备、就业压力、薪资期望等研究有重要价值。

hdl:20.500.12291/10223
223 下载
最新发布: May 30, 2020