产品聚焦 | 澳鹏多学科题目数据库助力教育大模型开发

02/02/2024

大模型技术的迅速发展为教育行业带来了新的变革。教育行业具备高知识储备需求、交互性强等特点,使其成为大模型落地应用的重要领域。随着教育行业智能化升级,人工智能正在持续探索与教育各环节深度融合,以满足当下更多元、个性化、高质量的教育需求。

教育大模型训练需要从大量的学科文本库中汲取不同的知识内容。高质量的知识点掌握和解题技能对于最终训练出的模型质量至关重要。澳鹏多学科题目数据库涵盖多学科试题数据,并通过多重环节严格把关数据质量,助力教育大模型训练和落地。


教育大模型覆盖多场景应用

知识问答:便捷化知识获取方式。教育大模型通过大量通用数据和教育行业专业数据的训练学习,积累大量知识,通过虚拟教师、课堂助手等对话式方式,帮助快速满足知识点查询、题目解析等需求。

教学辅助:推动精准化、高质量教学。大模型通过挖掘分析学生学习情况、学习成果等数据,帮助教师形成更具针对性的教学计划,提高教学质量;同时,通过自动生成课程大纲等教学材料,大模型还可以协助教师开发课程,提升教学效率。

学习指导:提供个性化学习辅导。大模型通过收集分析学习数据,根据学生的知识储备、学习进度、学习习惯、学习状态等因素,制定个性化学习规划,培养学生的自主学习能力。

语言练习:优化交互式学习体验。大模型可以通过语音、图像、文字、数字人等多模态交互方式提供更加自然的学习体验,虚拟人口语陪练老师、口语助手等应用可覆盖更多口语学习环境。

测评考试:助力自动化试卷批阅。大模型可以根据考点、题型等内容自动生成考试试卷;还可以辅助老师进行智能评卷,提升阅卷效率。


共建高质量教育大模型

2023年4月,中国信息通信研究院依托人工智能关键技术和应用评测工业和信息化部重点实验室大模型工作组开展行业大模型标准体系建设,并正式启动教育大模型标准编制,得到了教育大模型开发产业链各环节的支持。

标准覆盖数学、语文、英语、物理等学科,从记忆、分析、创作等角度评价大模型的性能效果,综合考虑大模型在知识准确性等方面的可靠性,为教育大模型应用落地提供参考与指导。


澳鹏多学科题目数据库助力教育大模型开发

在开发教育大模型的产业链各环节,大量、高质量的知识点掌握和解题技能输入对于最终训练出的模型质量至关重要。截至目前,澳鹏多学科题目数据库包含近30万道题,数据库内所有学科题目均取得了授权。数据库提供excel可编辑版本、json格式等,方便多渠道查看与使用。

澳鹏多学科题目数据库:

  • 明确细分了每道题目所属的知识点,学科考点覆盖率100%;
  • 细致划分题目难度等级,更加方便使用;
  • 在准确给出每道题目答案的基础上,还为题目添加了详细的解释。

澳鹏多学科题目数据库涵盖语文、数学、英语、政治、地理、历史、生物、物理等多学科试题数据,并通过严格的挑题、录入、排查、筛重、解答、复核、校稿等环节确保数据质量。

初高中语文题

量级:40,000题

题型:单选、复合(考察考生的鉴赏评价等能力)、填空、解答(考察考生大作文/表达应用等能力)

涵盖知识点:常识、名著阅读、诗歌鉴赏、语言运用等

初高中化学题

量级:40,000题

题型:单选、多选、复合(考察考生计算能力)、填空、解答(考察考生推理判断及化学思维的综合运用能力)

涵盖知识点:物质结构与性质、反应原理综合、有机化学、无机化学、定性和定量思想等

小学初中高中数学题

量级:30,000题

题型:单选(考察考生在正确判断考点基础上的速算能力)

涵盖知识点:平面几何、立体几何、数列矩阵、代数式、综合应用等


澳鹏提供600+个成品数据集,包括27,600+小时音频、490,000+幅图像和超过一亿字/词文本,涵盖80+种语言和方言。我们也在不断构建新的数据集,以满足全球企业用户的部署需求。

澳鹏提供600+成品数据集,包括ASR、文本、发音词典、图像及视频,为您的快速部署提供高质量数据。