随着多模态人工智能与生成式技术的快速发展,人工智能(AI)正从辅助性工具逐步转向嵌入式教学支持系统,在实验探究、课堂行为分析、教师专业发展与沉浸式学习环境构建等方面展现出系统性价值。
多模态人工智能教育平台
AI支持型手机微实验室[1]:由慕尼黑大学物理教育研究团队Jochen Kuhn团队提出,旨在将智能手机传感器实验与多模态大语言模型结合,构建AI增强型实验教学框架。该研究提出AIRIS(Activation-Inquiry-Reflection with Intelligent Support)三阶段教学模型,强调学生在Activate阶段完成假设建构与手动分析,在Inquiry阶段由多模态大模型承担积分、回归与数据可视化等计算任务,在Reflection阶段对AI结果进行批判性比较与模型整合,从而实现“支持而不替代”的AI协同探究路径。
非语义多模态课堂片段预测模型[2]:由日本先进科学技术大学院大学的Sheng Ruozhu团队提出,面向长时课堂录像难以高效复习的问题,构建基于非语义多模态特征的片段访问频率(SAF)预测框架。研究整合教师动作特征、音频频谱与课件翻页信息,在不依赖文本语义与转录的条件下预测高访问片段,并在665个标注片段上验证模型效果,最佳模型在七折交叉验证中达到0.5143的皮尔逊相关系数,在三分类任务中取得61.05%的平均准确率,表明该系统能够在资源受限的真实课堂环境中自动识别关键复习片段,从而提升讲座归档的可用性与学习效率。
多模态生成式AI赋能双语教学设计[3]:由台湾中正大学与阳明交通大学的Chang Wen-Li团队提出。基于设计型研究框架构建为期一学期的教师培训课程,围绕文本生成器、视觉设计工具与反馈驱动写作助手等多模态GenAI工具,探索其在教师输入、学生输出与自适应学习支持中的应用路径。研究指出动态GenAI能够在课堂中实现实时反馈与情境适配,支持个性化双语学习环境构建,并强调需通过系统化培训提升教师AI素养与教学设计能力,以实现有效的人机协同教学模式。
GAN与Vision Transformer驱动的多模态数字人教育平台[4]:由东莞城市学院与菲律宾国立大学马尼拉分校等机构的Yang Xuliang团队提出。构建基于生成对抗网络与视觉Transformer的数字人教育平台,通过包含1000名学生与50名教师的大规模数据集进行评估。实验结果显示该平台在虚拟形象真实性、交互响应速度与学习效果方面显著优于既有系统,其中识别准确率提升12%,交互响应时间缩短25%,学生学业表现平均提升8%,表明GAN与ViT融合能够提升沉浸式教学交互质量并增强学习成效。
综上,多模态AI正深度嵌入实验探究、课堂行为分析、教师专业发展与虚拟交互学习等教育全流程,为构建个性化、沉浸式与高效能的未来教育生态提供有力支撑。
参考文献:
[1]. Kuhn, Jochen, et al. "AI-supported mini-labs: Combining smartphone-based experiments and multimodal AI." European Journal of Physics 47.2 (2026): 025702.
[2]. Sheng, Ruozhu, Jinghong Li, and Shinobu Hasegawa. "Non-Semantic Multimodal Fusion for Predicting Segment Access Frequency in Lecture Archives." Education Sciences 15.8 (2025): 978.
[3]. Chang, Wen-Li, and Jerry Chih-Yuan Sun. "Empowering bilingual teachers with dynamic GenAI: Adaptive design and implementation of multimodal instructional strategies." Computers & Education (2025): 105490.
[4]. Yang, Xuliang, Aimin Pan, and Rodolfo C. Raga Jr. "Construction of a multi-modal digital human education platform based on GAN and vision transformer." Scientific Reports 15.1 (2025): 14850.