计算机科学与技术学院(大数据学院)研究生开展《“计”往开来,“研”以致用》系列活动第二期
4月16日,计算机科学与技术学院(大数据学院)研究生在学院806会议室召开了《“计”往开来,“研”以致用》系列活动第二期。本期活动以“大语言模型:从技术涌现到科研赋能”为专题,由2024级博士生白玉洁主持召开。
首先,白玉洁同志从人工智能发展史切入,系统梳理了语言模型的技术演进历程。她详细回顾了从统计语言模型到神经语言模型的技术变迁,重点剖析了Transformer架构的革命性突破及其对大语言模型发展的奠基性作用。通过深入解读Scaling Laws(规模扩展定律),白玉洁同志生动阐释了大语言模型涌现能力的科学机理,包括上下文学习、指令跟随和多步推理等核心特性。
接着,白玉洁同志详细梳理GPT系列模型的技术发展脉络,深入解析了OpenAI在这一领域的里程碑式突破。她介绍了从2018年GPT-1到2023年GPT-4 Turbo的技术演进过程,重点分析了模型规模扩大带来的能力跃升。
在技术研讨环节,白玉洁同志结合最新研究成果,从预训练、适应调优、应用工程和评估体系四个维度,全面剖析了大语言模型的关键技术。她特别强调了提示工程、轻量化微调等实用技术在实际科研中的应用价值,并通过具体案例展示了这些技术如何提升研究效率。
康莉老师在总结发言中指出,大语言模型技术是落实"人工智能+"国家战略的重要支撑,学院将持续为研究生搭建技术交流平台,促进学术创新。她鼓励同学们把握技术发展机遇,在人工智能领域深耕细作。康莉老师对此系列活动的举办成效给予高度评价,并表示将进一步优化活动形式,打造更具影响力的学术品牌。
初审:张润琦
复审:康 莉
终审:韩福英