“第二届中大史学与数字人文工作坊” 纪要

稿件来源:中大历史学系 发布人:杨红彬 发布日期:2024-06-22

在人工智能浪潮席卷全球的今天,历史学研究也正经历着前所未有的改变。6月15日,“第二届中大史学与数字人文工作坊”在中山大学南校园永芳堂成功举行。本次工作坊由中山大学历史学系和中山大学广州口岸史研究基地联合主办,邀请到来自中山大学、香港中文大学、福建师范大学等高校不同方向、不同研究时段、擅长不同数字人文技术的历史学研究者,共同交流与探讨数字人文前沿,促进先进工具在史学研究中的深度应用,探讨数字技术在历史研究中的创新,为史学研究注入新的活力。

 

工作坊参会人员合影

 

开幕式上,中山大学历史学系教授、中山大学广州口岸史研究基地主任江滢河致辞。他介绍了会议主旨,回顾了上一届工作坊的成果,并强调了年轻学者在这一领域的潜力。他表示,年轻学者热情拥抱先进技术,往往有能力更早更快地接触和吸收相关知识,这是数字人文的特征之一。

 

中山大学历史学系顾晓伟副教授发表了题为“媒介技术视界下的历史知识生产方式”的主旨报告。他探讨了媒介技术的发展如何促进了对历史研究方法多样性的思考,包括通过不同媒介进行研究的可能性,进而讨论了人工智能技术如何重新定义历史研究的方法。他指出虽然这些技术提高了研究的效率和便利性,但也引发了对于历史学家角色可能会被替代的担忧。

 

中山大学历史学系博士生王彦波聚焦于大语言模型的本地部署问题。他分析了几种主流本地部署大模型的优缺点,论证了本地部署对于历史文献处理的必要性。他提到,随着显卡算力的高速提升、能耗的不断下降,以及整合AI模型与运行环境的平台出现,机构和个人进行本地部署和训练个性化大语言模型的可能性将大大增加。

 

福建师范大学硕士生郑婉凤的报告集中于如何利用互联网资源进行中文古籍文献检索和初步处理,特别关注经学史领域的内容。她首先介绍了几类开放集成的古文献资源利用相关网站,接着展示了通过网站功能进行搜索、版本比对的方法,以及利用特定工具进行批量下载和转写的技巧。最后她举例说明了各类古文献检索、管理平台需要改进的方面。

 

香港中文大学博士生刘葭妍介绍了出版物及手稿数据化的定义、文本内容,详细展开了处理步骤的解说,并对每一步中存在的问题和解决方法做出探讨。特别关注了手写识别的发展和通过特定数据训练提高识别效果的方法。最后她以工具Transkribus范例分享了一则具体的使用体验,让大家更直观地看到西文出版物及手稿数字化的过程。

 

中山大学历史学系硕士生鲍源骞的主题是使用计量方法研究历史数据。她详细讨论了计量史学在研究中应当注意的前置条件,特别强调了深厚的史料理解和大量搜集多类型数据的重要性。她以两次鸦片战争之间的鸦片贸易问题为例,详细讲解了不同类型的历史数据、基本的计算和分析方法,以及使用Python等工具进行数据处理的经验,旨在为同行提供研究帮助和拓展工具选择。

 

中山大学历史学系本科生陈昭羽、中山大学地理科学与规划学院本科生常诗琦同组报告,她们着重讨论将历史图像资料分析研究历史地图的方法,涵盖了图像的收集、处理、评价过程,以及时空信息的映射、摄影技术在早期测绘中的应用。她们现场展示了使用这些资源来合成历史地图的步骤和技术细节,特别是如何系统化处理复杂的历史图像资料并应用于实际的地图制作中。

 

中山大学历史学系博士生卢卓瑜则讲解了使用ArcGIS和方志数据绘制一幅历史专题地图的过程。他先介绍了软件和主要的历史地理数据获取途径,再以道光《香山县志》恭常都乡村分布作为案例演示历史地图绘制过程,最后通过数字化处理古旧地图与现代地图比对分析,揭示自然环境的变化及历史变迁,为进一步的研究提供了数据支撑和新的视角。

 

中山大学历史学系周湘副教授的报告集中于当前大语言模型在实际应用中的可操作性和准确性。通过比较Claude-3-Sonnet、GPT 4o、通义千问等模型在不同场景、不同需求下,面对专业、深度提问时的反馈,讨论了几种大语言模型用于辅助研究时各自的长处和使用者提问的技巧。

 

会议现场气氛热烈,与会者们充分地分享、讨论了各自的经验与见解。此次工作坊不仅增进了大家对数字人文的了解,也为未来跨学科、跨院校的合作交流奠定了坚实的基础。会议开始前,广州突降暴雨,但很多同学仍冒雨前来旁听,其中不乏来自中大东校区、珠海校区以及来自香港高校的同学,反映出年轻一代对数字人文有着强烈兴趣。

 

工作坊现场