历史与AI的距离︱拜占庭学的数字研究方法
“拜占庭”,来自地中海的中世纪文明,在传统的观念中以保守陈旧,食古不化的刻板印象著称,长期以来只被视作繁荣又多元的罗马帝国的影子。而研究这一文明的学科也只是肇始于语文学的寻章摘句之中,亦或是从实地对业已荒废的建筑遗迹进行考察,抒发思古之幽情。这一古旧的文明与学科,给人最早的AI印象竟然是计算机科学研究中的“拜占庭容错算法”(ByzantineFaultTolerant),成为了计算机技术发展历程中的一个凝固的概念,也是拜占庭学研究者常常自我取笑的内容。在这种停滞且毫无生机的印象里,研究拜占庭帝国的学问是如何同与时俱进的数字研究方法联系起来的呢?
实际上,计算机和数字技术的迅速发展加速了科学与人文学科的互动,已经催生了数字人文成为当今拜占庭学学界最为活跃的研究领域之一,许多基于数字方法的历史数据库被建立起来。不仅如此,近年来AI技术的进步加速了数字人文的发展局势。如今,如何利用数字方法进行历史研究,应用AI技术对数字研究方法进行进一步的创新,突破传统历史研究范式,构建新的历史研究方法,已经成为当代学者们热切探讨的核心问题。为此,2024年9月19日至11月21日,东北师范大学世界古典文明史研究所以“拜占庭学的数字研究方法”(DigitalMethodsforByzantineStudies)为主题,组织了第八届国际拜占庭学研讨班讲座系列。该活动旨在通过邀请国际同行来展示国际拜占庭学中的最新数字研究方法,为国内拜占庭学的数字人文研究提供思路和合作契机。本次研讨班汇聚了来自奥地利科学院中世纪研究所、德国美因茨莱布尼茨考古中心、比利时根特大学等国际一流学术机构的多位拜占庭数字人文研究学者,围绕拜占庭学研究的数字化转型与AI应用,从文献数字化、历史地理建模到数据库构建等多个角度展示了数字方法在拜占庭学中的创新与应用。他们的报告不仅展现了拜占庭学领域数字人文的最新研究成果,也为全球范围内的古典与拜占庭学研究者提供了数字人文研究在方法和理论上的新启发。更重要的是,讲座的举办展现了学术共同体中开放学习和交流的重要性,推动国内外拜占庭学学术界在信息时代以数据库为基础,借助AI的方法,建立紧密的学术共同体。
在当下,许多历史学者被新兴的概念吸引进AI的发展潮流中。因此如何正确认识AI技术与数字人文的关系以及对之如何加以利用成为一个亟需解决的问题。奥地利科学院中世纪研究所研究员约阿尼斯·普莱西尔-卡佩乐(JohannesPreiser-Kapeller)博士以《卷入全球史:处于史料分析与AI技术之间的历史和考古网络研究的潜力、陷阱与新进展》(EntanglingGlobalHistories:Potentials,PitfallsandNewDevelopmentsinHistoricalandArchaeologicalNetworkResearchbetweenSourceAnalysisandArtificialIntelligence)为主题,以网络分析(NetworkAnalysis)的概念将听众们引入他对AI技术使用的思考,开启了本系列线上讲座的数字知识盛宴。在以卡佩乐为代表的拜占庭学研究者看来,AI技术的引入对于拜占庭学不是冲击,反而可以让我们通过其数据处理能力和可视化能力对过去的世界有了更清晰的认知。他以总览全局的视角论述了在拜占庭学中使用AI技术进行数据分析的要点。许多拜占庭学学者已经借助AI技术建立了许多数据库,这些数据库包含群体传记学(prosopography)、地理信息系统(GIS)等等,涉及大量拜占庭学的数据分析。他尤其强调了深度学习型AI在数据分析中的应用。但是,AI方法的引入对历史研究可能并非全然没有问题。实际上,在卡佩乐看来,AI技术在历史学研究中的过度应用可能会造成人为的复杂性(Artificial Complexity),掩盖了其历史意义。他以“威尼斯时间机器”(VeniceTimeMachine)等案例,反思了以拜占庭学为代表的古史研究中大数据应用的可行性,同时强调历史学家应注意主体在AI应用中的重要地位。简而言之,AI在如今的拜占庭学研究中是现象级的研究工具,应受到每个历史学家的重视。
对可读取文本进行信息处理是AI技术在拜占庭学传统的文本研究中最直接的应用。比利时根特大学文学研究部的克里斯托菲勒·德莫恩(KristoffelDemoen)教授的团队就是这类研究的代表。德莫恩教授是拜占庭文学研究的专家,他和博士生团队以《拜占庭书籍警句数据库:从中世纪手稿的边白到可搜索数字文本库的旁文本诗歌》(TheDatabaseofByzantineBookEpigrams:ParatextualPoemsfromtheMarginsofMedievalManuscriptstoaSearchableCorpus)为题,系统阐释并以实例来验证了团队使用AI技术助力数据库建设与拜占庭学研究。德莫恩教授从书籍警句的定义出发,认为这类文本的产生是与文本的赞助人、作者、读者、抄工、画工等等人员相关,因此,书籍警句有着重要的社会史、文化史、艺术史等层面的意义。德莫恩教授详细讲解了数据库的发展历程,从2009年开始,书籍警句数据库经历了收集数据、整理数据、发布数据库版本、现状、和未来发展规划等阶段。然后,他同两位博士生详细解读了其数据库的原则、现状和挑战。他还介绍了目前学术团队的组成,尤其强调了计算机技术人员的重要性,给予听众很强的参考意义。在讲座的第二部分,他指导的两位博士生详细介绍了自己目前所进行的研究。首先是对于拜占庭书籍警句的模式化表达的研究(FormulaicExpressionsinByzantineBookEpigrams),该研究从拜占庭希腊语的表达方式出发,应用数据提取、N元语法(N-Grams)以及手动的探索和注解等方法进行研究。这种研究运用AI对语言进行分析,给拜占庭学传统的文本研究与分析路径注入了新的活力。另一个个案研究则是从语义学出发,对数据库中的语言模型和语言检索进行分析,最终建立了研究的语言模型。
AI技术的发展不仅可以将拜占庭流传下来的诸多文本进行分析、研究,AI的可视化能力可以让我们更直观地体会拜占庭帝国的历史文化。基督教既是拜占庭帝国的官方信仰,也是帝国借以处理与周边关系的重要手段。在拜占庭帝国的影响下,其周边的族群几乎都是基督教世界的成员,并采用了东正教的礼仪,而且许多地区都有自己的圣徒,这让拜占庭的宗教文化拥有了更广阔的地理空间意义。君士坦丁堡的《教会庆典圣徒礼仪要书》(Synaxarion ofConstantinople)中充满了以圣徒礼仪为核心的地理元素,成为研究这一问题的核心文本材料。德国美因茨莱布尼茨考古中心的斯蒂芬·阿布莱希特(StefanAlbrecht)博士在《君士坦丁堡<教会庆典圣徒礼仪要书>的数字化》(TheDigitizationoftheSynaxary ofConstantinople)中对这类礼仪书文本及其数字化进行了阐释。他首先对该类文本予以定义,并强调项目依托的是博兰德学派神父希波吕特·德勒哈耶(HippolyteDelehaye)整理的版本,是一部10世纪的礼仪书籍,记录了充分的社会史信息,在地理知识层面记录了多达1315个地名。之后,他从“文学地理”(LiteraryGeography)的角度出发,通过地理、网络和链接的角度展示了对这个文本的电子化与可视化情况,并详细介绍了数据库建设的目前状况和数据的分类与结构。阿布莱希特博士的数字人文方法为我们思考传统上内容重复的礼仪文学提供了新视角。
拜占庭帝国的地理空间不仅存在于礼仪文本的历史记忆中,更实实在在地体现在地理信息系统的研究中。奥地利科学院中世纪研究所的米海洛·波波维奇(MihailoPopović)博士在《虚拟世界中的拜占庭帝国历史地理:过去、现在和将来的方法》(TheHistoricalGeographyofByzantiuminaVirtualWorld:Past,ContemporaryandFutureMethods)中就从这一角度带给我们深刻的思考。
波波维奇博士是奥地利科学院项目《拜占庭帝国地理图册》(TabulaImperiiByzantini)的子项目负责人。他首先阐释了奥地利的历史地理研究传统,并定义了拜占庭学中地理空间的核心地区,即东地中海、小亚细亚和巴尔干半岛。他随后对地理信息的重要材料进行了介绍。他认为主要有四种材料,分别是拜占庭时期的书写材料,这包括宪章、历史写作、铭文等等内容。然后是考古发现、地名学以及现今地貌的物理状况。然后,他详细列举了对这些材料的实际应用与应用的困难,如地名学需要语言学知识背景,考古信息与地貌分析需要注意各种自然与人文方式的破坏等。在讲座的下半部分,波波维奇博士详细讲述了自己在数字人文研究的心路历程,让我们更加深入地了解了拜占庭历史地理的数字人文化发展与一位数字人文学者的成长路程。此外,作为历史地理研究者,他特别强调了实地考察的重要意义,以及文献资料与免费的地理数据的不可靠。他还强调了大数据研究在古代史中应用的危险性,并反思了网络分析研究中出现的种种问题。最后,波波维奇博士的讲座以对数据库的建设和数字人文发展的思考作为结尾。波波维奇博士的讲座极大的调动了听众们的思考,给我国以拜占庭学为主的数字人文建设以丰富的经验、思考与启迪。
东北师范大学世界古典文明史研究所国际拜占庭学研讨班(由科隆大学拜占庭与现代希腊研究中心与挪威科技大学古典学系协办)自2017年创办以来,已成为中国拜占庭学研究对外交流与国际合作的重要平台。本次以数字人文为主题的研讨班不仅激发了与会学者的浓厚兴趣,也为世界古典文明史研究所的数字人文研究指明了方向。然而,正如卡佩乐所提醒的,数字人文方法在古代史研究中的应用需要保持审慎态度。他指出,大数据和人工智能虽然为拜占庭学提供了全新的研究视角,但数据的完善度与韧性仍是关键问题。缺乏批判性应用可能导致“盲人摸象”,无法全面理解历史。在当前数字人文领域的发展中,虽然AI技术的应用受到高度关注,但数字化与数据库建设本身的重要性不容忽视。从相关讲座系列中可以看出,学界的进展并不仅局限于AI技术的探索,还涵盖了理论反思、数据库的建设实践,以及基于数据库的AI工具开发。AI技术的潜力不仅体现在为专业学者提供复杂数据分析的支持,更在于通过智慧数据平台的普及,使普通用户也能轻松访问与利用历史数据。然而,这也凸显了一个现实问题:历史研究与AI技术之间仍存在距离。弥合这一差距,需要进一步加强数据基础设施建设,确保数据的系统性、标准化与开放性,为AI应用提供坚实的基础,并在学术与公众领域实现更广泛的价值转换,从而为这一学科的数字化发展奠定更加稳固的基石。卡佩乐以“大数据还是大障碍”(BigData-BigBiases)为引,深刻启发了听众对方法论与数据偏差的反思。这些讨论不仅揭示了AI在历史研究中的潜力与局限,也为拜占庭学未来的数字化转型提供了宝贵经验。我们期待这一学术盛会继续发挥桥梁作用,推动拜占庭学研究迈向新的高度,同时鼓励学者在拥抱数字技术的同时,保持严谨的批判思维,以更全面地探索拜占庭文明的深邃历史。