蒙古英雄史诗的数字化建档实践 发布日期:2016-12-07   作者:巴莫曲布嫫 朝戈金 毕传龙 李刚   点击数:1246  
[摘要]为进一步推进民俗学、民间文学、少数民族文学和相关平行学科与专业的学术讨论、对话交流和成果传播,中国社会科学院民族文学研究所“中国史诗学”课题组从2012年开始启动“蒙古族英雄史诗大系数字化建档项目”,一则以电子书(eEdition)的方式呈现该大系所汇集的196种史诗文本;二则在“中国社会科学院中国少数民族文化与语言文字研究中心”的资料学建设框架中集成史诗文本数据集,读者可按传承圈、演述人、主题、人物、情节、结构和采集地、采集时间,以及参与其间的中外史诗学者等多重维度进行浏览或检索;而其他一些可扩展的维度也将继续得以深拓,以利在不久的将来推进史诗研究及其专门学。
[关键词]:英雄史诗;史诗文本;描述性数据集;数字化建档;史诗圈;口头遗产
 
“蒙古史诗传统”通常指由不同类型的韵文体英雄歌构合而成的叙事传统。其演述形式往往篇制宏长、内涵丰富,并因流布地域广阔,在语体和谱型上呈现多种样态;其故事范型、传承模式、演述技艺、文本接受、功能意义诸方面,也都不拘一格。作为人类口头表达文化的范例,蒙古史诗传统的赓续为我们在数字化时代的中国史诗学学科建设提供了广阔的学术空间。
 
蒙古史诗传统及其文本厚集成
 
蒙古人主要以口头形式保存和传承其史诗叙事传统,也能见到一些抄本和刻本。目前所见到的最早的刻本,是1716年的北京蒙古文木刻本《十方圣主格斯尔可汗传》[1];也有人述及书面文本对史诗的口头演述产生影响的例子。
以今天的情形而言,蒙古史诗演述在地域分布上并不均衡。与在藏族和蒙古族中广泛传唱的大型史诗《格萨(斯)尔》相比较,蒙古史诗《江格尔》更呈现出“部族史诗”的诸多特征,例如它产生于卫拉特蒙古人当中,长期以来主要在卫拉特蒙古人中流传,其语言也具有鲜明的卫拉特方言特点等等。一些学者认为,蒙古史诗传统是在几个主要的“中心”或“区域”流传的,在这些史诗传承的中心区域之外,并不能经常见到史诗演述。
一般而言,蒙古史诗在长度上变化较大。一名史诗演述者大脑中的“传统曲目库”或曰“库存”可能有成千上万诗行,由此生成的史诗故事的异文和变体数量之多常常令人叹为观止。有时,某一史诗的一个文本就可能长达数千诗行。不过,学界倾向于认为,那些篇幅相对短小的史诗,倒是可能属于某个传承久远的叙事传统。
大型的蒙古史诗,例如《格斯尔》或者《江格尔》,就是包含许多诗章的故事。这些诗章(蒙语为bölög)则具有几重属性:每个诗章都是一首完整的诗体故事:有开头、中间和结尾;一个诗章可能集中讲述某个或某几个英雄的伟大功业或英勇事迹;这些诗章常遵循数量有限的故事范型之一(如战争,婚礼,歃血结拜等),或者按照有数的几种方式来组合这些范型。从另一个层面说,每个诗章自身又都是不完整的,它依赖其他诗章所形成的信息来发展故事,描摹人物。也就是说,某个单个的诗章,又与其他诗章一道构成更为宏大的叙事框架。即便某个演述者在特定的场合,并没有演述那些诗章。[2]所有这些互相依赖,共同构成完整故事的传统部件,可能早就以这样那样的方式,长期在社区民众中传承,成为围绕故事讲述建立起来的口头知识库或称“故事公共池”。对特定诗章的理解,需以对其他诗章的熟悉为前提。于是,这张由不同诗章织就成的更为庞大的网,就包蕴着所有那些唱出来的和没有唱出来的故事。这种情况有时被称作“套叠史诗”,又称“诗系”(the cycle)。
说到蒙古史诗的作诗法,朝戈金总结了几个主要特征:每个诗行的音节数量上并不固定,但在韵律上却运用比较复杂的规则,包括首韵、行间韵、尾韵;相邻诗行间也有以韵律相呼应的平行结构(譬如:但凡有口之人,不敢对他说长道短;但凡有舌之物,不敢将他妄自谈论;众人之上的雄鹰,臂力惊人的萨布尔)。构成其核心的是程式化片语,包括固定性名词短语的使用(譬如:德高望重的首领江格尔,巨大的红色英雄洪古尔,残暴的哈日萨纳拉)、装饰性描述的使用(譬如:分享喜悦用了六十天,尽情宴饮用了七十天,聚首欢庆用了八十天),以及叙事中其他形式性因素的运用。[3]
当地人还保有这样的信仰,认为史诗吟诵具有驱魔、禳灾的功效,就此意义而言,蒙古史诗演述就不仅仅被当做娱乐活动,而被赋予特定的意涵——史诗的吟诵,是信仰的传递,是人伦的确证,是佛法的弘扬,等等。于是,一旦歌手的吟唱在空中回响,周围总会聚集起人群。那些艺术造诣高超的歌手,不仅是调动听众情绪的大师,也常常是乐器演奏的行家。而伴奏的乐器又因地域区隔而有所不同。在蒙古东部,史诗格萨尔的演述者被称为“胡尔齐”,由于他们用一种叫做“潮尔”(chor)或“胡尔”(huur)的弦乐器为自己伴奏;而在蒙古西部,史诗江格尔的演述者被称作“江格尔齐”,在演奏时用托布舒尔琴(两弦弹拨乐器)伴奏。
在长期传承中,史诗演述技巧的掌握有几种情况:一种是师徒相授,有比较固定的传承谱系,坚守比较固定的演述风格,这中间出现一些以演述史诗为生的专业歌手;另一种情况是比较随意和松散的学习,师法多人,学习的动机主要是为了娱乐,不为谋生。他们大多是业余歌手,在其演述生涯中,以才艺自娱娱人。
蒙古史诗传统迄今大体是活态传统,就出现了新老故事此消彼长的情况,也就很难统计蒙古史诗的确切数量,更不用说还要考虑到这种异文的数量。粗略地讲,迄今为止,除去《江格尔》《格萨尔》和《汗哈冉贵》三大套叠史诗,篇幅相对短小的史诗,还有数百种之多。较短的几百诗行构成一个完整故事,长些的动辄数千诗行。
那么,如何面对如此丰富而复杂的史诗文本流存?尤其是以学者的一己之力能否做到竭泽而渔?当然,在数字时代的今天,我们原本难以企及的文本厚集成(thick corpus)已经给我们的学术研究带来了更多的可能。这就要求我们立足于当今的数字技术手段和研究成果,从传统、演述、文本、诗部、诗系等基本维度去探查一个民族的叙事传统及其文化表达的内在理路。
 
蒙古英雄史诗大系数字化建档:项目中的项目
 
中国社会科学院中国少数民族文化与语言文字研究中心自2010年启动国家社会科学基金重大委托项目“中国少数民族语言与文化研究”以来,一系列数字化建档子项目在其资料学建设计划的框架下得以陆续实施,涉及诸多少数民族的口头传统和书写传统,并且在口头传统专家、元数据标准专家和数据库专家之间的合作下取得了一定的实绩。
 
 
(图1  课题成果的网页示意)
 
 
作为上述项目的一个子课题,“蒙古英雄史诗大系数字化建档”(the DDP4CMHE)直接依赖中国社会科学院民族文学研究所的蒙古史诗学者对海量史诗文本的整理与编辑成果,这就是煌煌四卷的《蒙古英雄史诗大系》[4]。该集成涵盖了绝大部分现今发现的蒙古中短篇史诗的文本。第一卷收入史诗83部,第二卷收入50部,第三卷收入43部史诗,第四卷收入20部,总共辑录了196首中短篇蒙古史诗文本,计25万诗行。其中,118部采录自中国蒙古族民众当中,并按照录音严格誊写;67部是蒙古国境内的史诗,其余为俄罗斯境内搜集的蒙古史诗。
《蒙古英雄史诗大系》(以下或称《大系》)中的许多文本在我国属首次刊布,含一批学术大师如兰司铁(芬兰)、弗拉基米尔佐夫(俄罗斯)、海希西(德国)等亲自记录的文本,弥足珍贵。同时,该大系也为蒙古史诗传统研究奠定了坚实的资料学基础;此外,收录其间的文本还反映了20世纪蒙古史诗记录的三个历史阶段,亦具有重要的学术史研究价值。[5]该资料系列按照史诗的地域和方言分布、结构和故事范型类群、异文和互文关系等几个原则分类编排,体现了中国蒙古史诗研究的理念。
该《大系》为在中国、蒙古共和国、俄罗斯联邦以及其他国家和地区发现的中短篇蒙古英雄史诗文本的数字化建档工作打下了良好基础。为进一步推进民俗学、民间文学、少数民族文学和相关平行学科与专业的学术讨论、对话交流和成果传播,中国社会科学院民族文学研究所“中国史诗学”课题组在中研网的技术支持下,从2012年开始着手“蒙古族英雄史诗大系数字化建档项目”;自2014年6月起,该项目的阶段性成果内容可以在以下网站查看:http://mongolianepics.ddp.zhongyan.org.cn/index.php.
在项目建设的过程中,我们取得了如下共识:史诗文本数量较大,又共享许多结构规律和诗法特征,这就为史诗文本的数字化和数据库化提供了良好的基础条件;利用特定的学理性思考——如史诗构成要素和组合规律的总结,就可以形成数字化的“厚集成”文本库,就为解析史诗文本,进而在大范围内比较不同文本提供了可能性。
“蒙古英雄史诗大系数字化建档”作为资料学课题的阶段性工作虽已告一段落,但是后续的数据挖掘和音影图文资源集成还亟待展开。因此,应当说“蒙古英雄史诗大系数字化建档”刚刚起步,远未结束。使基于口头传统研究的元数据标准与史诗文本描述性资源数据集在内容管理和信息应用之间交相适应,也是“蒙古英雄史诗大系数字化建档”课题的初衷之一。当然,该数据库的深拓发展还将依托“口头传统研究专题数据库建设”(民族文学研究所所级项目)和“口头传统专业元数据标准的研制”(中国社会科学院院级项目)这两个基础性工程的并行推进和继续深化。前者的工作目标主要包括对口头传统资料进行数字化保存、数据化归集和网络化发布,利用信息技术对既有资料存量进行系统管理和整合,通过持续积累和分类整理,为科研提供较为完整详尽、可持续利用的少数民族口头传统研究专题数据库;后者则按计划分步研制“口传档案库”的通用元数据(自定义部分)和专业元数据标准及相应的数据著录规则。换言之,根据学科特定要求定制专业元数据标准与著录规则。民族文学研究所通过近五年的探索,正在形成的专业元数据标准包括:(1)音声(音频);(2)影像(视频);(3)图像(图片);(4)文本(书面);(5)口头文类;(6)传承人调查;(7)田野访谈;(8)民俗实物;(9)文化空间,与描述性资源数据集的标准研发结合起来,统称之为“IEL口传档案库9+1元数据集成方案”。
因此,对于“中国少数民族口头传统图文音影档案库”的长期建设来说,任何数据集的建设来说都是“项目中的项目”,我们还需要考量更可靠的数据环境及其更稳定的支持平台。
 
描述性资源数据集的构架及其多重分析维度
 
由都柏林核心资源集合描述工作组提出的基于资源集合层级描述的应用纲要,对资源集合和资源集合层级描述做出了概括[6],尤其是在发现、定位、选择资源集合和资源集合之间的比较过程中,资源集合描述(collection description)的这些功能有助于引导我们去探究专业资源数据集使用对象的学术诉求,以期力图与相关参数保持一致。但是,在课题的执行过程中,我们也希望在资源描述结构(resource description framework)、资源集合描述和专业元数据集描述(disciplinarymetadata set-level description)之间找到适用于项目本身的多向通路。
在中国社会科学院数据中心的支持下,课题组将196篇蒙古史诗文本统一做了数字化处理,使各卷、各篇既能以电子书的阅读方式加以呈现,也能准确响应其他查询或检索的即时调用。此后,数字化建档工作的重心就是力求将史诗文本整合为由该项目组所创建的、具有多重维度的描述性资源数据集。通过课题网站的导航,读者或研究人员可按传承圈、演述人、专题(主题、人物、情节、结构)、采集地、采集时间,以及参与其间的中外史诗学者和田野工作者等维度进行浏览或检索。需要说明的是,上述对史诗文本数据段的“要素”提取,主要依据我所老学者仁钦道尔吉关于蒙古史诗的理论框架和术语体系[7]。这种选择的适用性、合理性和有效性还有待于在使用中进一步加以验证。
 
1.  史诗圈
在对蒙古史诗传统进行长期调查和研究后,仁钦道尔吉教授将蒙古英雄史诗在现代的传播划分为三个中心圈,即巴尔虎─喀尔喀史诗圈、卫拉特史诗圈和布里亚特史诗圈。这一归纳得到国内外不少史诗学者的认可。虽然目前我们手中的史诗文本是采集自不同的传承圈,时空跨度都很大,但仍可以看出,它们具有形态特征上可以识别的诸多特点,尤其是在传承模式、社会功能、文化意义、本土方言活力、环境─地理分布和经济文化社区等方面,享有一些共通的特点。
2.  史诗演述者
该大系中记录在册的史诗演述者共90位。他们中有男有女,有老有少,有识文断字者亦有目不识丁者,向我们展示了一幅根植于活态演述传统中的史诗代际间传承的生动图景。根据众多田野调查报告所述,史诗演述者们被蒙古民众分别称为图兀里奇(Tuulichi)、胡尔奇(Hurchi)、江格尔齐或格斯尔齐。在蒙古英雄史诗大系数据库中,读者可以根据每一篇史诗文本检索到其演述者,也可以反过来根据演述者检索到他所演述的史诗文本。与以往过于看重文本不同,晚近的史诗研究,有时将演述人也纳入考量和分析,尤其是对某些杰出歌手的个人才艺和传统曲目库的关注,对他们“个人风格”的关注,都体现了民间文艺学范式转换中形成的某些新学术生长点。
3.  史诗结构
对于蒙古史诗结构构造单元的分析,到目前为止,最有影响力的论述是来自海西希教授。海西希教授从蒙古史诗中归纳出“十四个母题系列”[8],其中心工作是提炼出搭建蒙古史诗传统的构造单元,进而根据母题排列规律,呈现出蒙古史诗的故事范型和叙事策略。布林贝赫、宝音和西格进而运用该理论框架,对数十个蒙古史诗进行了归并和解析,验证了该理论的有效性。[9]与海西希教授的理论有异曲同工之妙的,是仁钦道尔吉教授关于蒙古史诗“情节结构”的总结。在他看来,蒙古史诗的情节结构分为单一型、串连复合型和并列复合型三种基本类型。这三种类型既是一个从简单到复杂的构造方式的发展和演进,也历时地反映了蒙古史诗演化脉络。[10]这套结构性单元可以视作一个有机体系,对建立内容管理方面的元数据集极具方法论意义的启发。在与《大系》所体现的方法论意涵相一致的前提下,课题组将仁钦道尔吉教授创设的这套核心概念化工具运用于以下几个层面:(1)主题;(2)人物;(3)情节类型;(4)故事结构。如下图所示。
 
 
(图2  以叙事传统为中心)
 
4.  文本制作过程
此处的“文本制作者”一词,指的是所有参与了“大系”中蒙古英雄史诗文本化过程的多元化行动者(multi-actors)。史诗大系卷帙浩繁,其诞生经历了漫长的过程,折射出了采录、收集、编纂,以及出版在不同时间地点得到的史诗文本的学术史(见图3),在这一历程中共有39位收集者和87名学者参与其间,尤其是收集者的身份呈现出多元化的特点。
 
(图3  以史诗生态为中心)
 
目前,中国社会科学院中国少数民族文化与语言文字研究中心在继续为史诗传统建立数字化档案。该中心工作组与蒙古、俄罗斯、芬兰、美国等国学者保持着长期合作关系,力图运用多样化的手段和新技术理念,将蒙古史诗数据库作为样本,建立基于理论分析的资料学成果,以满足学界的需要。
通过大规模的数据整合,史诗研究者可以发现新的路径去探讨一首史诗或一个宏大的史诗传统、抑或更为阔大的史诗演述的不同侧面。以我们的项目为例,许多史诗的特征都可藉由数据而被探测和积累下来。譬如说,可以通过以地域分组的数据来展开语言学特征的分析性研究,观察故事范型和所在地域的多种关联;或通过计算史诗演述者的年龄和分布密度来评价当下活态史诗演述在某个特定地点的存续状态。
一言以蔽之,数据集的采集和建立,为今后的多角度研究提供了巨大的可能性。当然,该数据库也有其局限性:例如由于数据库的核心理念是来自于个别研究者的理论框架,所以难免带有偏重于形式方面的色彩,而且与其他的理论学说的兼容度就比较差;而偏重形式结构的另一重局限,就是该数据集在对文学特质的描述和归纳方面,多有不足。
 
结语:朝向可持续发展
 
当亘古而又常新的史诗演述与现代科技相遇时,一扇崭新的窗口为我们打开了。现在,普通读者能够以前所未有的便利程度接触到以多媒体形式储存的语词艺术,比如音频和视频文件,从而以更直观的形式更好地理解这一文类。众所周知,许多民间演述都是以跨文类活动的面貌出现而慢慢成形的,结合了口头吟诵、群舞、仪式和其他方面的诸多元素。如今记录田野笔记,通常意味着要借助不同的设备,而不再是仅仅凭借一支笔一个笔记本了。作为语词艺术的史诗传统将会以新旧并存的形式不断延续和发展,在大数据时代证明人类的创造力之所在。
目前,我们面临的最大挑战就是如何与国际合作伙伴从技术层面和学科层面分享彼此在数据整合上的经验。既懂口头传统属性又掌握数据库技术的人才至关重要,而语言藩篱、技术兼容性、后续资金和人力资源等方面的困难也需要一一克服。早在1996年,海西希就曾指出:
研究的第一要务是建立深度合作以创造“蒙古史诗的母题目录”。达到这一目标的第一步是鼓励对单个的母题开展专题性研究。第二步与目录也有紧密关系,即采集、记录仍然流传在蒙古共和国与中国内蒙的史诗。虽然它们中有许多已不再由专业的史诗艺人传唱,而仅由年轻一代记诵并且根据自己听说的内容进行复诵,但绝不能让史诗未经采录就销声匿迹。为了替下一代保护这种口头的、半文学化的材料,也为了让专家学者能在国际平台上进行研究,第三步就必须在国际组织的引导下建立口头传统档案库。[11]
今天,在国际合作的语境中去回应几代史诗学人的梦想,从海西希对口头传统档案库的展望到约翰·弗里的“思维通道项目”,我们深知道路依然迢遥,任务依然艰巨,而我们只能勉力前行,不辱使命。我们也希望,口头传统研究界的同人和机构都能携手并进。现在,我们越来越倚重国际协作与学科间合作。没有多学科式的协同工作,关于史诗的综合数据库,或者更进一步说,关于口头传统的综合数据库及其可持续发展就永远无法实现。
通过该蒙古英雄史诗文本数据集的规模化集成,可以从哪些方面丰富或提升史诗的理论研究?数字化建档能从哪些维度支撑更精细化、更专业化的史诗研究?在国际合作的格局中,如何继续建设该数据集?在数字化建档过程中,如何整合专业力量,包括怎样实现史诗学者、标准专家、元数据专家及数据库专家的跨国、跨区域乃至跨学科的可行性协作?这些问题的破解,至少在当下,正是我们希望讨论的工作方向。
 
作者简介:巴莫曲布嫫,中国社会科学院民族文学研究所研究员、口头传统研究中心执行主任;朝戈金,中国社会科学院学部委员、民族文学研究所研究员;毕传龙,中国社会科学院民族文学研究所博士后流动站研究者;李刚,北京中研世纪科技有限公司(中研网)总工程师。
 
本文最初由长期负责数据库建设的巴莫曲布嫫执笔并以英文写作方式完成,中国社会科学院研究生院少数民族文学系博士候选人陈婷婷和中国社会科学院民族文学研究所博士后流动站的惠嘉博士对中文初译稿多有贡献,在此申谢。此外,为后期重新整理论文的中文表述,朝戈金重新阐发了项目的几个基本观点。特此说明。
 
原文刊于《民间文化论坛》2015年第6期。
 
 
 
注释:
[1] 文章审校过程中,得知旅居德国的学者胡日查巴特尔于2015年11月3日在爱沙尼亚塔尔图大学的国际学术研讨会上发表了题为“About the Oldest Written Version of the Mongolian Geser Khan Epic”的论文,称其找到了蒙古文《格斯尔》的最早写本。因未见该论文,所谓最古老抄本的论定,可暂时悬置。
[2] 朝戈金、约翰·弗里:《口头诗学五题:四大传统的比较研究》,刊于《东方文学研究集刊(1)》,长沙:湖南文艺出版社,2003年,第33—97页。
[3] 参见朝戈金在《口传史诗诗学:冉皮勒〈江格尔〉程式句法研究》一书中相关阐释,南宁:广西人民出版社,2000年,下编。
[4] 仁钦道尔吉、朝戈金、旦布尔加甫、斯钦巴图主编:《蒙古英雄史诗大系》(4卷本),北京:民族出版社,2007—2010年。
[5] 陈岗龙:《蒙古英雄史诗的集大成者——〈蒙古英雄史诗大系〉评介》,《民族文学研究》2009年第4期。
[6] http://dublincore.org/groups/collections/collection-application-profile/index.shtml
[7] 参见仁钦道尔吉:《蒙古英雄史诗发展史》,北京:中国社会科学出版社,2013年。
[8] 任钦:《蒙古史诗类型研究现状》,《蒙古学资料与情报》,1985年第1期。
[9] 布林贝赫、宝音和西格编:《蒙古英雄史诗选》,内蒙古:内蒙古人民出版社,1988年。
[10] 仁钦道尔吉早期的两篇论文奠定了其探查蒙古史诗叙事结构的基本框架:《关于蒙古史诗的类型研究》,《民族文学研究》,1985年第4期;《蒙古英雄史诗情节结构的发展》,《民族文学研究》,1989年第5期。
[11] Walter Heissig,“ The Present State of the Mongolian Epic and Some Topics for Future Research,”Oral Tradition, Volume 11,Issue 1 (March, 1996), p. 93.