科学研究
 

非物质文化遗产视频知识元组织模型研究


要:

【目的/意义】视频是知识传播的载体之一, 是非物质文化遗产 (以下简称非遗) 资源的重要组成部分。对非遗视频知识基因和组织关系的研究, 有利于构建非遗视频知识网络, 能有效促进非遗的保护、传承与发展。【方法/过程】文章首先对非遗视频知识元概念做出界定, 并通过来源渠道和利用价值分析, 指出了非遗视频知识元的提取原则;然后, 以资源描述框架、著录标准和资源链接为侧重点, 提出了对非遗视频知识元进行系统、规范的元数据描述方法;最后, 以外部逻辑关联和内部语义关联为路径, 构建了非遗视频知识元组织模型。【结果/结论】经实践, 该组织模型有助于非遗视频资源的知识组织和可视化呈现, 能解决非遗视频资源个性化推送中的诸多问题。

关键词:

非物质文化遗产; 非遗视频知识元; 知识组织; 元数据; 语义标注;

 

1 引言

新时代为了满足人们日益提升的精神文化需求, 十九大报告中就明确指出“文化是一个国家、一个民族的灵魂”, “没有文化的繁荣兴盛, 就没有中华民族的伟大复兴”[1]。这不仅对我国文化建设指明了发展和保护的方向, 也提供了相应的法律依据和政策保障。非遗作为我国传统文化的重要组成部分, 不仅体现了国家和民族的文化精髓, 同时也是提升国家文化软实力的重要阵地。文化部在《“十三五”时期文化发展改革规划》中就指出, 要进一步完善非物质文化遗产保护制度, 以人的培养为核心, 以融入现代生活为导向, 切实加强能力建设, 提高保护传承水平, 推动非物质文化遗产保护事业深入发展[2]。

非遗是一种文化, 更是一种具备文化属性的知识, 在其保护、传承与发展过程中主要涉及知识信息的采集, 整理, 组织, 传递以及传播。目前, 表述非遗知识内容的载体主要有文本、图片、音频、视音频 (简称视频) 、动画和游戏等。其中, 视频方式因为具备视听双向、多维度真实客观的表现时空概念, 采录方便且拥有良好的纪实和艺术表现效果等独特优势, 被广泛地运用于非遗的知识采集、数据库建设以及内容传播。经过不断努力与发展, 各种非遗视频资源和作品如“雨后春笋”般不断涌现, 各级文化部门也分别建立了相应的非遗视频数据库。但是目前非遗视频知识资源的建设还只停留在非遗影片的单向播放和资源采集、整理和存储的初级模式中, 还不具备构建一种具有丰富关系的非遗视频知识网络以满足各类用户根据其需要进行文化认知、文化建构与文化体验。为解决以上问题就需要对非遗视频知识展开知识组织模式的研究与实践。本文在提出非遗视频知识元概念的基础上, 结合非遗视频的各种来源, 进一步指出了非遗视频知识元提取和非遗视频知识元细节描述方法, 以及应处理好非遗知识中概念层次划分和语义关系标注的问题, 以期为有效促进解决非遗视频资源的知识网络构建和可视化呈现提供一定的参考思路。

2 非遗视频知识元

非遗视频知识元是从知识元这一专属概念中引申出来的一个概念名词, 是对知识元概念在知识领域和承载方式上的进一步限定, 是对知识元应用的继承和发展。

2.1非遗视频知识元概念

知识元概念起源于图书馆学和情报学的相关研究, 最早由美国学者弗拉基米尔·斯拉麦卡在20世纪70年代提出, 其被界定为深入到文献中的数据、公式、事实与结论等自由单元[3]。国内较早开始关注知识元并展开研究与应用的是温有奎教授, 其指出知识元是知识结构的基本元素, 通过不同的排列组合可形成各异的知识单元[4]。随着时代的发展, 越来越多的学者开始对知识元及应用展开探讨和研究, 焦点主要集中在概念的明确、知识的关联、知识的聚合和知识网络的应用等方面。比较有代表性的有:文庭孝等从计量学的角度指出知识元是文献中相对独立的表征知识点的一个元素, 其可以为一段文字、一幅图标、一个公式、一段动画、一个程序等[5]。姜永常基于文献中的知识节点和文献间的隐性关联概念, 提出了一种基于知识元本体语义链接的知识网络流程, 并通过文献单元和Web信息进行知识元的认知抽取、知识本体的结构建立和语义互联知识网络构建[6]。知识元作为知识组织体系中的基本单元和最小构成元素, 并具有通过链接产生知识增值的独特属性, 其不仅被应用于图书情报、信息计量等学科领域, 还被广泛应用于课程教学、资源库构建、知识聚合、知识服务以及知识可视化等其他领域。

非遗视频知识元是知识元在非物质文化遗产知识体系中的应用与发展, 其秉承了知识元的相应特质, 但是将研究对象和内容限定在非遗的知识领域, 并以视频作为其唯一的承载形式。通过与知识元相比较, 可以将非遗视频知识元的概念界定为:非遗视频知识元是通过视频这种媒介形式对一个非遗知识单元进行完整的描述, 并能准确表达其内涵与外延, 是对非遗知识内容动态视觉呈现的最小单位。

2.2非遗视频知识元性质

非遗视频知识元具有一些专属性质, 主要表现在以下几点。首先, 在内容上非遗视频知识元是表述非遗属类的知识, 应具备非遗知识的逻辑结构。按照世界经济合作与发展组织 (OECD) 对于知识的划分, 知识可分为:知道是什么 (Know-what, 事实知识) , 知道为什么 (Know-why, 原理知识) , 知道怎么做 (Know-how, 技能知识) , 知道谁有知识 (Know-who, 人员知识) [7]。与之对应, 非遗的知识可以分为基本信息、历史渊源和资料、时空特性、代表性活动、流程和步骤、使用器物和典型人物几个方面。也就是说, 非遗视频知识元可以是对一个非遗项目及历史的简短介绍、对非遗活动的某个环节展示或陈述, 可以是对某个物品及特殊步骤的演示, 可以是传承人对一个非遗知识点的演述, 亦可以是某个专家对特定内容做出的评述等。

其次, 非遗视频知识元以视频作为知识载体, 其在知识表述、叙事方式和技术应用上具有视频的独特属性。视频在知识表述中与文字、语言不同, 其在用影像和声音传达信息的过程中具有一定的方法、技巧和规律。视频常用表现手法主要有事件纪实、情境再现、解说讲解、步骤演示、内容演述和人物访谈。不同的形式可以侧重不同的知识表述, 比如事件纪实可以较好地表现代表性的活动, 情境再现可以较好地还原时空特性的东西和重现历史典型人物, 解说讲解可以讲述一些基本信息和历史渊源, 人物访谈可以评述代表人物、述说历史渊源或讲解某个过程等。叙事方式主要表现在其可由单个或多个镜头组成, 在镜头形式上可为主观性镜头、客观性镜头和空镜头等, 不同镜头的组接顺序可表现出不同的知识含义;技术应用主要涉及视频拍摄、视频剪辑以及视频编码。

最后, 非遗视频知识元在知识组织上具有一定的繁琐性。非遗分有十大门类, 每类下又有众多子项目, 除了线性知识外非遗还包含大量的非结构化知识, 表现在知识组织关系上需要更多考虑关于历史、地域、事件、人物、时间、传承脉络以及相关机构等因素的关联关系。这给知识组织在技术实现上和语义逻辑上带来了一定的难度。

2.3非遗视频知识元的运行流程

与知识元一样, 对非遗视频知识元的运行也需要经过提取、描述、组织和应用这几个环节。非遗视频知识元的初始形态是来源于众多途径的非遗影片、非遗视频片段以及非遗原始视频素材, 经由提取规则提取后变成具有一定规范性的非遗视频知识元集合, 然后经过多维度的描述可变成带有一定标注信息的非遗视频知识元单元, 最后经过组织环节中的外部关联和内部关联链接即可形成具有丰富关联信息的非遗视频知识元知识网络 (如图1所示) 。该知识网络可应用于非遗领域知识本体的构建、基于用户的非遗视频个性化推送等诸多领域。

 

1 非遗视频知识元的运行流程

 

1 四种来源渠道的非遗视频资源特性比较

3 非遗视频知识元提取

非遗视频知识元是能清晰表述非遗知识内容的最小视频单元, 其需要从数量庞大、种类繁多以及质量参差不齐的非遗视频资源中提取出来。在提取过程中, 分别要了解视频资源的来源渠道, 分析相应资源的质量、特性和知识侧重范围, 然后采用对应的提取原则进行提取。

3.1非遗视频知识元的来源渠道

非遗视频素材、非遗视频片段及非遗影片是非遗视频知识元的源头, 按制作和获取渠道可分为:权威媒体机构、非遗管理机构、非遗研究机构以及业余爱好者。这些视频素材在画面摄制、影音质量、非遗知识侧重范围、利用价值、获取途径等方面均各有特点。

权威媒体机构主要指各类省级以上电视台和音像出版社。随着国家对传统文化的重视以及大众文化消费理念的提升, 这类机构制作、出品和发行了大量制作精良且为观众喜闻乐见、并携带大量非遗基因的影视作品和纪录片, 比如《舌尖上的中国》、《寻找手艺》等。权威媒体制作的非遗影片因专业人员团队和设备的投入, 其在故事讲述、光影摄制、画面剪辑、视觉冲击以及解说张力上都具独特优势。但这类影片主要是向普通观众普及传统文化, 制作方主要关注于非遗的表象层面, 对内容深度和原生事件的挖掘原因, 较为欠缺;另外, 由于版权不易获取原始高清素材, 只能网络下载。非遗管理机构主要指国家层面的文化部门和组织、各省市的非遗保护中心和地方上的文化馆和群艺馆等。此类视频资源大多用于非遗项目的申报、保护、保存以及数据库的建设, 在区域性、针对性和制作精度上存在参差不齐的水准。省级和以上单位一般更为注重省内唯一的、特色的以及面临濒危的国家级非遗项目保护, 保存以及挖掘, 其在制作规范、标准和要求上较为严格, 能完整、真实、系统地记录和反映特定项目的整体面貌。地方单位由于人员和技术原因, 在摄制规范和影像质量上或有所欠缺, 但是其能最真实、最原始的记录和保留最原生态的非遗影像资料, 甚至有些还是不能再现的历史孤本资源。非遗管理机构的视频资源是非遗视频知识元的主要来源之一, 但在知识系统性和学术研究深度上略显不足。非遗研究机构主要是指各类高校的研究院所或文化产业研究中心。这类机构在采集和制作中有较多的专业领域学者和专家的参与, 在资源刻画上更多聚焦于非遗的学术研究和价值研究以及数字化保护、保存和传播等方面。这类视频资源其学术性、研究性、知识组织性较强, 资源形式也较为全面, 也是主要来源之一。业余爱好者提供的非遗视频资源是指其在旅游或参与当地的非遗活动中通过手机或相机所拍摄下的视频资源。这类资源一般较为粗糙, 画面感较差, 但是能表现出较强的真实感、临场感和参与感, 可作为非遗视频知识元的补充。

1分别从视频质量、知识侧重、利用价值、获取途径等方面对以上四种来源渠道的非遗视频资源进行了比较。

3.2非遗视频知识元的提取原则

知识元的提取一般有机器提取和人工参与两种方式。非遗视频知识元与文本知识元在提取中最大的不同之处在于其处理的是视频资源, 而视频资源一般具有文件格式种类繁多、数据量大、具有影像和声音两个信息通道以及较强的艺术处理空间。所以在非遗视频知识元的提取中, 为了达到较为理想的效果, 一般只能采用人工提取。在提取中需要多方人员的协同参与, 领域知识专业人员把控内容和最小单位的度, 技术人员处理视频剪辑、特效和数据输出, 主要体现在视频素材选取、视频画面重组这两个方面。

(1) 非遗视频素材选取原则。

非遗视频知识元素材在选取过程中需要从素材稀缺程度和素材质量好坏两方面来把控, 在提取中应把握首选稀缺性素材, 在素材比较丰富的前提下再对影音质量高的素材进行调取的原则。

素材的稀缺程度主要表现在是否具有特定的历史价值或唯一性。具有活态性的非遗项目有一个传承与发展的过程。随着时间的流逝, 有些项目已经消亡或者重要的代表性传承人已经过世, 以前留存的视频素材或许就是历史的孤本。这样的例子有很多, 比如民间文学类中的故事大家刘德培先生已过世多年, 由于当时条件所限, 只有些许照片和现场访谈录音留存下来;传统舞蹈类中肉连响项目的国家级传承人吴修富先生也已离开两年, 其最具神韵的舞蹈表演也只有5年前的部分视频。历史孤本资源是当今无法再进行跟踪拍摄的资源, 从知识丰富程度和非遗项目完整性上说, 这类素材具有不可替代性, 具有很高的历史参考价值。在素材较为丰富的前提下, 视频质量好表现为画面清晰、分辨率高、拍摄角度丰富、镜头运用流畅、光线运用自然, 同时声音上录音清晰、完整且无噪音, 解说词配音情绪饱满, 富有表现力。

(2) 非遗视频画面重组原则。

非遗视频知识元在提取中还需要对画面进行分割和组接, 即重组的过程, 其中包括基于镜头的画面重组和基于声音的画面重组两种方式。

除了单镜头画面以外, 基于镜头的画面重组主要指多镜头重组。多镜头重组是一种以叙事为主线的剪辑方式, 是指通过多个不同镜头的组接来描述事件的发展过程。在非遗视频处理中常用的叙事结构有顺序式结构、倒叙式结构、平行式结构、隐喻式结构和对比式结构。对不同叙事结构的采用, 镜头的组接顺序和艺术表现效果会有较大的差异。画面重组的基本原则是:在保证知识单元完整的前提下, 以叙事为主线, 注重多角度、多景别的画面组接以能更好地增强画面的节奏和视觉表现力。

基于声音的画面重组主要指注重声音信息的完整性。在非遗视频资源中, 常见的声音信息主要有现场同期声和解说配音。在画面重组中不仅要注意保留现场同期声 (这里的同期声主要指现场同步的声音、环境声、说话声和效果声) , 更要注意对解说配音的截取, 以保证内容讲述的整体性和完整性。

4 非遗视频知识元描述规范

非遗视频知识元经过提取后已成为一个可以独立播放的视频实体, 为了方便后期资源的检索、查找和定位, 以及对非遗视频知识元进行相应的数据关联与组织, 需要对其进行规划化的数据描述。

常用的资源描述方式主要有多元组描述和元数据描述两种。多元组是指通过一个规范化的数据向量集合来对知识对象进行名称、特征、属性、内容、关系等维度的说明, 比如用一个7元组集合{名称、表示、法则、操作、导航、上属、相关}来描述一个文本知识元[8]。元数据描述是指通过一组描述信息资源或数据对象的数据, 以期从不同方面达到识别资源、组织资源、评价资源和追踪资源的目的[9]。元数据描述因其更符合知识表述逻辑和规范, 被大量应用于网络资源、图书资源、艺术品、视觉资源、地理空间数据以及政府信息定位服务等的信息标记和组织中。非遗视频知识元因其非遗知识的复杂性、视频载体的特殊性以及知识关联的丰富性, 故采用元数据方式更适合其资源形态的描述。

很多元数据标准集被应用在不同领域, 对非遗视频知识元元数据制定有一定借鉴和参考意义的主要有:DC元数据集、CDWA元数据集以及VRA元数据集。DC, 即都柏林核心集, 是为了网络资源的著录与挖掘为目的而开发的元数据标准[10]DC采用15个基本元素, 以强调内容通用性的方式来描述网络资源对象, 不足之处在于没有考虑具体标识内容的特色属性和其内在的知识关系[11]CDWA是针对艺术品的需求和管理而设计的一种元数据标准, 其以艺术品分类编目为依据, 从代表性属性、物理形态属性以及专门属性三个方面展开, 共计532个类目和子类目[12]VRA是由视觉资源学会资料标准委员会发布, 用于描述网络环境下艺术、建筑、古器物和照片等艺术类的可视化资源, 其主要由记录格式、方法、材质、地域、年代、主题、创作者、关系、版权构成等17项核心数据集来构成[13]。以上三种元数据集虽然研究领域不同, 但都能对领域对象进行科学划分, 能采用最精简的元素对资源进行全方位描述。

所以, 非遗视频知识元元数据标准在制定过程中要分析描述领域对象特征, 明确描述维度的具体内容, 提炼其中的核心元素, 制定严格的数据著录规范, 并以最精炼的形式来完成元数据的采录和关系的链接。

4.1非遗视频知识元元数据的描述框架

非遗视频知识元的描述范围可从以下五个方面来展开, 分别是:基本信息、非遗属性、视频属性、知识元属性以及可扩展属性。

基本信息是非遗视频知识元中的最基本的表现, 可从标识符、名称、创建时间、发布时间、发布机构这几方面来描述。标识符表示资源的实际存储地址, 具有资源的唯一指向性;名称指代资源的文件名, 可用于资源的指代和查询、检索;发布机构、发布时间、创建时间是对数据来源的描述。

 

 

2 非遗视频知识元元数据描述框架示意图

非遗属性是对非遗视频知识元内容覆盖角度的详细说明, 在范围上需涵盖一个项目的主要方面。《国家级非物质文化遗产代表作申报书指南》[14]中详细指明国家级非遗项目在申报过程中需要包含项目基本信息、历史渊源、传承现状、存在价值、人员信息以及项目展演特征。在实际资源描述中, 《指南》中所列范围可进一步拓展和明晰为项目属类、项目名称、认定级别、所属民族、地域空间、传承人、参与人、领域专家或学者、事件、相关物品、演述时间、演述地点、演述形式、历史渊源、传承现状以及主要价值这16个维度。

 

2 非遗视频知识元元数据著录项目详细列表

视频属性是从媒介角度来描述非遗视频知识元, 其需要包含设备、采集、制作和物理属性几个方面。根据视频的技术实现和实际运作, 非遗视频知识元的视频属性可细分为:使用设备、原始格式、采集人、采集单位、采集时间、拍摄对象、拍摄场景、拍摄内容、拍摄形式、视频时长、视频输出格式、视频数据量。

知识元属性是从知识说明、知识查找和知识链接的角度来描述非遗视频知识元, 其包含关键词、内容文字描述和知识关联三个方面。关键词主要用于资源的检索和查找, 数量上可以一个或者多个, 在标注方式上需要人工参与并添加。内容文字描述是用一段简练并符合一定语法规则的文字语言对非遗视频知识元做出陈述, 目的在于让用户明确资源反映的内容, 语法规则可按时间-地点-人物-事件模式来展开。知识关联主要用于非遗视频知识元按相关机构、相关对象以及相关地点等关系所进行的资源链接和聚合, 其可进一步展开为相关内容、相关类型和关联强度级别。相关内容是指与之可关联的对象;相关类型是指关联关系, 可展开为平行、上属、下属、上级、下级等;关联强度级别是对关联程度的划分, 可展开为强、中、弱三级。

为增强描述角度的可扩展性, 在每个维度中都加入了可扩展元素, 用户可根据实际情况和描述项目的差异自行添加。具体的各维度元数据描述框架如图2所示。

4.2非遗视频知识元元数据著录

非遗视频知识元元数据著录是对非遗视频知识元元数据录入内容和方式的进一步限定和规范。非遗视频知识元元数据描述框架主要从基本属性、非遗属性、视频属性和知识元属性给出了描述侧重点, 共提及41个描述角度, 但其中存在一定内容重复提及和表述过于繁琐的问题。为了实现对非遗视频知识元元数据的著录规范化, 就要进行描述元素的提炼、描述角度的浓缩以及用概括性更强的名词术语进行表述。内容交叉问题主要表现在基本信息、项目非遗属性和视频属性中涉及的名称、对象、时间、地点上, 可将其进行归纳并统一表述;繁琐问题表现在项目类别描述、采集形式和视频参数说明等方面, 可将其归类浓缩为项目属类、采集和物理属性等形式;概括性问题主要表现在元素名称的提炼上。

经比较与权衡, 以及参考DCCDWAVRC等元数据标准, 本文确定了19个核心元素来描述元数据。其中, 选取{名称、标识符、日期、来源}4个节点来标注基本信息;选取{民族、传承人、领域专家、参与者、语种、项目属类、时空范围}7个节点来标注非遗属性;选取{形式、采集、物理属性、采集方式}4个节点来标注视频属性;选取{关键词、描述、相关资源}3个节点来标注知识元属性;{其他信息}来标注可扩展属性。具体的详细著录列表如表2所示。

4.3非遗视频知识元元数据的链接

元数据经过以上标准完成相应元素提取和著录后, 为了更好地进行资源的检索、查找、调用以及实现人际交互的功能, 还需要对元数据中元素进行链接和可视化表示。

在进行元素间关系链接时需要运用一定的计算机语言和语法规则对元数据进行语法描述。目前, 元数据描述的计算机语言主要有通用置标语言SGML、超文本标记语言HT-ML、可扩展标记语言XML、资源描述框架语言RDF以及面相本体的元数据描述语言OWL等[15]。其中, RDF是通过明确的结构化定义, 并使用资源、资源属性以及资源间的关系这个三元组, 以及利用XML语法规则为元数据的描述提供一个标准化的框架体系等诸多优点被广泛的运用于各种数据资源的元数据描述中。图3以民俗类国家级非遗项目“端午节-龙舟制作”为例, 利用RDF语言对元数据中诸元素的关系进行标注, 并以逻辑框图的形式进行可视化呈现。

 

 

3 非遗视频知识元元数据的链接和可视化呈现示意图 (部分)

如图3所示, 椭圆形节点表示资源对象和子对象, 箭头向量表示属性类型, 矩形节点表示某个具体的属性值。图中并没有全部展现元数据模型中的19个元素, 而是节选了部分主要的属性类型, 其分别是名称 (title) 、日期 (date) 、来源 (source) 、民族 (nationality) 、传承人 (creator) 、参与者 (contributor) 、项目属类 (type) 、物理特性 (physical characteristic) 、采集方式 (acquisition method) 、形式 (form) 、相关资源 (creator)

5 非遗视频知识元组织模型构建

非遗视频知识元经过元数据描述后已具备了一定的知识组织条件, 可通过相关维度的联系形成一定程度的知识关联。要想建立更为丰富的非遗项目以及项目之间的知识关系网络, 还需要进行非遗视频知识元的组织模式进行分析。

5.1非遗视频知识元组织模型设计

非遗视频知识元组织模型是以单个非遗视频知识元为基本元素, 以一个项目或多个同类项目为分析对象, 通过分析项目内部和项目之间的知识逻辑结构, 揭示众多非遗视频知识元间可能具有的关联关系和组织途径, 以实现形成一个庞大的非遗视频知识网络的目标。

非遗视频知识元在知识组织过程中可分为两条主线, 一条是通过属性描述建立的外部逻辑关联, 一条是通过非遗的概念层次和知识间丰富的语义关系而建立的内部语义关联。以这两条主线为线索的非遗视频知识元组织模型设计框架如图4所示。

 

 

4 非遗视频知识元组织模型设计图

在图中, 深灰色箭头指向表示外部逻辑关联建立的途径, 浅色箭头指向表示内容语义关联建立的途径。在外部逻辑关联关系的建立中, 非遗视频知识元库中的每个元素作为视频实体, 经过元数据描述后已携带了丰富的属性特征数据。利用相似的属性特征数据, 可以实现相同维度的非遗视频知识元聚集。比如通过传承人、拍摄对象、拍摄地域建立的对象关联关系, 通过制作人员、机构等信息建立的机构关联关系, 通过一个属类中不同项目的相关性所建立的属类关联关系等。在内部语义关联关系的建立中, 单个非遗视频知识元作为实例分别对应于某个非遗项目概念层次中的叶子节点, 继以形成一个详细的非遗知识图谱。然后, 通过对图谱中各视频节点的语义关系标注, 形成基于事件、人物、时间、地点和物品的内部语义关联模型。在两种关联方式中都引入了关联强度标记, 其可根据关系的强弱赋予不同等级的值, 目的是便于后期个性化推送中相似度的计算。通过外部关联和内部关联的关系建立, 非遗视频知识元就由一个组织零散的集合演变成了一个复杂的非遗视频知识元知识网络。

 

3 非遗视频知识元间的各种语义关系类型

需要说明的是, 基于元数据建立起来的外部逻辑关联关系为同属类的视频资源检索和调取提供了便捷, 但是其不能更好地反映非遗内容之间的内涵和实质。为了更为清楚地揭示非遗之间的各种关系, 我们更多的是分析内部语义关联关系, 而其中尤以概念层次的划分和语义关系的确立最为重要。

5.2概念层次描述模型

概念层次是对一个知识体系结构层次的反映, 是对知识的抽象性归纳与总结, 其一般采用最核心、最简洁、包络性较强的关键词和术语来阐述。对非遗视频知识的概念层次划分需要考虑到非遗内容的复杂性, 非遗项目的共通性以及非遗视频的写实性。复杂性表现在按非遗名录的分类, 其可分为民间文学、传统音乐、传统舞蹈、传统美术等十大类, 每类下又有众多的子项目, 并且不同项目都有其自身的特色;共通性表现在所有的非遗项目都离不开人员的参与, 都是围绕着相关事件来展开, 都具有时域和地域的特征并且都需要使用一定的器物等;写实性表现在非遗视频是对真实世界的客观记录, 内容可以丰富多样, 但是拍摄形式往往较为固定。所以对于非遗视频知识来说, 通过其共性分析可用最基本的核心概念 (如一级和二级目录) 来描述所有非遗项目中的概念层次, 而对项目的个性则体现在更多的概念细则划分中。

对于非遗视频知识中最高层次的核心概念划分, 本文参考了国际文献工作委员会 (CIDOC) 对文化遗产类资源提出的概念参考模型CRM (Conceptual Reference Model) 。在CI-DOC CRM中, 其将最基本的文化遗产类知识概念划分为事件、行动者、地点、时间跨度、物理实体和概念对象[16]。结合非遗视频资源的具象性和写实性, 本文采用“事件 (Event) ”、“时间 (Time) ”、“地点 (Place) ”、“人物 (People) ”、“物品 (Thing) ”这5个元素作为非遗视频知识的一级概念层次。对于二级概念的展开, 根据非遗知识的共通性, “事件”可以细分为内容事件、活动事件、仪式事件和竞技事件;“人物”可细分为代表性传承人、参与人、领域专家或学者、典型人物;“时间”可细分为时节时间和发生时间;“地点”可根据事件发生地和项目流传地细分为区域1、区域2;“物品”可细分为使用物品、服装和资料。

为了更好地说明以上划分的两级概念层次在具体非遗项目中的应用, 以民俗类国家级非遗项目端午节为例构建了概念层次描述模型, 并进行三级概念层次的展开 (如图5所示)

 

5 民俗类“端午节”项目三级概念层次描述模型图

5.3语义关系标注

语义关系标注的目的是将非遗视频知识元图谱中的各种概念与概念、概念与实例、实例与实例之间建立符合事物发展规律的语义链接。如果说概念层次描述框架是非遗视频知识元知识组织的基础, 那么语义关系标注将是实现非遗视频知识元知识网络构建和实现可视化的核心环节。

语义关系的标注首先需要明确语义关系的类型, 然后再以此为依据对相应的非遗视频知识元实例进行语义链接。非遗视频知识元的语义关系类型是对非遗内容之间关系的反映, 即描述概念层次中最基础的“事件”、“人物”、“地点”、“物品”和“时间”之间的相互关系, 并在描述中要处理好关系的对象、关系的方向以及关系的类型。一个具体的非遗项目的发生、发展往往围绕着事件的展开和离不开人员的参与, 所以围绕着事件和人物的语义关系是描述的中心。在关系类型确定上要分析一个维度与其他四个维度之间可能的关系, 比如在事件关系的确定上就要分析事件与事件、事件与人物、事件与地点、事件与物品、事件与时间的各种关系, 除此之外还需考虑对象之间的正向主动关系和反向的被动关系。另外需要注意的是, 在视频表现中经常会用到“人物访谈”的形式, 即人物对人物、事件、物品、地点进行评论和讲解。这是非遗视频知识元的语义关系类型中特有的一类关系。表3根据非遗项目的实际情况, 详细列出了以上5个对象之间的各种关系。在以上关系说明中并没有列出关于“时间”维度的语义关系类型, 其原因在于其他维度的关系描述中已经涉及与时间之间的关系, 另一个原因是基于时间的语义关系比较单一, 故不再重复列出。

有了详细的语义关系类型后, 下一步就是非遗视频知识元间进行语义标注以形成基于语义的知识链接。语义关系标注采用RDF三元组的形式来进行完成, 即一种“主语、谓语和宾语”的关系标注, 具体的标注过程可通过本体编辑工具Protégé来进行实现。围绕端午节这个活动展开的各种人物、事件、时间、地点和物品之间的部分语义关系如图6所示。

 

 

6“端午节”中诸内容间的各种语义关系 (部分)

6 结语

本文通过借鉴知识元的有关研究, 结合非遗视频的特点和用途提出了非遗视频知识元的概念, 并在此基础上通过分析非遗视频资源的来源指出了基于非遗视频素材选取、基于非遗视频画面重组的提取原则。为了更准确、便捷地对非遗视频知识元进行检索、查询和调用, 通过元数据描述维度的分析、元数据著录规范的确定以及元数据中各种关联关系的可视化呈现对非遗视频知识元进行了系统的描述;同时, 对于非遗视频知识元的组织模型进行了一定的尝试, 提出了基于元数据的外部逻辑关联方式和基于语义关系的内部语义关联方式。以上诸多的工作对于非遗视频资源的系统化组织来说, 提供了一定的参考思路和借鉴的经验。下一步的研究重点将集中于非遗视频知识领域本体的构建方法和细则研究, 以及采用合适的算法对非遗视频知识元间的相似程度进行科学度量, 以期实现非遗视频资源的聚合、泛在传播和基于用户的个性化推送的目标。

 

【字体: 】【收藏】 【打印】【关闭
 
 
 
 
联系我们
地址:湖北武汉珞喻路152号华中师范大学科学会堂南楼3楼
邮编:430079
邮箱:nrcc2006@163.com
电话:027-67867695