关键词:“一带一路”;走出去;语言服务基础设施;框架设计;
中国“一带一路”走出去由企业走出去、文化走出去、学术走出去三部分构成。随着走出去步伐的不断加快,中国企业因与投资地在语言、文化上的巨大差异而形成的语言风险迅速增大,并由此对投资绩效产生显著的负面影响。在文化与学术层面,至年间,进入国际传播领域、直接或间接译自汉语的中国主题图书总量为种,涵盖11个学科门类,涉及52个语种,但中外语言和文化差异却构成影响对外传播效果的“接受屏幕”(中国翻译研究院,:6-9)。无论是企业还是文化、学术层面的走出去,克服语言风险、提高语言服务能力都离不开公共部门的支持。语言服务基础设施直接服务于“走出去”企业和文化、学术成果的译者,且使用成本近乎为零,是公共部门营造“外部性”(externalities)的最佳节点。在“互联网+”时代,自然语言处理、大数据挖掘、云计算、移动和社交平台的有效整合为公共部门的语言服务基础设施建设创造了有利条件。语言服务基础设施在经济发展水平较高、语言多元化特征显著的欧洲、北美得到了较为广泛的应用,相关经验值得我国有关部门研究、借鉴。
1.语言服务基础设施的定义与特征
麦格劳-希尔公司《经济百科全书》(年版)将基础设施定义为能对社会产出水平或生产效率带来直接或间接提升作用的经济项目,包括交通运输、电力、通讯、金融、教育和卫生设施,以及组织有序的*府和*治体制。奥地利经济学家罗森斯坦-罗丹将某一经济体的社会总资本划分为“社会分摊资本”(socialoverheadcapital)和“私人资本”(privatecapital)两大类,前者即指基础设施。基础设施建设虽属间接生产性活动,但却是主权国家社会经济发展的前提和重要保障(MBA智库百科,-11-2)。语言服务基础设施是近年基于语言信息处理技术和互联网技术的发展,以*府机构、行业协会、高校为代表的公共部门向社会各界公开发布的具有“公共品”性质的开放性语言资产,包括语言使用标准、语言服务规范、语言工具、语言资料(案例库、语料库、翻译记忆库、术语库、术语知识库等)、语言人才信息等。语言服务基础设施的建设目的是通过创建产生“溢出效应”的外部性,确保用户能够以极低成本甚至无成本的方式获得各类高品质语言资产,而语言服务基础设施的服务对象则是全社会具有现实语言服务需求的人士或机构,包括译者、外语学习者、语言服务需求方、语言服务企业、语言技术开发商、高等院校和研究机构等。语言服务基础设施有如下特征:(1)语言服务基础设施具有跨领域、跨学科、多语种的特点,集语言知识、专业领域知识、知识管理、知识呈现等功能于一体,提供大量高质量、标准化语言信息,满足用户语言学习或专业领域知识学习的需要。例如,术语知识库是术语学与知识工程学相结合的产物,目的是克服传统数据库仅能描述语言知识的窠臼,努力表征特定专业领域术语的语言和语言外知识,通过把概念组织为复杂的关系网络,厘清术语间的概念逻辑,将知识描述、知识融合、知识发现、知识可视化融为一体。在越来越多的中国文化、科技产品走出去的时代背景下,术语知识库的建设与应用可以显著提升汉译外的质量和文化传播效果。(2)语言服务基础设施具有可扩展性。自然语言处理和信息技术的快速进步使大规模语言服务基础设施建设成为可能,并在保证较低运营成本的同时,确保其可扩展性。指导企业语言资产建设的“四化”和“四性”原则同样适用于语言服务基础设施建设。加拿大Termium术语知识库是目前世界上最大的术语管理系统之一。按照学科组织分类,Termium已收入超过万条英、法、西班牙、葡萄牙语术语,内容包含该术语在其他语言中的对等翻译、来源、定义、上下文使用语境、搭配信息等,每年更新超过5万条。另外,年投入在线服务的TermiumPlus还提供法语动词变位、英语写作风格指南等17种辅助写作工具。此类语言服务基础设施均提供在线服务,服务内容可持续动态升级,具有很强的人机交互优势。(3)公共部门是语言服务基础设施建设的主体,这是其开放性、公益性的保证。首先,语言服务基础设施具有建设和维护/升级成本高昂、投资收益期长、社会效益显著的特点,但直接经济效益低下,私营企业缺少投资意愿与能力。其次,语言服务基础设施涵盖由技术写作→本地化翻译→信息同期发布等三大节点构成的内容全球化的整个流程,只有具有强大且持续投资和建设能力的公共部门才有可能获取并有效处理如此海量、庞杂且专业的数据内容。再者,使用语言服务基础设施能够明显降低用户的学习曲线,增强其市场竞争力,而这也正是公共部门建设的初衷。国内具有独立研发能力的企业都将其作为核心语言资产对外严加保密。如果国家主管部门能够研发并公布语言服务基础设施的建设成果,则对“走出去”企业,尤其是广大中小企业意义重大。(4)语言服务基础设施事关国家重大经济与安全利益,属国家基础性核心战略资产。为了更好地掌控外语资源,从年开始,现代语言协会(MLA)受美国*府的委托定期开展外语资源调查,建立“美国语言资源数据库”(亦称美国语言地图)。通过该系统,美国有关部门可及时掌握“每个地区、州、城市、镇甚至邮*区使用某种语言的人数”,以及美国高校外语专业招生信息,某语种在各大院校开设情况,该语言在各州的分布情况等(文秋芳等,a:8)。美国*队更是拥有一个跨*种语言备战系统,并将其作为“国防战备报告系统的一个部分”。通过该系统,美*可以快速搜寻所需各类外语人才,尤其是非通用语人才(文秋芳等,b:2)。正是语言资源数据库的匮乏,造成我国对外语资源的掌控能力远远落后于美国。此类语言服务基础设施可以发挥外语人才“蓄水池”的功效,保证国家信息安全,在当前国际反恐斗争日趋复杂严峻的新形势下具有良好的社会价值。2.国外语言服务基础设施建设现状
根据服务内容和用户使用特性,可以将目前发达国家的语言服务基础设施归纳为以下五类:
2.1开放性通用语料库
开放性通用语料库提供特定语言的语法、词汇、句式、固定用法和语料(含口语语料),目的是在确立纯正而独特的文化特质的基础上规范语言的使用。英语国家目前有代表性的开放性通用语料库有英国国家语料库、美国国家语料库、当代美国英语语料库等,其中当代美国英语语料库由4.5亿词的文本构成,是当今最大的免费英语语料库,而美国国家语料库则最早提出打造“开放性语言基础设施”的理念(Ide等,:)。作为“欧洲开放性语言基础设施”的重要组成部分,包含北欧及波罗的海国家8个语种(1)的META-NORD语料库则是跨国家多语种语料库的典范,其目的就是通过收集、处理、升级北欧及波罗的海国家的语言资源,确保语言数据能够以统一的标准实时交换,并建立非商业化的语料共享平台(Vasiljevsetal.,)。
2.2专业数据库、术语库和术语知识库
高品质的数据库、术语库和术语知识库是确保信息准确和语言规范使用的有效手段。加拿大渥太华大学IngridMeyer等人于年提出术语知识库的理念,用于对“各类领域术语知识进行组织、描述和管理,是一种计算机可读资源”(宋培彦等,:)。目前世界上最重要的术语知识库包括加拿大Termium术语管理系统、西班牙格拉纳达大学的EcoLexicon、德国科隆应用科技大学的网络术语库WebTerm、欧洲“公共语言资源与技术基础设施”(CLARIN)、俄罗斯“计算机信息系统技术术语”(AISNT)等。术语知识库的独特优势是帮助用户迅速创建或更新特定领域的专业知识,同时掌握知识结构与知识关联,实现知识谱系化、结构化、可视化,大幅度提高知识学习和使用的效率。值得注意的是,近年国际知识管理的一个发展趋势是把重要术语库逐步升级为术语知识库(2),通过建设开源平台,实现术语内容的动态更新和在线服务。
2.3语言使用标准与语言服务规范
不同专业领域的语言使用标准和语言服务规范是全球语言服务公认的难点和重点,因其富于规则和变化,成为制约中小型跨国公司和语言服务企业全球化经营的技术“瓶颈”。作为全球最大的生物医学图书馆,美国国家医学图书馆(NLM)联合全美多家医学网络图书馆,共建提供在线医学语言知识服务的“统一医学语言系统”(UnifiedMedicalLanguageSystem,UMLS)。UMLS汇集众多健康、生物医学、药物术语和术语使用标准,用户可使用该系统来支持产品开发,撰写产品说明书和技术文本翻译等工作。另外,UMLS还提供种特定健康问题与疾病的技术文本示例,以此规范包括症状、病因、治疗方法、预防措施等内容的文字表述。
2.4开放式翻译服务平台
全球年营业额最高的语言服务企业莱博智(Lionbridge)基于“软件即服务”(SaaS)的理念,研发了翻译服务平台TranslationWorkspace。TranslationWorkspace将实时动态语言资产与翻译技术相结合,把翻译记忆库和术语库存储在云端服务器中,用户通过浏览器或轻客户端程序即可访问。利用该系统,客户企业、译者、翻译公司等可以访问动态更新的语言资产,同时在线管理翻译项目,大幅降低翻译管理系统和基础架构的建设投入(崔启亮,:67)。TranslationWorkspace虽然由私营企业开发,但也给公共部门开发此类系统提供了启示:(1)系统应基于云平台,内容管理系统(CMS)应涵盖产品全球化的整个流程;(2)语言资产应动态更新,相关管理人员能够借助自动化流程和语言资产存储技术对语言资产进行复用和维护(ibid.)。
2.5语言服务企业和语言服务人才数据库
语言服务需求方与供给方的“信息非对称性”在语言服务业表现尤其明显。始建于年的ProZ.