——《大数据百科术语辞典》总主编、
大数据战略重点实验室主任连玉明教授访谈录
编者按 :全球首套系统研究大数据百科术语的多语种智能化专业辞书《大数据百科术语辞典》(20 卷)2021 年 5月由科学出版社出版并在全球发行。为深入探寻《大数据百科术语辞典》的编纂过程、创新内容及其时代价值,记者对《大数据百科术语辞典》总主编、大数据战略重点实验室主任连玉明教授进行了专访。
记者:《大数据百科术语辞典》是全球首套系统研究大数据百科术语的多语种智能化专业辞书,能否请您介绍下它的研编背景?
连玉明:当今世界,信息技术创新日新月异,数字化、网络化、智能化深入发展,继农耕文明、工业文明之后人类迈入崭新的数字文明时代,文明跃迁的背后彰示着对数字文明规则的急切呼唤。贵阳作为全国首个国家大数据综合试验区核心区,首提“数典”概念,大力实施“数典工程”,研究编撰全球首部多语种大数据标准术语体系《数典》,旨在构建大数据标准术语体系,形成公共话语系统,在各行业、各领域架起沟通的桥梁,助力全球共同把握好数字化、网络化、智能化发展机遇,处理好大数据发展在法律、安全、政府治理等方面挑站。
作为科学知识的语言承载,术语是支撑构建科技与学术话语体系的基础性信息资源,它凝结着人类智慧的创造,映射出科学技术和人类文明进步的轨迹。《尔雅》19 篇中有 16篇解释名物词,是我国第一部百科名物词典;《梦溪笔谈》第一次给“石油”命名并一直沿用至今。延传至今的古代科技术语,体现着圣哲们对科技概念定名的深入思考,在文化传承、科技交流的历史长河中作出了不可磨灭的贡献。世界正经历百年未有之大变局,颠覆性技术层出不穷,新概念、新理论、新方法不断涌现。服务于前沿性基础研究、新的科学领域、新的科学体系,是新时代科技名词规范工作持续关注的重点。
《大数据百科术语辞典》是大数据战略重点实验室联合国内外数十家专业机构和数百位专家学者共同努力,以《数典》为基础,研究编纂的全球首套系统研究大数据百科术语的多语种智能化专业辞书。可以说,《大数据百科术语辞典》创造了三个“世界第一”,首次系统全面构建了统一规范、符合国际通用规则的大数据标准术语体系,并实现全部术语经过全国科学技术名词审定委员会的专业审读和权威审定;首次实现覆盖全球 21 种语言的大数据标准术语多语种对照,并全面对接“一带一路”国家语言服务;首次打造大数据多语种语音库并实现智能化有声点读。《大数据百科术语辞典》着眼全球大数据领域发展,构建以中国大数据术语为主体、多语言对照的规范概念体系,以期以数字规则引领时代创新,为全球数字文明新发展做出新贡献。记者:《大数据百科术语辞典》是世界前沿领域的重大创新,那么在研编过程中是如何保证其前瞻性、专业性和创新性的?
连玉明:正如您所说,《大数据百科术语辞典》是一项全球化、跨学科、专业性、开放型的大数据理论研究创新成果,其研究的是世界前沿领域,在全球来说都是首部,其研编难度可想而知。因此,在研编过程中,我们更加注重资源整合和机制创新,坚持以最专业的团队和最严格的标准对研究、审定、翻译、出版的全流程进行创作和把控,保证成果的前瞻性、专业性和创新性。
《大数据百科术语辞典》是大数据战略重点实验室联合国内外数十家专业机构和数百位专家学者共同努力的结果和集体智慧的结晶,其研编充分发挥了大数据战略重点实验室五大研究基地的平台优势和国内外数百位专家的专业优势。在词条选择方面,坚持专家选词和权威数据库相结合,聚焦科学引文索引(SCI)、社会科学引文索引(SSCI)、工程索引(EI)和科学技术会议录索引(ISTP)四大权威检索数据库,并结合中国知网知识发现网络平台中的大数据相关文献资料,构建《大数据百科术语辞典》基础语料库,同时以专家研究成果为参考,力求词目的准确性、科学性和实用性。在审定方面,全国科学技术名词审定委员会充分整合中科院及国内外相关领域的顶级专家资源,来自中科院各研究所、军事科学院、国家信息中心、联合国教科文组织国际工程知识中心、北京大学、清华大学、中国人民大学、浙江大学、中国政法大学、美国威斯康星大学、中国通信学会、中国信息通信研究院、中国标准化研究院等单位的国内外 60余名相关领域专家提交书面审稿意见,并召开 10 余次专题审稿会议。在翻译方面,由北京 2022 年冬奥会和冬残奥会唯一战略合作伙伴——中译语通科技股份有限公司组织翻译审校工作,从更专业、更准确、更规范性上保证翻译审校工作忠实原文、用词准确、拼写正确、语言通顺,确保译文术语与索引排序有标准、本土化特色词有依据、学术性独创词有考证,疑问疑难词表达更准确,政治把握无偏差。在出版方面,《大数据百科术语辞典》由科学出版社出版,本身就是权威性的体现。中国科技出版传媒集团是我国最大的综合性科技出版机构,也是国家三大出版传媒集团之一。作为中国科学院的出版机构,其出版专业化程度之高、质量把关之严、出版流程之科学均在出版界有口皆碑。在《大数据百科术语辞典》出版过程中,成功申报“十四五”国家重点出版规划项目,从专业性、准确性和规范性上保障辞典的高质量出版发行。
记者:作为全球首套系统研究大数据百科术语的多语种智能化专业辞书,《大数据百科术语辞典》具有什么特色和亮点?
连玉明:《大数据百科术语辞典》是国家大数据(贵州)综合试验区继《数典》后的又一创新实践,是中国大数据理论创新和标准创新走向世界的重要标志。具有百科式呈现、权威性审定、多语种对照、智能化体验四大特色。
百科式呈现体现在《大数据百科术语辞典》以全球语境和未来视角,系统性构建涵盖大数据基础、大数据战略、大数据技术、大数据经济、大数据金融、大数据治理、大数据标准、大数据安全、大数据法律等九个方面的体系架构,形成了统一规范、符合国际通用规则的多语种学术话语体系。
权威性审定体现在全国科学技术名词审定委员会充分整合中科院及国内外相关领域的顶级专家资源,组织专家组依据《全国科学技术名词审定委员会科学技术名词审定原则及方法》分专业分领域对《大数据百科术语辞典》术语进行专业审读和确认。
多语种对照体现在创新性提供汉语与阿拉伯语、英语、法语、德语、意大利语、日语、韩语、葡萄牙语、俄语、西班牙语、柬埔寨语、希伯来语、印尼语、马来语、蒙古语、波斯语、塞尔维亚语、泰语、土耳其语和乌尔都语等二十种语言文字的对照,致力于为世界各国提供便捷、准确、智能化的大数据术语知识,更大范围推动大数据标准术语体系跨语跨界传播。
智能化体验体现在开创性地融入知识图谱、有声点读、平台链接功能,实现智能化、平台化、体系化的阅读体验,并基于大数据百科术语研究开发“大数据多语种语言服务全球共享平台”,通过“数典云平台”“丝路数典通”“数典术语在线”“数典贵阳指数”“数典图书馆”多语种智能化平台,面向全球提供公益的、普惠的多语种大数据知识资源和数字化知识服务。
记者:《大数据百科术语辞典》出版之后,“数典工程”后续还有哪些具体行动?
连玉明:《大数据百科术语辞典》的研究和出版,是“数典工程”建设的重大阶段性成果。以此为基础,我们正在进行三大后续行动,以期推动“数典工程”成果国际传播和普及应用,为全球数字文明新发展作出新贡献。
一是构建以《数典》为主要内容的标准体系,抢占大数据规则制定权。我们将在《数典》《大数据百科术语辞典》基础上,持续深化研究,进一步转化形成《联合国官方语言大数据标准术语手册》,进一步推动大数据知识的语言相通和科技交流,在全球主要国家间架起一座互联互通的桥梁。
同时,在更大范围、更广泛领域内推动大数据术语国际传播和普及应用,用中国声音讲好中国故事。二是构建以“数典贵阳指数”为主导领域的指数体系,成为大数据发展风向标。以 “大数据蓝皮书”为载体持续研究、持续更新、持续发布包括全球数字竞争力指数、大数据发展指数、大数据安全指数、大数据法治指数、大数据金融风险防控指数、治理科技指数在内的六大指数群构成的“数典贵阳指数”,全面衡量与评估我国大数据发展的综合水平,进一步为我国提升国家竞争力以及参与世界治理打好基础。
三是构建以“大数据多语种语言服务全球共享平台”为核心支撑的平台体系,提升大数据国际影响力。以数典术语库、数典语音库、数典语料库为核心,持续建设“数典云平台”“丝路数典通”“数典术语在线”三大术语平台,以数典贵阳指数为数据支撑持续建设“数典贵阳指数”平台、以数典知识库为支撑持续建设“数典图书馆”,把大数据多语种语言服务全球共享平台打造成为开源开放动态数据库和世界通用语言的全球开放平台,为世界各国提供便捷、准确、智能化的大数据术语知识服务,更大范围推动“中国知识”国际传播和普及应用。
记者:《大数据百科术语辞典》架起了全球各行业、各领域的沟通桥梁,这将对数谷贵阳、中国乃至世界带来哪些积极影响?
连玉明:对贵阳而言,将进一步推动中国数谷的品牌化和国际化,助力中国数谷贵阳走向世界。全球化时代,术语正在成为科技竞争和争夺科技话语权的新高地。贵阳作为首个国家大数据综合试验区核心区,联合全国科学技术名词审定委员会在这一领域率先开展术语标准创新性研究和智能化推广,对于推动科学技术发展和科技领域规则制定具有不可替代的特殊价值,再一次抢占了大数据标准领域制高点。
同时,《大数据百科术语辞典》的研究出版也将大力促进贵州贵阳的高水平对外开放,助力“强省会”战略实施。
从国家层面来看,将助力中国抢占数字文明时代的国际话语权。语言是打开一国之门和未来之门的钥匙,语言互通是推动“中国知识”跨语传播,抢占大数据时代国际话语权的关键所在。《大数据百科术语辞典》构建以中国大数据术语为主体、多语言对照的规范概念体系,推动全球大数据术语的统一和规范,致力于为世界各国提供便捷、准确、智能化的大数据术语知识,更大范围推动大数据标准术语体系跨语跨界传播,是中国大数据理论创新和标准创新走向世界的重要标志。全国科学技术名词审定委员会推荐认为,《大数据百科术语辞典》的出版,极大地提升了中国在大数据领域的国际话语权和规则制定权,对引领中国乃至世界在大数据领域的高质量发展、促进大数据知识国际传播和交流合作具有重要意义。
从世界角度来看,将对“一带一路”建设和构建人类命运共同体具有积极促进作用。《大数据百科术语辞典》在全球首部多语种《数典》基础上进一步扩充其他语言版本,系统性提供汉语与阿拉伯语、英语、法语、德语、意大利语、日语、韩语、葡萄牙语、俄语、西班牙语、柬埔寨语、希伯来语、印尼语、马来语、蒙古语、波斯语、塞尔维亚语、泰语、土耳其语和乌尔都语共二十一种语言文字,以中外文对照的形式展现,覆盖汉藏语系、印欧语系、阿尔泰语系、南亚语系、亚非语系和南岛语系,语言使用范围覆盖全球六大洲,尤其为推动“一带一路”沿线国家普及和应用大数据,加快发展数字经济创造了有利条件。“一带一路”国际科学组织联盟推荐认为,《大数据百科术语辞典》为世界及“一带一路”沿线国家和地区了解“数字中国”提供了权威范本,体现了对人类共同命运的深切关怀。