查看原文
其他

硬核技术小哥的语保故事

本宝班 语宝 2022-04-24


人物介绍


林佳庆,福建漳州人,清华大学计算机科学与技术系知识工程实验室软件工程师,中国语言资源保护工程采录展示平台(以下称语保工程采录展示平台)核心程序员。自2014年起,一直参与语保工程采录展示平台的系统开发工作,对语保工程采录展示平台的建设及数据分析有较深的理解。

林佳庆老师

Q

小林老师好!2015年,教育部、国家语委启动中国语言资源保护工程(以下称语保工程),并取得了许多重要成果。语保工程采录展示平台作为一个综合性的、科学研究和社会化应用相结合的信息化建设项目,其中的中国语言资源采录展示系统具有“采录”和“展示”的重要功能,但是如果考虑到不同的用户群体,语保工程采录展示系统又是如何来提供语言资源服务的?





中国语言资源采录展示系统按照用户群体划分,可以分为专业平台公众平台两个子系统。

专业平台旨在为语言学领域的专家学者提供数据分析、检索等专业服务。立足语言资源调查数据和专家型科研需求,开发语言资源数据存储、展示、检索和分析应用,例如多维度语言资源检索,多元异构数据融合展示和定制化方言地图绘制功能等。因此,专业平台的主要功能定位是“展示”

公众平台则是面向普通公众用户的语言资源站点,侧重平台的社会化推广以及和用户之间的交互,主要功能定位是“采录”。公众平台立足于“传播民族文化,见证语言魅力”的服务宗旨,开发更加趋于大众化同时具有趣味性的数据展示、数据采集和交互应用,例如 “音像图文四位一体”的复杂多媒体融合展示、激励制资源上传、和基于众包理念的转写标注应用等。





Q

语保工程采录展示平台作为一个与社会化应用相结合的信息化建设项目,注重实践应用。您可以介绍一下它都有哪些应用功能,可以让社会大众也参与到语言资源保护的工作中来吗?





我们做了很多有趣的社会化应用,比如“方言学堂”教学应用,根据词汇的文化分类,分组展示以词汇为核心的语言资源,实际上《抗击疫情湖北方言通(微信版)》的UI风格和模块设计就是从“方言学堂”继承而来的。基于微信公众号的“方言词典”功能也是一个有趣的应用,用户可以对公众号输入或说一个方言词,甚至指定地点,公众号会返回给用户符合条件的图文信息,包括文本、图片和语音。另外,作为“乡音”微信公众号举办主题活动的主要交互型应用“方言诗歌朗诵”和类似的非命题式交互应用,也具有相当的趣味性,吸引了社会大众的广泛参与。





Q

我们了解到,面对新冠肺炎疫情,您也参与了《抗击疫情湖北方言通(微信版)》的研发工作,您是在什么样的情况下参与进来的呢?在《抗击疫情湖北方言通(微信版)》上线之前,您都遇到过什么困难?又是如何解决的?





2月10日,湖北疫情十分严重,各地医疗团队火速驰援湖北,而湖北是个方言区,患者和援助湖北的外地医生存在一定的语言沟通障碍,语保中心王莉宁老师联系到我们,并邀请我们加入“战疫语言服务团”,一起做一个能切实解决医生和患者语言沟通障碍的一个系统。能有这样的机会贡献自己的一份力量,课题组欣然加入“战疫语言服务团”,我也有幸成为其中的一员。

实际上,经过“战疫语言服务团”多方共同努力和同步推进,加上我们团队长期以来在语保工程采录展示平台项目积累了非常多成熟的技术和软件开发的框架应用经验,我们在2月11号,仅用时1天就推出微信版第一版了,但毕竟时间紧迫,总会有这样那样的小问题,这都很正常,唯一的难题就是时间比较紧。不过想到我们快一秒推出系统,都有可能帮助医生快一秒了解患者的症状,时间紧那少睡一会就行了。





Q

作为一名软件工程师,您近些年主要参与了语言保护的工作,这种将软件设计与语言学相结合的工作对您来说有挑战性吗?作为语保工程采录展示平台的核心程序员,您在利用软件技术服务语言保护的工作中都有哪些收获和感想?





挑战性肯定是有的,比如绘制方言地图用到的多条件复杂检索接口效率问题就颇具挑战性。例如:检索同时满足:“‘舅’和‘旧’读音相同”“‘外甥’”和‘外孙’说法相同”的调查点,在庞大的数据里面检索,效率是不高的。当然,有挑战才有推动力,我们目前也正在朝更专业,更精确,更有效率的方向努力

《抗击疫情湖北方言通(微信版)》自2月12日正式上线以来,访问人数超过3万1千次,录音播放次数超过38万6千次,从这些数据看,能够利用自己所学的知识技能,切实帮到一线人员的工作,我觉得非常自豪。



滑动查看更多图片

语保工作让我结识了很多相关方面的专家学者,比如我的老乡张振兴教授,他们教会我很多以前没接触过的知识,他们做事情高度负责、不辞劳苦的敬业精神非常值得学习。





Q

在我们很多人看来,软件的程序设计是一个比较辛苦的职业,而您作为一名年轻的软件工程师,同时也是语保工程采录展示平台系统的核心开发工作者,您能和我们分享一下您的日常工作吗?对逐渐加入的年轻一代或是同龄的语保人,您有想要和大家分享的工作或学习心得吗?





我的日常工作主要就是语保相关软件系统的架构设计、功能实现和系统维护工作。当有新的数据或增补数据移交过来的时候,会优先处理数据,包括校验、清洗、反馈、入库、上线展示等。

我记得有一次参加语言资源会,一位调查点负责人讲到:“当我们第二年再去寻找那位发音人的时候,他已经去世了......”。我们拿到的每一条数据都弥足珍贵,我们语保人都应心怀敬畏之心,时刻保持高度负责的职业精神






题图来源:搜狗百科

延伸阅读

2020


田野中的“语保人”

语宝有约|乔全生:“晋”善“晋”美,打造精品工程语宝有约|汪国胜:湖北人的湖北方言情缘语保人的“技术咖”访清华大学计算机科学与技术系张鹏老师

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存