为了便于民族交流,腾讯做了一款小程序,名字叫腾讯民汉翻译,目前已支持维语、藏语(卫藏藏、安多藏、康巴藏)与中文的互翻。
据了解,与其他翻译不一样的是,腾讯民汉翻译实现了“实时语音识别+标点断句+翻译+语音合成”的首创。它还加入了少数民族语言的OCR拍照翻译技术,也就是能翻译出照片里的文字。
产品负责人表示,2016年底,他们开始组建团队,虽然目前团队成员基本都是中科院、清华的博士。但做民族语言识别不同于英汉拥有大量语料资源,项目刚开始,困难就悄然而至。
最大的困难来自前期民族语言语料的获取,他们把录音点从北京换到了乌鲁木齐,还前往南疆,与尔族老乡们深入交流,采集语音。
完全不懂民族语言,是团队的另一大难题。团队买来了尔语教程,大伙一起从字母、语法、拼音结构开始学。
作为一款雪中送炭的产品,产品上线以来,虽未进行任何商业推广,但已经得到各大民汉语言学习社区的认可与应用,截至目前累计用户量7万,日活1.3万。