设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 业界资讯 开源资讯 Firefox 查看内容

Mozilla通用语音更新 将帮助训练基于语音的网页浏览

2020-7-4 11:52| 发布者: joejoe0332| 查看: 2054| 评论: 0|原作者: cnbeta.com|来自: cnbeta.com

摘要: Mozilla今天发布了Common Voice的最新版本,该版本是其转录语音数据的开源集合,供初创公司、研究人员和爱好者构建语音功能的应用、服务和设备。Common Voice现在包含54种不同语言的超过7226小时的总贡献语音数据, ...

Mozilla今天发布了Common Voice的最新版本,该版本是其转录语音数据的开源集合,供初创公司、研究人员和爱好者构建语音功能的应用、服务和设备。Common Voice现在包含54种不同语言的超过7226小时的总贡献语音数据,比2019年2月18种语言的1400小时有所增加。

Common Voice不仅包括语音片段,还包括对训练语音引擎有用的自愿贡献的元数据,如发言者的年龄、性别和口音。它被设计为与DeepSpeech集成,DeepSpeech是一套开源的语音到文本、文本到语音引擎,以及由Mozilla的机器学习小组维护的训练模型。

收集Common Voice中超过550万个片段需要大量的工作,不过,到目前为止,在7226个小时中,有5591个小时被该项目贡献者确认为有效。而根据Mozilla的数据,Common Voice中的五种语言--英语、德语、法语、意大利语和西班牙语现在已经有超过5000名独特的使用者,而七种语言英语、德语、法语、卡比勒语、加泰罗尼亚语、西班牙语和基尼亚卢旺达语则有超过500小时的记录。

今天还发布了Mozilla有史以来第一个数据集目标段,旨在为特定目的和用例收集语音数据。这个细分市场包括数字 "0 "到 "9",以及 "是"、"不是"、"嘿 "和 "火狐 "等词语,共有1.1万人在18种语言中说了120个小时。

Common Voice刷新之后,DeepSpeech进行了重大更新,纳入了迄今为止最快的开源语音识别模型之一。最新版本增加了对TensorFlow Lite的支持,TensorFlow Lite是谷歌TensorFlow机器学习框架的发行版,针对计算受限的移动和嵌入式设备进行了优化,并将DeepSpeech的内存消耗减少了22倍,同时将其启动速度提升了500多倍。

Common Voice和DeepSpeech都为Mozilla项目工作提供了参考,比如Firefox Voice,这是一个为Firefox增加语音识别支持的浏览器扩展。目前,Firefox Voice可以理解 "天气如何 "和 "查找Gmail标签 "等命令,但目标是促进仅使用语音与网站进行 "有意义的互动"。

QQ图片20200703222701.png


酷毙

雷人

鲜花

鸡蛋

漂亮
  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部