西北师范大学:做好国际中文教育 推动中外人文交流
学校重视智能教学工具开发与利用,利用语音识别技术开发中文学习软件,帮助学生纠正发音。通过VR和AR技术创建沉浸式中文学习环境,快速提高学生使用中文的能力。利用大数据了解学生的学习进度和学习习惯,为学生提供个性化的学习资源。积极参与国际教育组织。学校加强与联合国教科文组织、世界银行等国际组织的合作与联系,推荐中国...
阿里开源视频自动化剪辑工具FunClip 支持中文语音识别
FunClip能够自动识别视频中的中文语音,并允许用户根据语音内容裁剪视频,大大提高了视频编辑的效率。项目地址:httpsgithub/alibaba-damo-academy/FunClip在线演示:httpsmodelscope/studios/iic/funasr_app_clipvideo/summaryFunClip的主要特点语音识别:使用阿里巴巴的FunASRParaformer-Large模型,确保...
中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽
returnlang,result.text这通过Whisper的gpu模式来进行推理,模型选择medium,硬件要求是最低6G显存,更多关于whisper的配置,请移步:闻其声而知雅意,M1Mac基于PyTorch(mps/cpu/cuda)的人工智能AI本地语音识别库Whisper(Python3.10),这里不再赘述。Whisper转写后效果:./Data\Keira\wavs\Keira_0.wav|Keira|ZH|光动...
【旧文重发】深度学习发展史:相信和看见
IlyaSutskever是Hinton的博士生,当他加入Google后(通过对Hinton公司收购),深度学习已经在图片识别,语音识别上取得了突破,下一个要攻克的目标是翻译。当时,GoogleBrain已经做了“知识图谱”方向的研究,即通过机器分析一系列英文语料(比如Wikipedia),神经网络可以建立一张庞大的知识图谱,在其中任何单词都会变成一个向量,...
「文化评析」一场双向奔赴的中文之旅
例如,中文语音识别、虚拟现实中文课堂、中文数字人主播等技术和产品让中文插上科技的翅膀,以更快的速度传播出去。同样,中文也为中国科技走出去搭建沟通桥梁,助力中国科技在国外落地生根和推广应用。中文和科技的有机结合和双向赋能,使中国的硬技术和软文化相得益彰。此外,在新技术、新媒体加持下,中文国际传播方式...
科大讯飞:产业报国,星火相传25年|刘庆峰|王仁华|语音识别|人工...
语音识别最终被科大讯飞做到了行业领先,声动炫铃、讯飞输入法、讯飞语点等典型产品应用让科大讯飞跃上新的台阶(www.e993.com)2024年10月17日。当深度学习技术的苗头冒出,嗅觉敏锐的科大讯飞立刻决定跟进,成为国内率先将深度学习技术应用在语音识别系统上的公司,占据先机。创业12年,科大讯飞不仅实现了当初的承诺“中文语音技术要由中国人做到世界最好...
CNVSRC 2023 中文连续视觉语音识别挑战赛正式发布
本次赛事以CN-CVS中文视觉语音识别数据库为基础数据,评估在录音室朗读(Reading)和网络演讲(Speech)两类场景下的LVCVSR系统的性能。比赛结果将在NCMMSC2023会议上宣布并颁奖。httpcnceleb/competition01数据集??CN-CVS:CN-CVS包含2557名说话人超过300小时的音视频数据,覆盖新闻播报...
微软确认Win11 22H2系统存在语音识别问题 主要影响中文、日文等
微软在文档中称,公司正在努力在未来更新中解决该问题。IT之家小伙伴可以通过在每次设备重启后执行以下操作来缓解此问题:关闭语音识别或其他受影响的输入类型有问题的应用。打开任务管理器,找到ctfrmon.exe进程,右键选择“结束任务”按钮。等待并确认ctfmon.exe的新进程已自动启动。
特斯拉OTA再迎重大更新,中文语音识别再进化,主动安全再升级...10...
一方面,特斯拉对导航与媒体语音指令进行了更新,中文语音识别更精准。车主可以在开始导航时通过语音指令选择目的地,在驾驶过程中也可以用语音指令控制导航系统的显示及规划。听歌时,也支持使用“随机播放”“单曲循环”“顺序播放”等更丰富的语音指令。此外,还新增了更多“加料不加价”的实用功能:新增“位置共享可视化”...
出门问问联合发布全球最大多领域中文语音识别数据集WenetSpeech
在10000+小时的高质量标注数据上,目前三个系统的语音识别率如下表所示(结果为MER%,中文算字错误,英文算词错误)。WenetSpeech2.0虽然WenetSpeech将开源中文语音识别训练数据规模提升到一个新的高度,然而希望进一步进行扩展和完善:1.从领域角度,现有数据集在口音、中英文混合、会议、远场、教育、电话...