大模型时代的ASR就是不一样!豆包听力水平现场评测,直接拿捏!
ContextSFT,不止关乎语音对话中的背景信息理解,对于语音识别中的模糊信息,比如口音、发音不清、同音异义词、生僻词等理解也有很大意义。为此,团队引入了上下文感知训练以及联合波束搜索方法来增强相关能力。首先团队使用自研的语言模型来生成语音转录有关的上下文,并构建了“上下文,语音,文本”三种元素的数据集,将其与...
深度学习在口语评测与语法改错中如何应用?先声智能NLP专家讲解
先声智能是一家垂直于K12教育领域的AI技术服务商,运用语音识别、自然语言处理等核心算法,自主研发口语测评、写作批改、自适应学习、智能对话以及情感识别等技术解决方案,可以覆盖学校、家庭等不同场景。作为英特尔AI100创新激励计划第一期优秀企业代表,先声智能此前在语音识别系统方面与英特尔技术团队进行了深入的开发合作...
这项语音识别技术曾被美国垄断 如今中科院核心技术占据半壁江山
现在,我们拿起智能手机、开启语音输入法、对着麦克风说一段话,手机就会立刻显示出你说的话;想不起一首歌的歌名,只要能记住其中一小段旋律,打开一些音乐软件,就可以通过哼唱的方式,搜索到自己想要的歌曲。像这样的语音检索、语音识别,其实只是语言声学中很小的一部分。中国科学院语言声学与内容理解重点实验室,是我...
让人机交互更富有自然情感,标贝科技推出TTS评测系统
凭借逾15年在语音合成领域的分析研究及工作经验,标贝科技为用户的语音产品做系统评测,分析出合成语音不自然的原因:可能是音库质量不佳、数据加工的问题、前端模块或者后期算法的问题,通过专业的测评让用户快速了解自身系统关键问题所在及可提升空间。除了语音合成,标贝科技的识别项目团队,则主要提供语音采集、语音转写、...
中国移动发布5G新通话:AI智能语音黑科技大亮相
科大讯飞的技术负责人介绍,针对5G新通话口语化场景优化,采取了三大措施:一是人机协同标注常用口语数据,并补充口语双语训练;二是系统性运用了无监督/弱监督训练方法,基于大量口语化表达的源、目标语言单语数据,采用自训练、回译算法等强化翻译模型和语言模型,对口语化表达特性实现增强训练;三是针对语音识别后处理阶段,设...
AI阅卷“翻车” 其实是“翻”在了自然语言处理
设计自动评测指标的方法有多种,通常会根据不同的评判类型去选择适合的方法(www.e993.com)2024年10月18日。“比如阅卷系统若要进行翻译题的自动评判,可以让老师事先写好多个参考译文答案,然后把学生的答案和参考答案进行类比,计算它们的相似度作为学生答案好坏的评测指标。”熊德意举例说,机器翻译常用的评测指标BLEU,就是基于参考译文和机器译文...
左手技术,右手创新,思必驰苦练内功赋能行业
2、新认可——通过多项技术测评2021思必驰也收获了认可与肯定。思必驰团队的“鲁棒语音信号模式分析与识别的深度结构化建模理论与方法”,荣获2020年度第十届吴文俊人工智能科学技术奖“人工智能自然科学奖一等奖”。同时,思必驰通过CMMI-DEVV2.0ML5级评估,获得国际标准认可。
微软推出智能英语私教——小英
微软鼓励极客创新精神,鼓励思考、质疑与碰撞,鼓励跨领域、跨小组合作,让极客们可以不惧失败地大胆尝试,创造出最贴近用户需求的智能服务和产品。这样的环境成就了微软小英,小英背后集结了微软亚洲研究院多个研究小组在各自研究领域的多年积累,比如自然语言理解、计算机视觉、语音识别等方面的技术突破。
借力中高考改革,讯飞E听说要用AI+英语听说测评撬动百万考生?
刘舒告诉鲸媒体,对于传统的英语听力、口语练习,学生往往是靠刷题巩固,没有科学的学习方法,老师没有固定的评测标准,无法对每个学生的学情进行诊断、提供建议。讯飞E听说运用了人工智能、语音识别的技术和手段,对学生进行听说能力测评,针对能力维度改进学习,老师根据测评结果进行针对性教学,为学生和老师增效减负。刘...
10小时训练数据打造多语种语音识别新高度
导语|在刚刚结束的NISTOPENASR评测中,TEGAI语音联合清华大学,刷新世界小语种语音识别比赛6项第一。从2000年开始,NIST组织的RT(英文语音识别),LRE(语音语种识别),SRE(语音说话人识别),OPENKWS(语音关键词识别)等比赛一直是语音届的标杆竞赛,其组织比赛方向也可以看出目前学术和工业界的语音研究发展方向。长期以来,...