首页 财经 > 正文

科大讯飞:科大讯飞在语音、图像、自然语言理解、机器认知推理能力、多语种多模态人机交互等方面的技术和产业化应用已具有业界领先水平


(资料图片仅供参考)

同花顺(300033)金融研究中心4月24日讯,有投资者向科大讯飞(002230)(002230)提问, 领导您好!目前市面上语音转文字功能的AI已经十分发达,可以做到自动去除语气词、自动总结等功能,相比公司的产品有很大的超越。公司如何看待AI在语音识别处理领域对公司的弯道超车?对后续的改进有何规划和预期?

公司回答表示,您好,智能语音属于人工智能的感知智能领域之一,也是人类、人机之间最便捷、最高效的交互方式,各大IT企业始终高度重视。由于深度学习技术的普及以及相关开源工具的推广,开发入门级系统相对容易,在云端联网的情况下,语音识别准确率的差别稍小。但是语音交互技术在实际环境使用中会遇到信道干扰、远场噪声、时间漂移等问题,这些影响真实场景语音交互效果的因素目前仍然是国际研究领域的难题。科大讯飞坚持顶天立地的研究思路,在处理这些实际问题的过程中,研究出了一系列的新方法以及创新性的解决方案,通过多模语音增强技术融合语音与视觉的多模感知,让高噪音场景下的语音交互跨过实用门槛,并在方言、复杂网络等情况下都具有显著的领先优势,讯飞智能语音技术经权威机构和客户评测,始终处于明显地领先水平。当前,科大讯飞在语音、图像、自然语言理解、机器认知推理能力、多语种多模态人机交互等方面的技术和产业化应用已具有业界领先水平,人工智能空间广阔,我们欢迎各界企业共同推动人工智能产业发展。

点击进入互动平台 查看更多回复信息

标签:

精彩推送