虽然在外界的印象多为词典和翻译,但他透露,3月30日下午在深圳新闻网站的技术开放日,该企业意外开发了语音助手,产品将于今年5月发布。
在这次以ai为主题的开放日中,介绍了神经网络翻译技术、ocr技术以及有道智云的相关进展和处理方案。 有道的ai翻译处理方案分为基于视觉交互和语音交互的处理方案两大类,语音助手隐藏在语音处理方案中。
有道词典产品技术负责人林会杰告诉雷锋网,他之所以做语音助手,是因为在采用有道翻译官这个产品时,发现有顾客把它当做翻译工具,而是可以理解自己表达的助手。 有道翻译官APP能识别语音并实时翻译。
例如,面对翻译工具,你说一句话让他做所有的翻译,但面对助手,他说你想翻译xxxx这个词,只有一部分复印件被翻译。
据有道的工作人员介绍,和其他同类产品一样,有道的语音助手也有智能答疑、生活查询、智能翻译、日常闲谈、多语言理解、自然语言指令控制等功能。 但是在现场演示中,有道的语音助手还不是成型的产品,只是展示了简单的交互界面。
林会杰表示,今年5月将公布有关语音助手的详细信息,硬件也将上市。 他也向雷锋网确认了这个硬件将成为扬声器。
新闻网站制作声音扬声器并不奇怪。 和阿里、腾讯一样,新闻网站的音乐和新闻网站的信息不可缺少复制。 此外,在今年2月、3月,新闻网站的音乐分别与腾讯音乐、阿里音乐签订版权,相互转让许可,合作更加丰富。 但是,用合适的方法进行是出乎意料的,至少与外界对此的印象不一致。
除语音助手外,新闻网也公布了在神经网络翻译、ocr技术、有道智云方面的进展。
有道翻译于2008年上线,年升级为神经互联网模式,同年升级为有道智云,翻译技术和处理方案向外输出。 有道的神经网络翻译在过去一段时间内的第一进展有以下几点
语言支持:目前已支持10多种语言翻译。 最近越南语上线,泰语、印度尼西亚语等次要语言也上线。
服务性能:使用cpu+gpu程序为7.5亿在线用户提供服务,单次请求平均翻译时间为40毫秒,系统稳定性达到99.95%。
离线能力:随着手机性能的提高,离线版的神经翻译系统也同时开发了。 主要采用cpu处理方案,单语言模型文件小于100m,翻译质量接近在线翻译,目前支持中英日韩法西葡7种语言。
海外推广:除了中文翻译外,有道还在海外扩展,为海外开发者提供以英语为中心的翻译能力,包括英语与印地语、法语、西班牙语的互译等。
有道智云还整合了ocr技术,在照片翻译这样的应用中非常重要。 目前,其ocr技术已识别出72亿张以上的图像,支持17种语言,支持离线识别,其中在线识别需要650ms才能达到99%的要求,而离线模型在20m以内,平均1.2秒就能识别出结果
它还优化了拷贝的方向、立场和文档结果,使其无需指定语言即可识别,并支持多语言混合识别。 未来,合适的ocr技术将支持官方识别,优化为选择题、填写空题、数学推理等教学场景,并与平板电脑进行比较,提供智能评分、错题整理等服务。
将上述两种技术结合在一起,准备了基于视觉交互和语音交互的两种翻译处理方案。 视觉交互的首要方案如下
拍照翻译。 也就是说,输入照片后,识别照片的复印件并得出翻译结果
拍照翻译后,如果将原照片中的文字无缝地替换为翻译副本,则看起来和原照片一样。
r翻译:也就是说,用照相机拍摄目标,视频的副本实时翻译。 它涉及识别、翻译、跟踪、背景分割等多种技术,表明完全可以进行离线ar翻译。
语音翻译可以实时识别和翻译,特别优化为中文英语。
一位员工告诉雷锋网,目前已经有1000多名员工,而且是新闻网内部ai能力强的团队,其ai业务要点还是以翻译为基础,逐渐扩大在教育行业的应用和处理方案。
标题:“出人意料!网易有道将推出语音助手及智能音箱”
地址://www.manthraah.com/lyxw/21370.html