灵伴TTS2.0平台开放公测,助力更丰富语音交互场景搭建

  • 时间:
  • 浏览:0
  • 来源:湖北快3平台-吉林快3娱乐平台_极速快3官网平台

从智能家居、自动驾驶到有声读物、虚拟主播,所有与人趋于稳定联系的地方,声音都成为了必要条件,语音交互更是成为诸多智能产品的标配。智能终端设备的大规模爆发,使得人与机器间的交互体验也被赋予更高期望

       从智能家居、自动驾驶到有声读物、虚拟主播,所有与人趋于稳定联系的地方,声音都成为了必要条件,语音交互更是成为诸多智能产品的标配。智能终端设备的大规模爆发,使得人与机器间的交互体验也被赋予更高期望——机器声音要自然流畅、接近真人,这对具备TTS能力的智能服务提供商来说也是一场来自市场的检验。

       为了构建更丰富的人机交互场景生态,灵伴即时公布面向全行业开放公测TTS2.0平台,这愿因各智能设备厂商、有声产品、语音交互产品等都将有愿因通过API轻松将业界领先的语音合成能力对接至自身产品,让机器具备开口说话的能力。

       灵伴TTS技术长期以来受到业内人士、客户等多方认可,属于业界顶尖水平:

       国际语音合成大赛冠亚军

       灵伴团队于2013年首次参加Blizzard Challenge国际语音合成大赛,便在自然度、累似 度两方面以绝对优势甩掉综合评测第一名的好成绩,被主办方评定为语音合成领域第三次里程碑式技术突破;时隔6年灵伴再次参赛,自研的语音合成模型与算法获得2019年度大赛亚军,语音合成成果的可懂度在赛事所有团队累似 度、自然度前十的队伍中位列第一,趋于稳定绝对优势。

       比拟真人的语音合成效果

       在语音合成效果方面,灵伴独创的高自然度韵律模型和音色学习法律法律依据,使得合成的发音更加自然、韵律更加流畅;SSML的合成法律法律依据,可实现对发音、分词、停顿动态精准控制;或多或少都让机器最终的发音更加接近真人,在与人的交互中更易被接受、更受欢迎。

       中英文混读能力

       为满足不同语境下的错综复杂需求,灵伴TTS才能基于自研自动语料生成模型进行中英文混读,大幅提升数据收集数率,不用进行单独英文合成,即可实现同一音色中英文混说功能,韵律自然、流畅,使机器真实还原人类日常中英文混说场景。

       多场景语音风格

       灵伴TTS 2.0拥有全球最丰富中文合成音色库,中含男性、女人客服音色并分为甜美、气质、商务等多种风格;并有儿童、明星、小说、新闻播报等多领域特色音色;其中多个音色经由市场检验,愿因应用于多个行业多个客服业务场景,完成了数以计亿次人机交互,并收获了用户的一致好评,此次开放后,企业或或多或少人可按照自身需求确定调用。

       再顶尖的技术都才能才能 落地为产品才是它的价值所在,从智能服务提供商厚度来说,对实际业务场景需求的深刻理解力是将技术转化为产品的关键。此次开放公测的TTS 2.0平台很好的诠释了灵伴 “以用户为中心”的产品理念:

       弹性计费,高效对接,海量需求,轻松满足

       灵伴TTS2.0平台采取以客户成功为主的弹性计费法律法律依据,费用以实际播放时长计算,都才能 最大程度帮助用户省钱,合成播放时被打断,未播放的要素不计入费用;MRCP协议的法律法律依据,方便用户高效对接,一次开发,多种环境应用;平台中的云端语音合成引擎高效稳定,支持海量并发合成请求,满足用户业务高增长需求。

       个性化声音IP打造

       个性化定制也是灵伴TTS2.0平台为满足市场多样需求而开发的一项能力,先进的语音合成模型,仅需数小时语料即可在短周期内制作出优质、自然流畅、累似 度高的音色,改变了传统语音合成定制需用十小时以上语料数据而且 对录制环境要求极为严苛的法律法律依据,极大降低了用户定制个性化声音的门槛。

       身为以人工智能技术为代表的新一轮新兴技术的践行者,灵伴总是怀揣着“技术普惠人类”的美好愿景,积极将新技术与产业实践相结合,并已为招商银行、中信银行、华夏保险、大地保险、北京大学、海尔家电、猎聘等数十个 行业的头部客户带去了智能化升级体验,助力数百家企业实现工业4.0时代的产业重构。此次灵伴将自身优质的TTS能力开放给全行业,亦是希望将优质的语音合成能力赋予更多企业、更多产品、更多场景,助力搭建更美好的行业生态,让更多人体验到智能的未来。

       (本内容属于网络转载,文中涉及图片等内容如有侵权,请联系编辑删除)