C114讯 4月21日消息(南山)快节奏、碎片化的现代生活,发达的互联网技术,使得听有声书成为读书的一种流行形式。更令人意想不到的是,有声书还可以用AI技术创作。
4.23世界读书日前夕,喜马拉雅上线了AI超拟真有声书《智能交通》。这套有声书共86集,每集时长10-20分钟,首日上线21集,后续每天更新2集。据了解,用户在百度搜索“智能交通有声书”,可直接收听。
《智能交通》是百度董事长兼CEO李彦宏出版的一本著作,去年12月发行。百度语音合成团队基于《智能交通》一书20万字文本,使用李彦宏约1小时音频素材,通过AIGC(人工智能创作内容)技术生成了《智能交通》有声书。其音频合成效果还原度极高,普通用户听到的,几乎就是“原声”,难以分辨,也无需分辨。
“原声创作”展示了百度强悍的AI语音合成能力,也从一个侧面反映出AI技术正在加速渗透且改变人类社会。以《智能交通》有声书为例,一方面是AIGC(人工智能创作内容)的兴起,另一方面其本身蕴含的内容,是李彦宏对AI深度变革交通出行行业的解读:自动驾驶不是梦,交通拥堵不再怕,交通事故不断下降……
互联网上近年有一句话很流行:“你要悄悄努力,然后惊艳所有人。”AI,从最开始的挣扎,悄然间已遍布各行各业,很快将惊艳所有人。
Part1:AI超拟真有声书《智能交通》是如何创作的?
《智能交通》,一本30万字的专业书籍,涉及不同的表达语境、相当多的中英文专业词汇。据了解,百度语音合成团队只采用了李彦宏约1小时公开音频,可用数据约300句且口语化,场景单一且没有英文词汇。以常用语言为基础,创作专业版的有声书,这种极致的对比,可以直观凸显“地狱级”的难度。
您的浏览器不支持本音频元素,请更新浏览器。
挑战主要有四点:如何只利用300句数据,高度还原说话风格;如何只利用中文数据,合成出音色、风格一致的中、英文混合播报效果;如何只利用单一的访谈口语化数据,合成出专业和叙述等其它语境下内容,保证其流畅性和自然度;如何利用发音不标准的数据,合成出高音质、高还原度,发音准确稳定的效果。
团队一一提供了针对性解决方案:率先研发的端到端细粒度建模技术,从300个整句的学习,进化到300句乘以每句20个字的学习方式,更好的挖掘了字与字之间的相互关系,更加高效的利用了数据。基于该技术,个性化合成只9句即可实现普通效果,300句已达到专业水准。
独创的解耦式建模技术,可以对说话的内容、风格、音色进行区分,并独立建模;通过大数据的学习,将学习到的三个维度能力进行迁移。从而达到让一个不会说英文的人,也可以正确的读出英文。此外也可以将风格能力迁移到特定人身上,例如讲故事。
此外,前后端联合建模技术,依托百度在语言处理的优势,结合文本处理与发音合成两大模块,联合学习了大量不同文本语境下的发音方式,实现跨语境合成;独创的通用声码器合成技术,结合了传统参数声码器的可控以及神经网络声码器的高还原度优势,修复错误发音和提升音频质量,有效解决口语环境下存在的发音不标准的问题。
目前,只需9句话素材、5分钟等待,百度语音合成技术即可实现对用户声音的复刻,300句话即可生成媲美专业音库的音频内容。作为业内唯一能提供10句话以内大规模产品级个性化语音合成服务的公司,百度相关技术早已应用于各类产品中,如在百度地图吸引超过600位明星红人入驻语音广场,实现个性化定制语音包,每日播放次数达2亿。
通过《智能交通》的创作,可以看到AIGC技术的进化,已经能够解决一些看似无法解决的难题,从而在技术层面扫除障碍。创作者基于AI技术平台,可以将精力聚焦于内容本身,从而大大解放了生产力,为行业发展带来了光明前景。百度的各类“率先”、“独创”技术,则证明了其在AI语音合成领域的江湖地位。
Part2:《智能交通》讲述了什么?
如果说AI有声书反映了AI技术在新兴领域的创造力,那么智能交通就是AI技术深刻变革传统行业的代表。《智能交通》这本书中,李彦宏从关注自动驾驶解决安全问题开始,一点一点深入,也一点一点放大关注的尺度——关注人类司机危险驾驶的问题以及自动驾驶、智能交通、智慧城市等问题。
比如,将交通事故率降低90%;根据国际公路安全协会发布的数据,每年约有135万人死于交通事故,降低90%就可以减少百万人死亡。再如,助力国家“3060”双碳目标达成,交通是非常重要的一环。建设未来的智慧城市,智能交通也是重要组成部分。李彦宏认为,智能交通系统可以提高通行效率,节约能源,降低空气污染的水平,帮助碳达峰和碳中和,惠及每一个有出行需求的人。
如果说这是《智能交通》一书创作的初衷,那么其中探讨的内容,更是全景式展现了人工智能技术的价值。聪明的车、智慧的路,构筑完整的车路协同系统,李彦宏判断,智能交通将是影响未来10-40年的重大变革,10年之内,依托交通效率提升,城市拥堵问题将基本解决。
C114留意到,《智能交通》出版上市,受到了众多知名人士和知名媒体的好评。例如中国工程院院士、国家新一代人工智能战略咨询委员会主任潘云鹤作序表示,“智能交通是一个兼具深度和广度的智能大系统,书中相关创新研究和实践,一定能推动和引领国内外智能交通的新发展。”
用AI技术基于本书创作的有声书,值得一听。对行业人士来说,堪称“双倍智能”的体验。
Part3:颠覆AIGC,颠覆智能交通
百度在AI领域拥有宏伟的布局,仅从这套AI有声书,就可以窥见其在两个垂直领域的雄心:颠覆AIGC、颠覆智能交通。
从AIGC来看,当前市面流行的内容,无论是从制作方式还是内容本身都较为粗浅,仅仅是人工制作内容的补充,远远称不上主流。AI有声书《智能交通》由于内容的专业性,很难成为爆款产品,但其采用AI技术制作的精英级水准,显示出AIGC产业具有巨大潜力和可兑现能力,百度将扮演重要角色。
智能交通领域更加能够全方位考验一家人工智能公司的全栈式能力、深度学习水平、行业解决方案的价值与综合社会效益。百度作为一家人工智能公司,在智能交通领域起步早、投资大、态度坚决,早已处于领军者地位。
一方面,百度是全球领先的自动驾驶技术开发商,不仅推出自动驾驶开放平台Apollo,还推出了自动驾驶出行服务平台萝卜快跑;另一方面,百度深入参与到全国智能交通的建设中,支持多个国家级车联网先导区和各省市先导区的高质量发展,从自动驾驶,走向自动驾驶和车路协同的全面发展。
百度在智能交通领域的深度实践,正推动人工智能技术的产业化进行一次高级别的、高价值的、高技术含量的验证。而在AIGC领域的小试牛刀,也为行业注入了一股技术创新力,将搅动这一池春水,等待着内容创作者的热情回应。
关键词: 智能交通
关于我们 广告服务 手机版 投诉文章:435 226 40@qq.com
Copyright (C) 1999-2022 baidu.baiduer.com.cn baidu爱好者 版权所有 联系网站:435 226 40@qq.com