搜狗录音笔多场景应用打破增长瓶颈 布局AI迎行业红利期

金煜 陈鹿/文 舒娟/编辑  

2019年09月04日 11:32  

本文3245字,约5分钟

面对市场规模增速缓慢、产品同质化可替代性较强等痛点,录音笔在AI时代该如何突破发展瓶颈成为亟待解决的问题。8月28日,搜狗(SOGO.US)推出升级版的AI录音笔C1,并与爱国者、纽曼、索尼录音笔、万城集团联合成立AI创新联盟。值得关注的是,搜狗向合作伙伴开放了其听写服务,相关用户也可享受到搜狗转写、同传等增值服务。

搜狗在AI录音笔上的不断加码,也获得资本市场和投资者认可。自8月28日至8月30日,搜狗股价已经连续三天收涨。

在业内人士看来,随着AI落地进入深水期,搜狗开放其转写、云端存储等服务,并联合产业头部厂商建立AI创新联盟,不仅可以解决智能录音笔行业“功能单一”、“易被手机取代”等痛点,而且还能在细分领域构建生态以创造更大的价值,甚至从根本上变革产业,促进行业迈入AI时代。

应用AI技术,打开录音笔行业规模天花板

近年来,由于录音笔功能单一、智能手机录音功能的可替代性,不断冲击着录音笔行业的用户规模,导致我国录音笔行业出货量增长基本停滞,进入发展迟缓、趋于饱和的状态。为更好满足用户高品质需求,搜狗正在通过应用AI技术,加快产品迭代的速度,进一步开拓录音笔的使用场景,打开行业规模天花板。

值得注意的是,搜狗AI录音笔升级版在外观上增加了黄、红、白三个色系,同时在高清录音、录音转文字、云端存储等三大基础功能之上,还融合了语音识别、机器翻译、自然语言处理等技术,可适用于采访、会议记录、学习培训、自叙游记、记录灵感等多个应用场景。

据搜狗CTO杨洪涛介绍,搜狗在2018年3月发布了智能录音翻译笔,今年3月又推出智能录音笔C1。随着用户数量的增多,搜狗得到了更清晰的用户画像,包括用户每周录音频次超过三次以上的占比达到60%,每周有41%的用户录音时间超过10分钟以上,并且商务开会、企业内部培训及记者采访为三大高频使用场景。

借助海量数据,获得用户使用频率和场景信息的搜狗开始思考,用户在三大场景中的主要需求是什么,录音笔背后的服务应该如何做好,AI技术到底能给行业带来什么价值?

为了适配更多场景,并减少外部噪音对录音影响,杨洪涛表示,搜狗在新产品中添加了语音增强功能,如录音笔C1采用了双麦阵列设计以及数字降噪算法,并首创了声音识别的功能,转写时可进行人声的自动区分。同时,AI录音笔在转写时还可主动去掉口头语和重复词。

互联网虚拟现实实验室创始人刘锋表示,互联网大数据为深度学习提供了爆发的基础,而麦克风、传感器等设备为人工智能提供了源源不断的数据来源。搜狗旗下智能录音笔,虽然重量不过17克,但这背后却有着庞大的前沿科技生态支撑,如语音识别、机器翻译、自然语言处理等。

也有观点指出,此前录音笔产品的创新只限于扩容、续航、外观改造等方面,在智能手机日益普及后,逐渐进入了增长瓶颈期。而随着搜狗AI听写服务的介入,多功能的录音笔将有更多应用场景,有利于录音笔行业产生新的增长动力。

免费开放AI听写服务 向“硬件+服务”新商业模式转变

此前录音笔市场竞争中,一直存在着同质化产品打价格战的问题,而此次搜狗与产业头部厂商组建AI创新联盟,并向合作伙伴开放其听写服务,或将实现整个行业竞争模式的改变,从产品价格竞争向产品质量和服务方向转变,而盈利模式也将走向“硬件+服务”新模式。

事实上,相较移动电源、蓝牙耳机等电子产品,目前传统录音笔市场较小,并且传统的录音笔已经到了衰退期必须要变革。纽曼董事长王洪峰也指出,传统单一功能、低端的录音笔生存空间越来越小,而搜狗在语音转文字、翻译识别等方面服务,就是行业价值纵向延伸的代表,或为录音笔行业开拓更大的天地。

“向合作伙伴免费提供听写服务,而不是听写技术,是因为搜狗不希望再做一个开放平台或一个语音识别的API,搜狗已把语音听写技术转变成一个完整的服务提供给合作伙伴,使合作产生更大的用户价值。”杨洪涛如是说道。

在杨洪涛看来,搜狗开放服务的目的在于,希望能与合作伙伴共同开发AI录音笔这个大品类,带来用户体验的全新改变,同时通过“AI+软件服务+硬件”方式打开行业规模天花板,让整个行业从降低成本竞争转变为软件服务与硬件联合的方式,促进商业模式的升级。

据了解,搜狗听写服务已实现与搜狗输入法的打通。数据显示,目前搜狗输入法在PC端占有99%的市场份额,在手机端用户日活超4.5亿,而搜狗开放听写服务后,可为市场上90%以上的录音笔产品提供接入服务,即所有有需求的用户均可享受“录音1小时,出稿5分钟”的服务体验。

笔者注意到,搜狗听写服务基于搜狗输入法的用户使用习惯,能够自动构建个性化识别网络,使用户常用语错误率下降40%,而其背后是搜狗输入法每天7亿用户数据在支撑算法的演化。

搜狗CEO王小川在联盟成立当天表示,目前公司已有搜狗输入法、搜狗搜索两款旗舰型产品。除了做好输入法和搜索,公司有意愿在表达和获取信息领域用AI技术促进整个行业的进步。现阶段,搜狗的语音增强、语音变声、语音合成等能力已经在多场景落地应用,未来希望可与同行业企业一起为用户提供更好服务的体验。

有分析人士表示,搜狗听写服务除了拥有录音1小时5分钟出稿等基础能力,与搜狗输入法词库打通后,还可以实现个性化转写、提升转写准确率。从长期来看,行业联盟的达成将促使录音笔行业从以硬件为主的单一收益模式向“硬件+服务”的多种收益模式转变,颠覆传统录音笔行业的商业模式。

录音笔行业有望进入AI时代 行业扩展及多场景应用成发力点

随着AI技术落地应用,搜狗AI录音笔已将录音、转写、编辑、同传等功能集于一体,可为速记、记者以及办公族等文字工作者提供一站式解决方案。不过,录音笔真正实现AI智能化,仍需在实现100%转写翻译准确率的同时,拓展更多应用场景,并满足用户在各个场景中独特的使用需求,实现行业的整体变革。

据搜狗公司AI交互技术中心总经理王砚峰介绍,公司接下来会开放搜狗输入法,并添加连接蓝牙的能力和添加转写的能力,让市面上任何一款蓝牙录音笔都可以直接跟搜狗输入法连接,进行个性化的转写。同时,即使没有带录音笔,用户使用云端存储的数据一样可实现跨电脑编辑。

除了对于使用用户端服务的升级,搜狗还将提高合伙伙伴方面的服务。在王砚峰看来,搜狗所开放的听写服务,从技术到服务体系需要把相关服务品牌的配套做起来,才能吸引更多合作伙伴的加入。

据了解,目前搜狗已推出了搜狗分身、搜狗语音合成、变声等多项AI技术,为搜狗语音识别、语音合成、翻译以及相关能力的产品提供了良好的技术支撑。借助搜狗的核心AI能力,该公司在升级智能硬件业务方面取得了重大进展,许多AI新品正在研发中。其中,搜狗与爱国者合作开发的AI录音笔将于近期上市。

“未来的AI赋能一定是越做越重,而不是越做越轻,需要具备对场景的独特优化性以及不可替代性。”王砚峰表示,未来行业可挖掘的空间就在于,用户在会议等使用场景中AI技术还能提供什么样的服务。

如此来看,目前录音笔功能主要涉及音频的分析、记录和处理,而怎么能够把这些功能扩展到更广泛的行业以及场景中将是未来搜狗及整个行业的发力点。

中国人工智能学会副理事长马少平认为,从应用的角度看,中国人工智能已经达到了世界水平,如搜狗智能录音笔背后的语音识别、机器翻译以及图像识别技术等。虽然当下的AI发展尚处在弱人工智能阶段,但在特定场景下和传统产业进行结合,AI正发挥难以想象的爆发力。

在业内人士看来,录音笔作为一个工具类的产品,基于AI技术的加码,未来会有更多用户了解到录音笔的多种功能。搜狗的智能硬件产品打通了技术、产品与产业的全链条,基于搜狗开放语音转写服务、建立AI创新联盟、延伸行业产业链,录音笔生产商或会提高录音笔的品质以及用户服务,促进行业真正迈向录音笔AI时代。