搜索

Sugr米糖科技CEO宋少鹏:智能音箱抢滩战才刚刚开始

2017-9-15 17:59| 阅读次数: 2241| 发布者: 教研室

摘要: 网易科技讯9月15日消息,网易科技主办的第49期五道口沙龙——智能音箱抢滩站于今天下午举行。Sugr米糖科技创始人兼CEO宋少鹏在现场做了《语音、交互、软硬件的集成和认证的苦甜》,的演讲,分享了Sugr Sense语音交互 ...

网易科技讯9月15日消息,网易科技主办的第49期五道口沙龙——智能音箱抢滩站于今天下午举行。Sugr米糖科技创始人兼CEO宋少鹏在现场做了《语音、交互、软硬件的集成和认证的苦甜》,的演讲,分享了Sugr Sense语音交互产品整体解决方案。

 Sugr米糖科技CEO宋少鹏:智能音箱抢滩战才刚刚开始

宋少鹏十分认同“智能音箱抢滩战”的说法。他认为,每一个新品类的诞生都有相当多的企业飞快涌进来在市场中搏杀,这是非常正常的现象。作为一个在音频领域17年的从业者,宋少鹏认为,音频市场具有长期的盈利点,而各家对智能音箱音频市场的竞争才刚刚开始。

米糖科技作为创业公司,从13年就在探索语音交互的发展方向。做了三种维度的交互,第一种是摇一摇,第二是轻触,第三是语音交互, 2015年底,宋看到亚马逊的echo和alexa的平台,把产品接入这个平台产品、解决方案,服务于国内诸多音响品牌的客户。

目前公司做的事情是提供一套完整的音频交互解决方案,用不同维度交付给行业,首先交付的是技术解决方案,可以落实成硬件的模块跟软件的,客户或行业同仁拿到这套方案去再加上一些外围的部分,就可以做成跟亚马逊Echo兼容的智能音箱。

其次,在用户体验的维度我们交付一套完整的用户体验设计,特别是当我们合作的客户和合作伙伴是加工制造业企业时,他们非常需要来自于互联网的用户体验设计能力,所以我们的App、产品灯效及声效交互全部会帮客户交付一套完整体验。(张潇潇)

以下是Sugr米糖科技创始人兼CEO宋少鹏演讲全文:

宋少鹏:大家下午好!时间紧张,过程就不要浪费了,我是来自深圳米唐科技的宋少鹏,既经历过智能音箱研发生产制造运营,又经历过智能音箱解决方案的研发推广的公司,作为创业公司,我们把两端的事情都做了,我们开始做得比较早,2013年底时我们就把看到了音频和互联网结合的大方向,组成了创业团队,开发了自己的智能音箱产品,并且顺利地在2016年就把我们的产品对接了亚马逊的Alexa语音交互平台,就是刚才龙总花了很多时间介绍的现在最先进的这套语音交互平台,我们成为了这个平台上的第一家第三方音箱产品,通过他们的认证并在亚马逊平台上销售的。

这个事情做完之后我们找到了更大的市场机会,在中国有特别多的企业,这里面有很多是传统的制造企业,或者是有一些音频类的企业,他们非常希望拥抱语音交互这个新形态,非常希望加入到人工智能所带来的市场红利中去,更新他们的产品。但技术跟交互的迭代是需要时间的,所以他们特别需要快速进入这个过程,所以我们拿出了我们的解决方案满足这部分市场。

今天借网易的机会我来介绍一下我们占据在珠三角这个位置,服务的多数都是出口加工制造的企业,在这个市场里我们的观察和思考,希望能够和大家日常交流的语境有一些不同。

上半场大家的交流有一些很闪光的火花,我们也有一些自己的观点拿出来分享。

今天网易的标题非常吸引人,叫“智能音箱抢滩战”,在此之前大家从不同地方听说过,“百箱大战”等各种说法,我们的观点还是站在珠三角这个制造业和全世界消费电子生产基地的视角来看,其实这样的事情在历史上已经发生了无数次,只是之前没有微信,之前没有这么丰富快速的社交体系,我们在那边我们是知道的,从最初的MP3、DVD,到后来的山寨手机、智能手机,平板电脑,每次一个新品类诞生,其实都有相当多的企业飞快涌进来,嗅觉特别敏感的商人飞快涌入,想在这个市场里搏杀获利,这是非常正常的一个现象。

而且我们对于语音交互有一个价值观方面的认同,作为创业企业的创始人,也作为在音频领域工作超过17年的从业者,对于音频的认知和音频给人带来的价值我们有一个认同,这是一个可以长期获利且长期迭代持续交付用户价值的市场,现在才刚刚开始,我们认为是抢滩战,抢滩战在战争里到了后期,敦刻尔克等,抢滩战到了白热化阶段,但我们认为才刚刚开始,甚至有些还没有摸到门道,为了战略需求而跳进来的。

快速分享一下我们的观点,然后讲解一下我们对这个市场的认识,希望给大家提供另外一个维度的思考。

我们是一家创业公司,公司总部在深圳,我是公司创始人,名字叫宋少鹏,这个名字如果用汉语拼音缩写叫“SSP”,在我们这个专业里有一个术语是“声音信号处理”,可能这就是命吧,我从读书到毕业到工作到整个创业都是围绕着声音信号处理在构建我的职业生涯,我们从2013年就开始构思音乐播放产品和互联网的结合,以及怎样用更简洁更省力更提高效率的方式跟人完成交互,所以我们设计的第一代产品也是尽可能希望人们闭着眼就可以操控音箱,所以我们做了三个维度的交互:

1、通过摇一摇的方式切换更新,你可以想象一下不用睁眼就能完成。

2、通过打开和播放的方式。

3、更妙的是说“我想听……”就能播放。

回到2013年,产业不成熟,创业公司交付能力是有限的,所以我们没办法在语音交互领域拿出产品化的东西,我们做了一些基于讯飞SDK和谷歌SDK的尝试,但那不能交付好的产品体验,所以在实际售卖产品中我们只保留了刚才那两个肢体的交互,而放弃了语音的交互。

曙光来自于2015年底,作为始终观察这个领域的前沿创业企业,而且始终在国内海外并行运作我们的产品,我们看到亚马逊的Echo和背后Alexa这套语音交互系统,从2015年底成为开放平台,我们就主动高效地把产品接入了他们,后面就是产品、解决方案,服务于国内诸多音响品牌的客户。

我们把行业分成宽泛的和相对狭窄的两个角度,宽泛是整个计算机和机器行业,其实就是人在历史中跟整个机器的交互,可以抽成主线迭代的规律,它的核心是人跟机器的互动怎么使得人所付出的能耗更低,或者是怎样让人的效率更高,把这个很虚的描述落实到音频产品,它的中线完全一致,大家可以看一下从上上个世纪,通过这种笨拙的产品使得音乐播放第一次进入普通消费者的家庭,在这之前你想听音乐需要步行或骑马到音乐厅、歌剧院,这意味着这一步的迈出使得你获取音乐付出的能耗极大降低,或是使你欣赏音乐这件事极大提高,坐在家里就可以欣赏音乐,而不需要乘车去音乐厅。

沿着这个规律从古代往现代走,都是符合这个规律的,每一步要的是介质减小,要么是容量增加,挂在身边,随时随地都能获取音乐。一直到2014年Echo出来,刚才龙总讲它是偶然,确实它可能是偶然,但从哲学的角度是必然,就是怎样以更便利的方式让人们获取音乐,比如256×4,用打字的方式需要多少秒,需要多少焦耳能量付出,用手机触摸屏的方式需要多少秒,多少焦耳付出,用鼠标的方式,到现在用动嘴的方式,这是完全能计算出来的,这是隐含在技术发展中的底线,这个底线就是怎样使得人机交互效率不断提升才是符合这个迭代方向的。

再往后是不是用脑波的方式,想一想就能完成,很有可能,只有这样才是符合这个路线的。

因为我们一直在音频行业里,比较早地相信了这个趋势,所以很早就认可了这个方向,不顾一切地投入这个方向。

如果有在座同业者,看到这个行业这么拥挤的竞争,产品同质化、平台同质化,有各种各样行业不同角度的分析,如果是这个行业的从业者,我们非常希望用更宏大的历史观眼光来看,它才刚刚开始,可以迭代可以交付的体验大家才刚刚开始挖掘,仍然有很多机会在里面。

时间关系我不按照准备的逻辑顺序说,跟大家分享一些我认为比较重要的想法,我们做的事情是提供一套完整的音频交互解决方案,用不同维度交付给行业,首先交付的是技术解决方案,可以落实成硬件的模块跟软件的,客户或行业同仁拿到这套方案去再加上一些外围的部分,就可以做成跟亚马逊Echo兼容的智能音箱,它可以长成各种各样的样子,胖一点瘦一点大一点小一点,这是技术的维度。

在用户体验的维度我们交付一套完整的用户体验设计,特别是当我们合作的客户和合作伙伴是加工制造业企业时,他们非常需要来自于互联网的用户体验设计能力,所以我们的App、产品灯效及声效交互全部会帮客户交付一套完整体验。

举个例子,当你在使用一个智能音箱时,因为它没有一个屏幕,它需要通过一些交互的方式来告诉你它在干什么,比如你把它喊醒,它会告诉你我在听我,我可能遇到问题了,我可能不知道答案,这种状态之间怎样以最合适的方式,而且以最具性价比的方式跟你的用户发生互动,这部分是我们提供完整设计跟咨询服务给到行业伙伴的。

详细一点说,这里面有灯光的效果,还有声音的效果,声音效果又会分为语音的提示和提示音的提示,还有人在里面做了微创新应用,喜马拉雅音箱,叫它一声它会很甜地答应,我们觉得这是很好的创新,让它拟人化地跟你互动,所有这些,作为完整解决方案的交付商,我们是给到行业、给到合作伙伴的。

另一部分是产品整体设计的部分,包括工业设计、声学设计、结构设计,它们之间在声学产品上是深度耦合的,不像手机产品因为特别成熟可以这里采购一个屏这里采购一个壳然后组装,到目前为止因为市场太刚刚开始,所以整个声学工业设计交互设计是深度耦合的一部分,我们是其中提供设计和服务给到行业和合作伙伴的。

还有一系列面向海外市场的商务对接及流媒体资源对接的动作。

刚才龙总有很详细的介绍,我们就不会再跟大家反复讲亚马逊的Echo是什么,Alexa是什么,但我们有一个特别想跟大家分享的观点:

首先我们不希望大家问Alexa是什么,而是问Alexa是谁,我们希望跟行业分享一个观点,它越来越成为你生活中的一个助手,它越来越成为一种你生活中的伙伴,而不仅仅是你桌面的工具,我们的音箱客户在北美是一个家庭,有一个小朋友,10岁左右,使用时突然有一天把音箱摔坏了,因为是木质,所以整个表面都摔残了,不能工作了,家人联系我们维修,我们很快响应,但还没有开始到维修的过程他们很快又发了短信,说我不光要你能给我修好,而且是我就要这一台,你们不要给我换新的。这是让我们很诧异的,我们问他为什么,他说因为我们家的小朋友天天用这个音箱跟Alexa交流,他已经把这个当成是他的伙伴了,这个爸爸说“他跟我说,你们不要换一个新的,哪怕它带着一块疤回来我也要它”,这给我触动特别大,可能人类历史上第一次有机会工具开始成为你身边的伙伴,在我们成年人看来不可理解,但在孩子那里他就没有把它当成工具,因为他很喜欢,他就把它当成伙伴。

刚才我忘了哪位嘉宾讲,这个行业特别需要人工智能的产品经理,可能也是这方面,大家不能再以上一个时代的产品交互逻辑思考,而是更多以人性、以人文观点来思考产品的设计。

刚才王老师分享Siri在中国好像没什么人用,其实我持不同观点,确实Siri没什么人用,但Siri在美国使用率比较高,因为它的IOS系统以及跟它的电话本、Music打通之后,特别是在车上,Siri在美国的使用率还是蛮高德,因为我本人在美国也会用,在中国因为种种原因使用率并不高,但也不能因此否认整个Siri产品在全球市场的表现,

说到这里还有另外一个观点跟大家探讨,Siri2011年就推出了,为什么没有成为现象级产品,而Echo成为现象级产品?我们认为这里面有交互体验的差异,有图谱等差异,我们认为最根本的差异就是Siri这个东西是为这个公司的既得利益服务的,苹果这个公司的既得利益是那一块屏,所以它所有创新都是围绕这块屏在服务,当语音交互围绕这块屏服务时就有很多限制,我用Siri搜东西,它首先是把结果用文字的形式打出来,而不是念出来,当它把这套系统完全服务于既得利益时,有很多条条框框的限制,为什么亚马逊成功、Echo成功、Alexa成功,因为它在屏上、在消费电子上完全没有任何的既得利益,就是想语音交互怎样做得更好,怎样为用户体验,为场景解决问题,所以它成功了,这里面有偶然有必然,但我们会认为这里面有一个很重要的观点,就是在上一个时代,智能操作系统时代,微软没有成功,它也是想为它的Windows服务,因为这是它的既得利益,在语音交互时代,至少Siri目前还没有成功也是因为它在为它的既得利益服务。当你做一个事情,真正站在场景和用户思考,才有可能在价值上有所突破,而当你受制于既得利益时,其实会做很多束缚手脚的事情。

这些观点占用了时间,使得我们的分享和广告时间大打折扣,在一个周五的下午,这样的分享还是有价值的,等下还有圆桌的时间,另外我也已经加入了交流群,我们为语音交互需求提供端到端解决方案,目前成熟的方案是英文解决方案,中文方案我们也在和若干国内的合作伙伴配合,如果大家有相关要求也可以在会后详细交流。

就这样,谢谢大家。


鲜花

握手

雷人

路过

鸡蛋

最新评论

回顶部