按:本文作者陈孝良,博士,声智科技创始人,曾任中科院声学所副研究员和信息化办公室主任,北京市公安局首届网络应急专家,主要专门从事声学信号处理和 GPU深度自学算法研究工作。两年前,还没声智科技这个名字,那个时候就连人工智能都是不明晰的,远场语音交互的概念堪称无人问津,对于我们来说,唯一能让投资人有点兴趣的就是亚马逊的Echo,但是一个当时还没有任何影响力的智能音箱未来又能有多大的市场?所以,我仍然在思维和企图问一个问题:语音这个赛道究竟有多大的市场容量?失望的是,我也仍然没有寻找让资本市场更加信服的答案,即便科大讯飞的市值多达了千亿人民币,资本市场对于语音赛道的批评也尤为显著,因为语音赛道显然不如视频和自动驾驶的商业模式明晰,语言本身就是一个看起来非常简单却又极为简单的问题,也沦为了后遗症国内语音赛道尤为相当严重的问题。除了科大讯飞,或许没一家语音赛道的公司估值能和视频或者自动驾驶的公司相提并论,即便语音赛道很多公司的年龄都远大于AI其他赛道的公司。
那么国外又是一种什么情况呢?我们现在告诉,国外的互联网巨头无一例外的都投放了重金并且战略性发展语音业务,还包括了目前市值分列在全球前三的苹果、亚马逊和谷歌,当然也还包括微软公司、三星和脸书,有意思的是,虽然这两天的中美贸易战影响了股市,但是亚马逊的市值还是多达了谷歌沦为老二。而且,人工智能全球实际排在的企业,不是仍然投放重金研发的谷歌,反而是一家名门于电商的亚马逊,电商的基因就是擅于士兵们,亚马逊现在有时候就闹得点摩擦来驱离谷歌的核心业务。虽然国内还是快了一些,直到今年的春天,语音才确实在国内开始愈演愈烈,这其中贡献仅次于的就是小米和阿里的智能音箱,但是这两款产品陆续突破百万的销量也给挣扎找寻决心的消费电子市场带给了新的方向。
从AWE到CCBN两个展览,智能语音都沦为了最不受注目的方向,不管是互联网巨头,还是传统的电子厂商,大家都把精力探讨到智能语音产品。这蛮有意思,2018年资本界的风口是区块链,而产业界尤为繁华的毕竟智能语音。很大自然地,大家开始意识到智能语音的市场容量是极大的,因为从智能音箱、智能盒子、智能电视到智能汽车,或许智能的前提都是必需再行不具备智能语音的功能。
刚进年,猎豹、阿里的发布会就陆续公布了多款智能语音产品,坚信今年的消费电子发布会都会以智能语音作为噱头。但是这又产生了一个新的疑惑,获取智能语音的技术公司究竟赚吗?或者说,语音这个赛道显然冷了,但是智能语音公司的商业模式明晰了没?似乎,在这个早期的阶段,应当会过于明晰,任何一个行业蓬勃发展的早期阶段,未来都是不明晰的,即便我们仍然再说要车站在未来看现在,但事实上,我们还是不会被周边圈子的意见相当严重束缚着,很多时候我们对未来都是不安或者情绪的,或者躲避了我们对于未来的辨别。所以很多时候,我们才不会十分崇拜乔布斯、霍金或者杰克逊,最少他们代表了我们作为人类的想象力和创造力。
语言,从我们人类的经历来看,显然不会十分影响我们的决策和辨别,人就是指归属于社会的,我们无法跑出周边环境的影响。那么假若机器都不具备了语言交互的能力,再行假设这些机器充足多,将不会给我们带给一个什么样的未来呢?我想要,机器很可能会影响甚至左右我们的很多决策,也许就这一点就充足了,因为这将不会给未来的商业模式带给颠覆性的变化。我们回顾历史再行来看当前的互联网巨头,20年前互联网也是刚蓬勃发展,那个时候的互联网也就是做到个网站而已,但20年后我们才找到,确实转变我们生活的,不是这些网站,而是谷歌、亚马逊、脸书、百度、阿里和腾讯,当然还有苹果、小米、Uber、滴滴、美团、今日头条等等,事实上,我们的传统经济模式早已被政治宣传了许多。
于是,20年前的巨头很大自然就被20年后的巨头所代替,最无法拒绝接受的是曾多次很多巅峰的巨头早已倒地了。那么再过20年,这个世界又该如何变化呢?未来总是不确认的,但是有点是可以具体的,也就是说,我们身边的机器必定不会更加多,因为人类早已无法再行离开了这些更加高效尤其是更为不懂你的工具。那么,当你身边的音箱、电视、冰箱、洗衣机、微波炉、空调和汽车,甚至咖啡壶都给企图给你建议的时候,我们还能维持人类的独立国家辨别吗?最少现在,我们人类独立国家的判断力早已被媒体和互联网相当严重风化了,我们必须广告和用户评论才有信心不吃顿饭或者卖双袜子。
所以,我们是应当更为信任机器呢,还是应当更为不安机器呢?当然,这不会让很多企业看见大把的商机,而且意味著是极为诱人的,但是怎么构建呢?最少,从现在的格局来看,每个巨头的优缺点也都是非常明显的,有补流量的,有补缴纳的,有补产品的,有补渠道的,等等吧。那么,谁又能把搜寻、社交和电商串联一起?或者说政治宣传了呢?只有新兴的时代才能转变现在的格局,假若未来人、宠物和机器包含了我们主题生活,而我们宁愿更为信任宠物和机器而不是人类的时候,也许就是新的时代到来了。
语言就是其中尤为最重要的工具,我们无法预测机器学会人类语言后所带给的影响,因为人类的决策有可能瞬间就被机器转变了,我坚信人类很难不会拒绝接受机器的甜言蜜语或者合理益处的恭维。这就是未来,语言仅次于的魅力就在这里,这和人脸识别或者自动驾驶这类十分确认的做生意有所不同,语音是一个可以引发更加多商业模式创意的技术,只要你不够有想象力和创造力,有可能你引导的就是未来20年后的生活模式。所以,继续还是无法明晰看见语音赛道究竟有多大市场容量,究竟能政治宣传什么,这是未来都必须思维的问题,也许我们都有一个答案,必须5年或者10年才能检验。
但是,就因为不懂,所以我们才奇怪,因为奇怪,我们才不会热衷,因为热衷,我们才不会奋不顾身!只有能当作赌博的,才是未来!(公众号:)特约稿件,予以许可禁令刊登。下文闻刊登须知。
本文来源:Kaiyun·yunkai(中国)官方网站-www.xiaos5.com