中国4大AI语音公司掀起“造芯”,中芯国际入场,行业洗牌在即

来源:DeepTech深科技 2019-01-05 14:44:02

摘要
进入2019年,AI技术的场景落地和商用化会成为一个更迫切的议题,但语音识别已是所有AI技术中最成功的领域,眼前有四大AI语音公司思必驰、云知声、Rokid、出门问问不约而同投入“造芯”运动,开始押宝自制AI语音芯片,开启第二战场!(来源:思必驰)“融资”与“造芯”成为AI创业公司两大主轴议题,思必

进入 2019 年, AI 技术的场景落地和商用化会成为一个更迫切的议题,但语音识别已是所有 AI 技术中最成功的领域,眼前有四大AI语音公司思必驰、云知声、Rokid 、出门问问不约而同投入“造芯”运动,开始押宝自制 AI 语音芯片,开启第二战场!

中国4大AI语音公司掀起“造芯”,中芯国际入场,行业洗牌在即

(来源:思必驰)

“融资”与“造芯”成为 AI 创业公司两大主轴议题,思必驰在 2018 年完成 D 轮融资后,即透露与某芯片巨头进行 AI 芯片的研发,如今答案揭晓,思必驰旗下的芯片设计公司“深聪”获得“国家队”中芯国际旗下的股权管理公司中芯聚源投资,同时中芯国际也为深聪打造第一颗 AI 语音芯片。

“百箱大战”时代开启 ,AI 语音芯片热度火到“互撕”?

基于深度学习( Deep Learning )的语音辨识技术很快成为 AI 创业界的流量担当,尤其 2017 年 Amazon 一口气推出多款Echo系列产品,开始了国内“百箱大战”的年代,更让相关 AI 语音企业迎来一阵小高潮,不少同性质公司更是明争暗斗陷入“互撕”局面,反应该市场的火热程度。

根据 Canalys 估计, 2017 年全球智能音箱出货量突破 3000 万台, 2018 年出货量预计是超过 5600 万台,全球前四大品牌厂为Google、Amazon、天猫、小米。再者, 2017 年全球智能音箱用户量排名前五名是美国、英国、德国、中国、加拿大,但2018年中国可望跃居第二名。

除了音箱之外,智能家居、汽车市场很多应用场景的硬件也会陆续加入语音智能化的功能,都让 AI 语音技术的应用场景增添无限想像空间。

中国4大AI语音公司掀起“造芯”,中芯国际入场,行业洗牌在即

(来源:思必驰)

光是 2018 年就有三家 AI 语音创业公司发表相关芯片,包括云知声发表面向 AIoT 市场的 UniOne 芯片、出门问问的 AI 语音芯片模组“问芯”Mobvoi A1、 Rokid 的 AI 语音芯片 KAMINO 18 ,思必驰透露要进入自制芯片领域已有一段时间,4日才正式对外揭露具体战略细节。

中芯国际助阵,思必驰“造芯”如虎添翼

不同于云知声、Rokid进入芯片自制领域,都是在公司内部成立独立部门进行研发,思必驰2018年初成立子公司“深聪”,2019年初推出的第一颗产品是AI语音芯片深聪TAIHANG芯片。

思必驰扶植的深聪之所以引起业界注意,是因为思必驰的“造芯”之路,找来国内半导体巨头中芯国际助力,旗下的投资公司中芯聚源加入成为创始股东之一。再者,思必驰对深聪的持股比重超过50%。

思必驰自制的首颗AI语音芯片,就是由中芯国际操刀,以40纳米工艺打造,约莫是2017年中启动该芯片项目后,在2018年8月进行流片,11月芯片出来后,现在处于采集样本阶段,预计2019年中将进入风险试产,该颗芯片拔剑出鞘的速度十分快,几乎把需要6 个季度的工作,缩短为3个季度完成。

深聪TAIHANG芯片面向智能家居、智能终端、车载、手机、可穿戴设备等各类终端设备,基于双DSP架构,内部集成codec编解码器,以及大容量的内置存储单元,再者,该芯片也采用了指令集扩展和算法硬件加速的手段,相较于传统通用芯片具有10X以上的效率提升。

深聪联合创始人吴耿源表示,在芯片战略上是两步走,因为背后强大的需求力道驱动,第一颗芯片不单是求快,讲求time-to-market,也专注低功耗、单向反馈、实现算法加硬件融合优化的想法。

中国4大AI语音公司掀起“造芯”,中芯国际入场,行业洗牌在即

图 | 深聪联合创始人吴耿源(来源:思必驰)

同时,深聪内部已经开始第二颗芯片的规划,是专用芯片加特定架购,双向沟通更能达到软硬件融合、深度优化的功效提升,以软件需求来定义芯片架构,再用架构去反馈算法,同时,算法也会优化硬体架构,等于是彼此做到双向沟通,预计该颗芯片将在2019年下半年流片,2020年量产。

从“通用”到“专用”,这是一条怎么样的心路历程?

从通用芯片到量身打造专用芯片的过程,想必有一番思考、摸索与探寻,吴耿源接受DT君专访时娓娓道来。

吴耿源分析,思必驰是一家满十岁的企业,这几年赶上AI崛起的浪潮,过去多年的技术积累获得发力的机会,目标战场是物联网,第一个应用场景是智能音箱,一切有了很美好的揭幕,但坦白说,智能音箱终究“ me too ”产品,Amazon 已经在前开路。

思必驰的智能音箱初期用过很多家芯片大厂的通用芯片,但随着产品线逐渐成长茁壮后,许多问题逐一浮现。因为,通用芯片功能再怎么强大,落地到AI场景上会有削足适履之感,加上很多目标市场越来越明确、消费者群聚效应展现后,特制化芯片的需求因此诞生。

AI 芯片在市场上有两路的提供者,早几年都是通用芯片的天下,像是高通、联发科等,这些巨头在芯片战略上,较为着眼于商业利益价值,但是,很多AI应用场景都属于细分赛道,要通用芯片巨头“削足适履”,会比较不切实际。

这些芯片巨头当然也会想要“染指”AI市场,但这个市场和他们过去擅长的游戏规则有落差,以前是巨头们设计出什么样的芯片,客户就要乖乖接受,但AI市场是反其道而行,要透过使用者来定义产品,再由把需求反馈给算法,靠算法实现。

但是,传统芯片巨头无法紧密地直接触碰市场需求,或是内部没有强大的算法团队或数据(Data)做后援,在AI领域要成功,算法、数据、正确地定义市场都是关键。

因此,近几年起算法公司开始切入“造芯”运动,也提供给算法公司实现垂直整合布局的机会,更重要的是,藉由“造芯”来确保产品的差异化和核心价值凸显出来。

吴耿源表示,思必驰从算法公司跨入产品,再垂直整合成一个平台,上下串连系统,在云端(Cloud)、边缘(Edge)两端都有布局,关键就是欠缺一个硬件芯片去担任执行的角色,而AI领域是软件定义芯片,初期用市面上通用芯片时,也发现算法与芯片对接的过程,有很多文化融合的问题。

举个例子,当算法遇到芯片,发生的第一个冲突是算法的改朝换代速度远快于芯片的工艺技术。

一般而言,从定义产品到芯片诞生于世,大概要“怀胎”两年(24个月),中间经历设计、流片、试产、改版、升级、量产,每一个阶段慢慢磨练,中间经历的循环以“季度”为单位来计算。

反观在算法的世界里,每一个礼拜都在改,循环可能是以“礼拜”作为单位,若将算法与芯片摆在同一家企业中,彼此步伐不一致的问题,会产生明显的内部矛盾与冲突。

思必驰从算法、产品、平台、系统整合布局到整个生态系统,现在加入深聪自制AI语音芯片,布局齐全后,将跨出智能音箱这个“me too”市场,进入AIoT领域,包括TV盒子、白色家电、智慧家庭、故事机等,当物联网遇上AI,商机是无可限量。

多模式人机交互是理想桃花源

吴耿源进一步指出,光是语音AI技术就还有很大的精进空间,现在的智能音箱的沟通仍需经过“唤醒”的程序,其实是“人工弱智”,要做到自然人机交互,当中的技术突破就需要算法的大幅增进,其中一个关键的元素是声纹。

市面上的智能音箱只能辨识出说话的内容,再针对问题给出反馈信息,这样的交互方式是智能化的,但交流方式却不够聪明,因为必须要在明确对象的情况下进行,唯有做到“闻声即可识人”,不需要“唤醒”这个多余的动作,这才是真正的“SMART”。

吴耿源进一步解释,AI语音芯片在应用场景的广度上,绝对不单是音箱领域,还包括物联网、智慧家庭、车载市场等,更进一步场景是多模生态,当下AI是最好的时代,天时、地利、人和,AI時代正在騰飛、国家关注造芯、加上软件、硬件、人和的融合。

现在的AI技术场景分别在语音、视觉两大领域有不错的起步和成功的场景落地,但却都是各自表现,所谓的多模生态是指声觉、视觉、五官、手势、触摸等独立的功能融合在一起,实现自然的多模式人机交互。

AI技术领域的前方是无人区,只能摸着石头过河,每一步都是挑战,但也处处是惊喜。

更重要的是,这是一个国内最有机会与美国科技先驱并行的领域,AI技术的“造芯”运动是日正当中,想想海思追赶高通也花了超过十年,才造就今日的江湖地位,国内发展AI技术有应用场景做后盾,要打造出一家巨星级的企业,这一剑肯定不用磨到十年!

关键字: