【虎嗅夏季F&M节】百度张潼:深度学习接近人脑,是巨头竞相追逐的未来

创投分享会注:创投分享会FM节上,百度研究院副院长张潼发表了有关于深度学习的主题演讲。现在为什么大家都很重视深度学习?最主要的原因是数据量比较大,计算规模变大了;此外,复杂模型有其独特的优势。在张潼及百度的愿景里,深度学习的意义是研发出最接近人脑复杂程度的模型,而这也是Google正在追逐的未来,这可能是互联网公司目前正在进行的最前沿研究。以下是他演讲的主要内容,创投分享会进行了编辑。
这是我第一次来深圳,也是第一次来创投分享会参加类似的活动,我是搞技术的,我做的更多的还是面向于偏技术的,我很高兴跟大家分享。如果大家跟数据有关系,特别是互联网企业都会对数据打交道,深度学习近年来是非常火的概念。
很多人对深度学习感兴趣,包括VC等等,他们看到的是什么呢?很多互联网公司会对技术非常感兴趣。像谷歌做了很多事,2011年成立了谷歌大脑的计划,这个比较著名的人是Andrew Ng,另外一个是Jeff Dean,他们当时的目的是想建一个世界最大的深度学习网络。
我跟大家分享一下这个技术能做什么,为什么大家的兴趣那么大?互联网,大家说大数据,为什么我们这么重视数据,百度要用数据来做智能化,特别是人工智能实验室,一个是数据,一个是智能,这两个是关键词。互联网目前是几种模式,如果看BAT的话,一个是联接人和信息,像百度,阿里是联接人和商品,还有腾讯和facebook都是联接人和人。主要是这三个模式,另外还有线上线下。
这些实际上都是数据驱动,跟传统的不太一样,互联网企业讲快速迭代,一个是数据驱动,这样要进行很多分析。特别是进行到一定的程度,比较高度的时候,你需要提取数据,其中一个是数据制导,比如百度的搜索技术、语音技术等等。深度学习更大的概念是机器学习,如果我们看一个图的话首先是有大数据,然后是分析,包括建模,用高效的算法解决这些模型,然后集合到你的系统里面,最后就成为一个智能化的系统。深度学习在整个流程里面最主要的是复杂模型,像人脑的模型,这个模型的效果非常好。深度学习是互联网数据分析必不可少的。
我们说一下语音,这是深度学习用得比较广的领域,你说一句话,通过计算机给你翻译出来。机器学习有输入输出,输入是声学信号,输出就是变成文字,比如说你好或者其他的。问题规模是非常大,基于大数据,百度或者类似大的互联网企业都是上万小时的语料,数据规模是百亿级,类别上万类。你进来的是一些文字,最后你希望用它训练出来一个模型,而这些模型最后可以在线上用。模型在这里是深度学习的模型,这是目前效果最好的一个方式。计算技术上需要大规模的计算技术,有一些技术的瓶颈需要处理。
从模型上来讲有两种,深度学习相对应的概念是浅度学习,浅度也是一个机器学习模型,它的意思就是人工要抽取特征,通过人工的方式变成计算机可以识别的,然后学习跟学习线性组合。后来发现数据量变得更大的时候,你可以用更复杂的模型,这些模型包括深度的模型,它的好处就是可以从原始出发自动学习组合,这样的能力是人工不足的地方就用机器代替,然后要并行大数据,另外要很大的计算能力,这样就能得到更好的效果,就能实现类似智能化。
智能化是今后十年大家最关注的技术前沿,这从技术瓶颈上也是非常高的。举一个图像识别的例子,它怎么从产生到生成,然后学习一些比较高级的。比如开始进来的都是一些图像的像素,后面一层就会有一些边出来,再下一层就是学习特征,再上面就组建成人脸。这种信息是自动学出来的,不是人制造的。传统的学习方法是人来做的。语音也类似,也是从低到高慢慢建立起来的。 另外它非常像人大脑的结构,深度学习本身是模拟大脑的,它的结构跟大脑走得非常近。从某种意义上来讲深度学习跟人脑是非常近的。图像识别传统的方法是在2010年用浅层模型,达到了74%,到2012年有了非常大的提升,达到了85%。
现在为什么大家都很重视深度学习呢?最主要的原因是数据量比较大,计算规模变大了;此外,复杂模型独特的优势就会显现出来了。想象一下将来数据会越来越大,特别是互联网里面,各位如果创业的话对数据也非常关心,将来也是非常大的数据,建立复杂模型也是非常重要的。
数据规模,首先是成倍的增长,包括广告、语音、图像等等。另外一个是计算能力,其中有一个代表,GPU的出现,你计算是用CPU,最近深度学习用得比较多的是GPU,GPU使得计算能力大大提高,GPU一两个星期能处理的数据,CPU可能要一年。还有复杂的图像模型。最后要有一些算法支持它,它有异步式的算法来支持它的计算。
我们的目标是使计算机更加智能,这是在座各位想做的事,要智能,能够理解人,能够知道意图。我们现在的手段跟以前的区别是我们有大数据。那我们就要分析它,复杂模型就很重要。计算能力也上去了,最后要做一个系统才能达到你的目的。深度学习是非常接近人脑,第二是向人工智能走得非常近,也许它不是最终的目标,但是有很好的效果提升。
这是我第一次来深圳,也是第一次来创投分享会参加类似的活动,我是搞技术的,我做的更多的还是面向于偏技术的,我很高兴跟大家分享。如果大家跟数据有关系,特别是互联网企业都会对数据打交道,深度学习近年来是非常火的概念。
很多人对深度学习感兴趣,包括VC等等,他们看到的是什么呢?很多互联网公司会对技术非常感兴趣。像谷歌做了很多事,2011年成立了谷歌大脑的计划,这个比较著名的人是Andrew Ng,另外一个是Jeff Dean,他们当时的目的是想建一个世界最大的深度学习网络。
我跟大家分享一下这个技术能做什么,为什么大家的兴趣那么大?互联网,大家说大数据,为什么我们这么重视数据,百度要用数据来做智能化,特别是人工智能实验室,一个是数据,一个是智能,这两个是关键词。互联网目前是几种模式,如果看BAT的话,一个是联接人和信息,像百度,阿里是联接人和商品,还有腾讯和facebook都是联接人和人。主要是这三个模式,另外还有线上线下。
这些实际上都是数据驱动,跟传统的不太一样,互联网企业讲快速迭代,一个是数据驱动,这样要进行很多分析。特别是进行到一定的程度,比较高度的时候,你需要提取数据,其中一个是数据制导,比如百度的搜索技术、语音技术等等。深度学习更大的概念是机器学习,如果我们看一个图的话首先是有大数据,然后是分析,包括建模,用高效的算法解决这些模型,然后集合到你的系统里面,最后就成为一个智能化的系统。深度学习在整个流程里面最主要的是复杂模型,像人脑的模型,这个模型的效果非常好。深度学习是互联网数据分析必不可少的。
我们说一下语音,这是深度学习用得比较广的领域,你说一句话,通过计算机给你翻译出来。机器学习有输入输出,输入是声学信号,输出就是变成文字,比如说你好或者其他的。问题规模是非常大,基于大数据,百度或者类似大的互联网企业都是上万小时的语料,数据规模是百亿级,类别上万类。你进来的是一些文字,最后你希望用它训练出来一个模型,而这些模型最后可以在线上用。模型在这里是深度学习的模型,这是目前效果最好的一个方式。计算技术上需要大规模的计算技术,有一些技术的瓶颈需要处理。
从模型上来讲有两种,深度学习相对应的概念是浅度学习,浅度也是一个机器学习模型,它的意思就是人工要抽取特征,通过人工的方式变成计算机可以识别的,然后学习跟学习线性组合。后来发现数据量变得更大的时候,你可以用更复杂的模型,这些模型包括深度的模型,它的好处就是可以从原始出发自动学习组合,这样的能力是人工不足的地方就用机器代替,然后要并行大数据,另外要很大的计算能力,这样就能得到更好的效果,就能实现类似智能化。
智能化是今后十年大家最关注的技术前沿,这从技术瓶颈上也是非常高的。举一个图像识别的例子,它怎么从产生到生成,然后学习一些比较高级的。比如开始进来的都是一些图像的像素,后面一层就会有一些边出来,再下一层就是学习特征,再上面就组建成人脸。这种信息是自动学出来的,不是人制造的。传统的学习方法是人来做的。语音也类似,也是从低到高慢慢建立起来的。 另外它非常像人大脑的结构,深度学习本身是模拟大脑的,它的结构跟大脑走得非常近。从某种意义上来讲深度学习跟人脑是非常近的。图像识别传统的方法是在2010年用浅层模型,达到了74%,到2012年有了非常大的提升,达到了85%。
现在为什么大家都很重视深度学习呢?最主要的原因是数据量比较大,计算规模变大了;此外,复杂模型独特的优势就会显现出来了。想象一下将来数据会越来越大,特别是互联网里面,各位如果创业的话对数据也非常关心,将来也是非常大的数据,建立复杂模型也是非常重要的。
数据规模,首先是成倍的增长,包括广告、语音、图像等等。另外一个是计算能力,其中有一个代表,GPU的出现,你计算是用CPU,最近深度学习用得比较多的是GPU,GPU使得计算能力大大提高,GPU一两个星期能处理的数据,CPU可能要一年。还有复杂的图像模型。最后要有一些算法支持它,它有异步式的算法来支持它的计算。
我们的目标是使计算机更加智能,这是在座各位想做的事,要智能,能够理解人,能够知道意图。我们现在的手段跟以前的区别是我们有大数据。那我们就要分析它,复杂模型就很重要。计算能力也上去了,最后要做一个系统才能达到你的目的。深度学习是非常接近人脑,第二是向人工智能走得非常近,也许它不是最终的目标,但是有很好的效果提升。
知名风险投资公司
红杉资本|瑞华投资|同创伟业|达晨创投|深创投|IDG|创东方|君联资本|中科招商|经纬中国|启明创投|松禾资本|英特尔投资|优势资本|东方富海|天堂硅谷|九鼎投资|晨兴创投|江苏高科投|北极光创投|德同资本|凯雷投资|中国风投|天图资本|真格基金|DCM|IFC|凯鹏华盈|高盛投资|启迪创投|戈壁|荷多投资|纪源资本|鼎晖投资|华平投资|金沙江投资|海纳亚洲|永宣创投|险峰华兴创投|中投|海通开元|中信资本|力鼎资本|平安创新资本|天使湾创投|和君资本|祥峰集团|招商湘江投资|元禾控股|力合创投|复星创富|陕西高投|光速创投|富达亚洲|成为资本|中信产业基金|GIC|基石资本|金茂资本|富坤创投|盈富泰克|重庆科投|鼎晖创投|北工投资|海富投资|招商局资本|新天域资本|中路集团|摩根士丹利|青云创投|建银国际|德丰杰|弘毅投资|CVC|蓝驰创投|宽带资本|秉鸿资本|金石投资|天创资本|证大投资|中经合|信中利|兰馨亚洲|淡马锡|浙商创投|华睿投资|景林资产|挚信资本|高特佳|清科创投|华登国际|山东高新投|集富亚洲|腾讯|无锡创投|创新工场|智基创投|策源创投|软银中国|
创业联合网是创业者和投资人的交流平台。平台拥有5000+名投资人入驻。帮助创业企业对接投资人和投资机构,同时也是创业企业的媒体宣传和交流合作平台。
热门标签
精华文章
