悬疑灵异

Google大脑工程师详解深度学习技术能区域

Google大脑工程师详解：深度学习技术能带来哪些新产品？

提到深度学习，你可能会想到认猫、认脸，或者下围棋、翻译……其实，这项技术还能用在很多你意想不到的地方。

那么，“深度学习的最新进展能带来哪些产品上的突破？”

Quora上就有这样一个问题，而Google Brain的研究工程师Eric Jiang也给出一个最高赞的答案。下面就是Jiang的回答，大周末的，让我们一起来涨涨姿势：

Deep Learning是指包含以下特征的一类机器学习技术：

· 大规模神经络（包含百万级的自由变量）；

·高性能计算（上千个并行处理器）；

·大数据（例如百万级的彩色图像、棋谱等）

目前，深度学习技术已经在众多领域达到了先进水平，例如视觉、声音、机器人、自然语言处理。深度学习最近的进展吸收了统计学习［1

， 2］、增强学习和数值优化的思想。关于这个领域的概况，见参考文献［9， 10］。

我下面列出一些借助目前的深度学习技术才可能实现的产品类别，排名不分先后：

定制化数据压缩、压缩感知、数据驱动的传感器校准、离线AI、人机交互、游戏、艺术助手、非结构化数据挖掘、语音合成。

定制化数据压缩

假设你在设计一个视频直播应用，希望用一套有损编码方案来减少需要向互联上传的包。

你可以用H．264这样现成的编码解码器，但是H．264并不是最理想的解决方案，因为它是为通用视频校准的，也就是从猫咪视频到故事片都能用。改用为FaceTime视频而校准的编解码器可能会更好，因为当我们利用了“屏幕中间总是有张脸”这一点，能省下更多流量。

然而，设计一个这样的编码方案是有难度的。我们要怎样说明脸在什么位置，视频对象有多少根眉毛、眼睛是什么颜色、下巴是什么形状等等特征？如果头发挡住了眉毛怎么办？图像中没有脸或者有多个人的脸怎么办？

这时候，深度学习就派上用场了。自动编码器是一种神经络，只是它的输出和输入数据一样而已。学习这个“恒等映射（identity mapping）”之所以重要，是因为这个自动编码器的隐藏层神经络比输入层要小。这个“信息瓶颈”迫使自动编码器在隐藏层中学习一种数据的压缩表示（compressed representation），这种压缩表示还将被神经络的其它层解码回原始形态。

通过端到端的训练，自动编码器等深度学习技术可以适应你数据的细微差别。不同于主成分分析法（PCA），编解码步骤不受（线性）仿射变换的限制。PCA学习的是一种“编码线性变换”，自动编码器学习的是“编码程序”。

这让神经络更加强大，能用于更复杂的、特定领域的压缩，从在Facebook上存大量自拍到加载速度更快的YouTube视频，科学数据压缩再到降低你个人iTunes资料库所占的空间，都能用上这种技术。设想一下，假如你的iTunes资料库为了让你的音乐少占一点空间，它可能专门学习一种“乡村歌曲编码器”哦！

压缩感知

压缩感知和有损压缩的解码方面紧密相关。很多有趣的信号都有特定的结构，也就是说，信号的分布并不完全是任意的。这说明实际上，我们不需要为了获取信号的完美重建而在奈奎斯特极限采样，只要我们的解码算法可以正确地找出它的结构。

1234下一页>

吴忠白癜病医院
衡水治疗白癜风医院
广元白癜风治疗费用

下一页：区纪委开展一级廉政风险岗位抽查审计工作调研
上一页：武汉部署反腐败协调和追逃追赃工作调研