网络遇见机器学习-第三届未来网络发展大会

当前位置：嘉宾致词> > 分论坛二

网络遇见机器学习

发布时间：2019.05.24 编辑：共浏览：730次

今天上午最辛苦是演讲的嘉宾是站在后面聆听的听众。今天要讨论好像人工智能非常热闹，热闹都有哪些东西呢？无论这些东西包括谷歌工程师帮助拉萨发明新的太阳系，跟我们今天在座人有什么关系，我今天做网络方向，我今天叫未来网络的论坛，看着人家领域很热闹我们今天有没有关系呢？我今天把我自己遇到很多困惑或者是很多弯路能够和大家一起分享一下，希望大家少走弯路。

在这些弯路当中我们看到人工智能活起来当然是阿尔法狗活起来，可是这个完了之后叫阿尔法狗（英文），我干嘛学习人类手下败将呢？我要自己跟自己博弈一下，于是自己跟自己博弈，再找谁练呢？我只好找前辈，转眼间把阿尔法狗灭掉了，究竟我们人工智能学习是数据重要还是算法和算例重要呢？也许这个数据可能并不是我们想象唯一的重要东西。

当然我们在座的今天，大家可能对这东西也不感兴趣，反正我们也不下棋，我们各种各样棋都不下，我们喜欢搓搓麻将、打打牌，你能看到对方手里的牌吗？如果看不到我们人工智能还能搞定吗？我们CMU做设计，打扑克的时候好像把人类的冠军打败了，最近2016年还有比较火热的东西，像右面的猫是真实世界猫的照片吗？这里当然不是，是根据猫的轮廓由电脑产生漂亮的美女猫，这样一个美女猫跟在座有什么关系吗？我们是做网络的，可是我们想想最近网络上特别火热包括小视频，还有美女主持人又唱又跳为了干嘛，为了赚钱。

打赏之后主持人当然笑笑，主持人冲你笑是真的笑还是假的笑，也许主持人按键盘一级笑、二级笑给你传口令，我们美女猫产生了美女主持人笑的表情，你知道美女主持人是真的美女主持人还是崔老师，崔老师研究一下明星的照片、家人的照片合成一个最喜欢的美女，你天天打赏我天天坐在后面数钱就可以，我们做网络研究有什么关系呢？我们一会儿来看一下，我们做系统要支撑上层的应用包括机器学习应用，我们发现谷歌的阿尔法狗还能用谷歌电源的机房管理，电源管理，好像对系统也能支持，用我们机器学习如何对系统的优化能够帮助呢？这是我们要干的事。

以前我们说自己想法设法编一个所谓的算法，（英文）拿着数据计算机捣鼓出来一个（英文），后来发现（英文）设计不出来，怎么办？我们有了机器学习，我们拿（英文）的数据，然后到计算机捣鼓出来一个算法，拿着算法平常来做一做就是我们的机器学习，很简单，我们发现我们经常没有这些（英文）的数据，怎么办呢？很好，机器学习领域的人告诉我们，我们可以采用非间学习，包括各种学习来解决这样的问题，甚至我们在网络当中，我们说数据多了，造成什么结果？网络拥塞的话，这是一种反馈，跟环境相关的怎么办呢？有了强化学习和环境再进一步互动起来之后，再能够产生一个与环境相关的我们算法，这就是我们机器学习要做的事。

对机器学习了解之后，我们再来看究竟网络里遇到什么问题呢？刚才几位嘉宾说了，网络建模准不准确呢？我们有多大意义呢？所以我们网络里面各种建模，各种测量准确吗？我们RTT测准不准确，我相信RTT，我跟很多聊天人RTT最不准确的东西，我们过去之后200毫秒包没回来，你告诉包是丢了还是网络延迟200毫秒，你不知道，RTT的量都测不准怎么做？很多量测不准的情况下是不是，管不管用呢？现在有了新的想法说，我们是不是有可能用机器学习解决这些的问题，甚至有很多叫灰色计算，灰色故障。

什么意思？我们人有亚健康状态，是健康还是生命呢？反正不治的话、不管的话一个月、两个月真的生病了，我们有没有亚健康状态呢？我们一个设备坏了之后我5秒钟切换过去，可是我满意吗？我能不能坏之前就知道坏，如果能做到这一点，我们回顾的计算会有很大的帮助。

以前在分类、预测、决策等等方面我们都已经有不少的研究，大家其实这个东西这页PPT有点老了，我们2018年、2019年出来很多相关的研究，最近有一个会议叫（英文），这也是A类会议的（英文），然后发现我负责的几篇文章全部都是用机器学习来解决媒体传输的，所以这样的列表有意义吗？我觉得好像没意义了，我去年发现（英文），（英文）很多跟机器学习相关的，（英文）掌握的文章，包括还有（英文），很显然AI，是（英文）历史上首次在一个（英文）上面注册的人数突破100人，所以看来AI已经像一个基本的数学方法一样用在各行各业包括网络呢？网络里面怎么用呢？我随便找了几个很基础的问题，包括PCP，流媒体或者是网络拓扑管理等等，我找这篇文章我惊喜发现这些来源于学校，当然还有两个比较（英文）的学校，一个是清华大学一个是UIUC，好像牛人都在干这样的问题。

我也在想我们究竟能做什么事情呢？当然这里面别人的都是没有经验，我更多是教训，首先来看最早的文章，这是（英文）他在（英文）读博士的时候做的工作，我们整天研究TCP，你目标干什么，就是更好适用于网络，你TCP窗口大大小小烦人不烦人，我们做路由器知道有什么表？转发表，一查知道我把哪个接口扔出去。

我们TCP的窗口大小能不能按照路由表方式做，来一个TCP现在网络环境大家占一大片，所以我们也发，这样不就简单吗？他很简单用TCP打表的方法，他做的思路没有太好的思路，做NF做强化训练的新学习东西，结束了人家发了文章，人家当教授了。

这时候问大家一个问题，2013年是什么年代？不要说大家读高中的年代，我们机器学习火不火，是不是火的一塌糊涂，不火，想到2013年不火，用了强化学习的思想，因为那时候没有太好强化学习的东西，看这页PPT能干什么，分分钟想一个办法，拿最新学习的强化技术重新弄一遍，很抱歉你想晚了，因为紧接着一伙人在（英文）拿着最新的发一个东西，DCP不就是窗口大点、小点，究竟什么样的工作，当然围绕这样的问题，大家还还说，模拟器上做出来的东西能一样吗？不一样，鬼知道差异有多少，但是总是觉得真实环境有难度，所以自然有一个更苦一点的人，UIUC的教授，我们真实环境上干，无非就是高高低低了TCP的贪色，于是就这样看一看，这是环境上一个NSTR，也列为A类了，跟（英文）齐名非常难的。

高高低低的探测，（英文）多少？过高算高，多低算低呢？也是有一个难度，就解决探测多长，基于学习，它不仅是UIUC的教授，他是（英文）获得者，所以围绕这个问题我们看到，是不是我们TCP传统的研究又回来了呢？恐怕有点这样的意思，不光这样的研究，包括我们流媒体这么热闹，网络传输最重要的东西就是流媒体，我用户拿着手机下载一个流媒体看，能够连哪个CD，我是哪个运营商会，我在4G还是5G，什么网络下一大堆的参数，你写出办法算算连哪个运营商，哪个最好，这件事情搞不明白了。

实在想不出办法拿机器学习，发现有那么多的参数，特征空间可能太大，这怎么办呢？用一个复杂的模型表达你复杂的特征，但是复杂模型有什么问题呢？当然计算太慢了，网络的条件千变万化，你计算太慢也不太行，我干脆找一找关键特征，我不用那么多特征学习，我手机是安卓还是苹果，这都是所谓的特征，这些特征究竟哪些是影响我下载情况的一些关键特征呢？关键特征是变化非常慢的，我可以使用特别几个关键特征学出来，非常稳定、非常有效的效果。比如我打微信视频电话的时候，电话稳定吗？干脆用增强学习，增强学习大家知道探索+利用，一个直接的问题，你在线增强学习你乱探索，我们要通话，到美国试试效果很差，用户打电话开始投诉你。

你在线增强学习，直接问题是我敢不敢乱探索，我效果差了用户就离开我，用别的软件，我们要用足够强的信息我用探索也比较好的区域探索，争取找到更好的结果，而不是一下一不小心到很差的结果。

流媒体传输优化这个东西大家想到很多，我们本地有一个缓存，我们有一个（英文）不断的消化，可是希望什么呢？希望说我始终能够看下去，又快下去，我视频源没有过来我就卡住了，之前不希望卡住，网络高高低低的传输带宽不断变化，我怎么知道每一个时间怎么设置呢？到底是高清还是低清，我网络变化怎么样呢？否则一定会被卡住，否则我总是很低清的，围绕这样的问题怎么办呢？同样MIT最近也有一篇新的文章，他们用深度强化学习解决这问题。

深度强化学习这里面我们特别有意思的一点发现就是，你看（英文）动作空间是什么呢？就是四个码率的选择，这件事很简单了，他用中央大脑解决这样的问题，但是在这里面我们也看到一些新的东西，比如说不管黑猫白猫抓着耗子就是好猫，这跟我们传统的视频压缩有什么关系？感知到底是什么？都不是，它是基于两端的内容的理解对视频进行压缩，闭着眼睛都能想象黑猫什么样子，这跟传统的压缩方式截然不同。

围绕这样一个新的变化，我们可以应用刚才生成对抗网络，一个美女猫我们能干什么，你视频不断的传输，我能不能传过240的东西，你希望看高清版，我能不能基于生成对抗网络，把240的版本在本地生成1080的高清版本，我能实时生成这个东西，当然对战好了，我能不能美女主持人做在线的生成，我在网络不好的时候传一些东西让你在本地变成高清的版本能看到，这也是一个可能性。

当然在网络测量，网络管理可以有生成对抗网络，我们想知道网络图哪个地方拥塞，你需要多少个探侦，一百个探侦、一万个探针都不够，我基于一百个探侦我想方设法恢复出来一百万个探侦出来的结果，给出一个轮廓想方设法一个美女猫，我能不能低清的图片生成高清的图片，这不是图片了，而是低清网络测量的结果，能不能生成高清网络结果呢？

不光这个东西，最近云计算特别火热，这也是我学生做的工作，他说数据中心现在拓扑结构很多，他说新的拓扑结果干什么呢？我们传输各种各样的流量，我们发现一个问题是什么问题？我们是动态的流量了，数据中心网络是不是静态网络，再进一步流量是不对称的流量，我们网络统统是对称的网络，我们是不是有可能让我们的网络自动变化呢？针对流量需求最佳拓扑结构是什么结构，我可以把我的高频无线改造成实时的结果，可是怎么算出来最佳拓扑结构呢？发现给的流量很难实现，怎么解决这个问题，我们发现世界上根本不这样的样本，既然不存在这样的样本结果怎么办？我们只好想办法生成这样一个样本，这里面其实时间关系我们就跳一跳。

这个论文发在（英文），血泪教训是一大把的及我们可以看看我们的论文，真正机器学习用的时候真的有很多教训，时间关系我对于机器学习如何网络应用，我们自己稍微有一点总结，这个总结我们也跳过，大家时间关系我们就直接来看重点的最后一个小总结。

大家感兴趣可以扫二维码，我认为我们最核心要从我们的灰色地带或者是究竟我们要解决什么问题出发，而不是上来想我拿机器学习打着幌子，有些人告诉我现在招机器学习的工程师一招一大把，没有人说自己没有机器学习，我们想让人了解一些系统好像招不到，所以怎么办？我们不是转机器学习，而是我们要在我们对系统深入了解的情况下，如果需要的话拿机器学习小试牛刀也就解决了。

我们这里做两个小广告。一个是我们的竞赛，最后是（英文）第一次在大陆地区召开在北京，今年的夏天。

我的汇报是这些，谢谢大家。