围棋阿尔法狗狗会不会毁了围棋

黑爪:DeepMind研制阿尔法狗的使命,当然不是要下赢围棋
我的图书馆
黑爪:DeepMind研制阿尔法狗的使命,当然不是要下赢围棋
文 | 黑爪这几天我一直在围观人们的反应,最想不明白的一点,其实是人们究竟怎么开始把机器与人类放到对立的两面?围棋是艺术,阿尔法狗是技术,它如何就会毁了围棋呢?棋手们自己不是也说“(现在下棋)或多或少都会受到阿老师的影响吧,下棋会让人感到更自由一些,没有什么招法是完全不能下的”(周睿羊,DeepMind博客视频),“阿尔法狗带给我们很多的新东西。现在呢,大家更多地去尝试以前都没有下过的各种下法”(时越,DeepMind博客视频)棋手们的意思难道不是说,AI促使人类棋手更加强大,更乐于创新吗?而对于人工智能科学家而言,阿尔法狗的使命,更不是要在围棋赛中打败人类。他们之所以让机器与顶尖的人类棋手互动,意在为“狗”提供一个不能用其他方式替代的学习环境。DeepMind创始人哈萨比斯自己在很多公开场合就不止一次地说过,是为了发现潜藏的通用知识(general knowledge)。“狗”,其实是一个通用智能体。把DM的使命说得更冠冕堂皇些,何尝不是人类对自身的进一步探索?正如物理学家费曼教授那句留在黑板上的著名遗言,“我所不能创造的,都是我没有真正懂得的”(What I cannot create, I do not understand),如果世界在人们眼里是由外部世界和内心世界两部分组成的话,也许“内心”世界更加根本,因为外部世界的存在状态,根本还是取决于我们大脑对它的解释。这便是人工智能最引人入胜的地方:借助于建造它来更好地了解我们自己,理解这个世界。▲&DeepMind创始人哈萨比斯DeepMind所致力建造的这一类AI,有个名字,叫“受神经学启发的AI”(neuralscience-inspired AI)。别忘了哈萨比斯本人就是伦敦大学学院的认知神经学博士,DM对人类身上最感兴趣的部位叫做海马体(Hippocampus)。按维基的说法:海马体是人类及脊椎动物脑中的重要部分,位于大脑皮质下方,担当着关于短期记忆、长期记忆,以及空间定位的作用。在阿兹海默病中,海马体是首先受到损伤的区域:表现症状为记忆力衰退以及方向知觉的丧失。大脑缺氧(缺氧症)以及脑炎等也可导致海马损伤。平常我们开玩笑时爱说的“老痴”或“脑残”都跟这个海马体相关。我们需要记住,DM的AI有两个关键词,一是通用,一是学习。他们所有的算法都从元数据开始进行自主学习,从而掌握某项任务,这与预编程的人工智能有本质的不一样。此外,DM还强调,他们希望所有的系统能够通用,也就是说,希望同一个系统,或同一套算法可以有跨领域的广泛应用。公众所熟知的赢了国际象棋的IBM传奇深蓝,以及近年来的沃森系统,它们都仍然属于窄AI范畴,也就是说,它们是为了解决某个特定问题量身打造的AI,因而只能解决那一类问题。而阿尔法狗这一类DM的AI,事实上则可以被叫做“通用人工智能”AGI(Artificial General Intelligence),目标既不针对特定任务,也无涉预编程。这就引出了眼下被热议的“强化学习”技术(reinforcement learning)。描述强化学习其实非常简单,它有个一目了然的框架,框架内有两个内容:系统和环境。这里的“系统”就是我们说的AI,而它会发现自己处于某个“环境”当中,要达成某项目标。“系统”与“环境”之间进行双向交流:首先,它通过其感知仪器来对“环境”进行观察,在DM的学习过程中,通常使用的是视觉,也就是说,“系统”观察到的就是像素。这些观察结果往往有很多“噪音”,并且信息不完整,因为现实世界本身就十分混乱,充满干扰,而且永远不可能对一件事获得真正完整的信息。“系统”的任务,便是要在这样的混乱条件下,创建一个可能的、最好的统计模型;这个最好的模型一旦建立,第二项任务,便是在当前的时间点上可供选择的一系列行为中,选出最好的一个,向目标靠近。而一旦“系统”确定了某一个行为是最佳之后,“系统”随即将这个行为作为输出,并得以执行。其结果,有可能会,也有可能不会,对当前的“环境”带来任何改变。但无论如何,它都成为新一轮观察的驱动。所以这个“系统”尽管表面上看,可以通过这样一个简单的框架图形来描述,但它事实上隐藏了很多的复杂性。解决了隐藏其后的复杂性,其实就拥有了足够的智能来进行几乎一切学习。我们认同这个观点,因为我们知道,包括人在内的所有脊椎动物,都是这样来学习的。人类大脑中,完成这一“强化学习”过程的是多巴胺系统。了解了创造出阿尔法狗的DM公司的通用智能使命,以及这一通用智能的学习原理之后,不难看出,各类游戏其实都是其算法的绝佳测试平台。一两年前连线杂志 “Wired” 就有过长文报道,DM最初使用经典的80年代雅达利游戏(Atari )来测试他们的算法。当AI在玩雅达利时,它所获得的输入没有别的,就是纯粹的像素,完全就像人在看着屏幕学,屏幕尺寸大概是200*150,所以它所得到的就是每帧3万个点,目的也很简单,一切从头琢磨自学,为了拿高分。在基本的学习能力具备后,再通过模拟海马体的工作原理,来为智能体增加能力,例如学习抽象概念,以及增进长期记忆。如果说AI是在利用包括棋类在内的游戏来作为测试平台,达到提升功力的目的的话,它真正的目标可能更多地在于帮助人类完成更加关键的工作,例如与预测相关的医疗、气候、能源、宏观经济等应用。这样一来,人工智能技术可以毫无疑问地被认为是眼下最重要的技术之一,更可能正是潜在的“元解决方案”(meta-solution),可以协助人类解决所有的其它问题。提到“元解决方案”,不可避免的是与之相伴的伦理讨论。在科幻作品、断章取义的名人演说、鸡毛令箭的媒体报道的共同作用下,AI所获得的伦理关注尤其热闹。但是它与任何强大的新技术无异,技术本身是中立的,决定它是否符合伦理的,永远是掌握技术的人。在此过程中,公众、媒体、研究机构(企业)以及政府几方的透明,对每一步的监管都因此变得至关重要。阿尔法狗的创造者的使命是要将世界的信息组织起来,让它更好地为全世界共享,换句话说,就是利用 AI或者AGI 来自动将无序的信息转化为知识,从而利用这些知识使人类更加强大。因此,与世界最优秀的人工智能专家一起,挖掘出暗藏在围棋这一古老游戏后面的智慧,促成技术的进步,这应当是乌镇比武会上所有人的胜利吧。原标题:DeepMind的使命不是要下赢围棋【作者简介】&
馆藏&91730
TA的最新馆藏
喜欢该文的人也喜欢“阿尔法狗”如何学下围棋?谷歌:它会不断练习深度思考_网罗天下_腾讯视频“阿尔法狗Plus”横扫围棋界引发恐慌,人工智能会主宰体育么
近日,一名代号为“MASTER”的神秘围棋大咖红遍网络。“MASTER”横扫柯洁、陈耀烨、常昊等中日韩三国围棋超一流高手,竟然取得了惊人的60连胜。“MATSER”到底是何方神圣?一时间众说纷纭。最后,还是谷歌揭开了谜底:原来“MASTER”就是升级版的AlphaGo,俗称“阿尔法狗”,一款围棋人工智能程序。2016年,第一代“阿尔法狗”4-1大胜韩国围棋名将李世石九段,已经引起了全世界的广泛关注;如今,“AlphaGo Plus”碾压围棋界再度让人们感到了担忧。既然人工智能程序能够战胜围棋选手,其他体育项目如国际象棋同样可以获胜。未来,人工智能会不会取代人类成为体育的主宰?
20年前计算机深蓝大战卡斯帕罗夫
20年前,一台名叫“深蓝”的计算机首次让人类和机器进行比赛,这就是著名的“人机大战”。1996年,国际象棋棋王卡斯帕罗夫和计算机“深蓝”进行了六局比赛。结果,卡斯帕罗夫4-2获胜,“人机大战”以人类的获胜落下帷幕。可惜,卡斯帕罗夫并没有笑到最后。一年后,棋王再次挑战深蓝,结果只取得了1胜3平2负的成绩,总成绩2.5:3.5落败,这次计算机战胜了人类。20年前,互联网刚刚兴起,“深蓝”其实是一台带有31个处理器并行的超级计算机。据说,深蓝3分钟内可以检索出500亿步棋。可是,它毕竟只是一台机器,不能独立思考,不能总结经验,和“阿尔法狗”有着本质区别。
李世石挑战阿尔法狗1-4惨败
20年后,计算机软硬件发展有了质的飞跃,互联网已经渗透到了我们生活的每个角落,云计算、大数据等名词已经不再陌生。虽然“阿尔法狗”只是一台围棋机器人,但是它却有人类的“大脑”,能够独立思考、自主学习,不断提升棋力。连续战胜围棋高手,再次让人感受到了人工智能的神奇。那么,人工智能可以在围棋、国际象棋这些智力项目中战胜人类,在其他项目中有没有战胜人类的可能?答案是肯定的。不过,人工智能毕竟是人类发明的,可以在战胜人类却永远不会取代人类。人机大战的胜利,与其说是“阿尔法狗”的胜利,不如说是人类科技的胜利。
人机大战还会继续下去
对于像围棋、象棋、国际象棋这些规则清晰的游戏来说,计算机都可以战胜人类;而在一些没有明确规则或者未知的领域,计算机还难以超越人类。设想一下,让11台了安装了人工智能程序的机器人和人类一起踢足球,很可能会惨败而归。都说科技以人为本,将来人工智能将会被广泛应用到生产、教育、医疗等领域,当然也包括体育。在训练、康复、科研等方面,人工智能都可以助我们一臂之力。所以,人工智能不是洪水猛兽,更不可能成为体育的“终结者”。
国际足联在世界杯比赛中引入了门线技术,由此判定皮球是否越过了球门线,从而判断进球是否有效。不过,国际足联却一直拒绝进行现场大屏幕录像回放,尽管这样可以彻底杜绝误判和漏断,但却让足球比赛失去了精彩和悬念。裁判同样是比赛的一部分,既然是人就会犯错,就会出现各种误判,这才有了足球比赛的悲欢离合。有时候,误判也是一种美。体育的竞争,归根到底还是人与人的竞争,科技,只能是辅助手段,却不能成为体育的主宰。
责任编辑:
声明:本文由入驻搜狐号的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。
今日搜狐热点&&>&&&&>&&
“阿尔法狗”打开了潘多拉魔盒?  来源:中国信息产业网-人民邮电报  作者:郭川
在首场对抗中,AlphaGo执白以1/4子的优势战胜目前排名世界第一的中国棋手柯洁。
人工智能可能是人类历史上最大的事件,而不幸的是,也可能是最后一个大事件——史蒂芬·霍金。
5月23日,“世界围棋第一人”柯洁迎来与阿尔法围棋(AlphaGo)的第一场巅峰对决。很遗憾人类大师再一次输给了人工智能。毫无疑问,AlphaGo已经征服了围棋这一项被誉为“人类最复杂的智力游戏”。人工智能现在赢了人类,未来会统治甚至摧毁人类吗?“潘多拉的魔盒”是不是已经被悄悄打开了?
AlphaGo现在有多“恐怖”?在5月23日输掉第一局后,柯洁直言:“感觉AlphaGo和去年判若两‘人’,当时觉得他的棋很接近人,现在感觉越来越像围棋上帝。”要知道一年之前,当AlphaGo以4∶1的大比分完胜韩国围棋大师李世石时,柯洁还非常自信地表示:“就算阿法狗战胜了李世石,但它赢不了我。”被誉为“棋圣”的聂卫平在赛后点评道,AlphaGo与柯洁已经不是一个档次的“棋手”了,棋局刚开始不久AlphaGo就全面压制住了柯洁。
围棋因其特性曾被当作人类与电脑在智力游戏领域对抗的最后一道防线。1997年,IBM的超级计算机“深蓝II”击败了国际象棋大师加里·卡斯帕罗夫,给人们带来极大的冲击,但当时人们还没有“绝望”——“我们还有围棋”。围棋是一项具有3000多年历史的古老的智力游戏,它虽然规则简单但变化莫测,在19×19的格子棋盘上,棋手的每一步都有可能影响整盘棋局。英国围棋联盟裁判托比表示:“围棋是世界上最为复杂的智力游戏,它简单的规则反而加深了棋局的复杂性。”“刚刚上手时,你会觉得围棋的规则简单易懂,但在长期的练习中你会发现这项游戏深不可测。即使你已经在围棋界打拼了几十年,你依然会发现自己还有许多东西可学,围棋棋艺是没有天花板的。”韩国围棋协会高级秘书长李夏辰如是说。
于是围棋很自然地成为人工智能攻坚的目标。AlphaGo的横空出世让骄傲的人类再一次折戟。2016年3月,谷歌旗下的DeepMind公司推出的AlphaGo“完胜”韩国围棋大师李世石;2016年年底至2017年年初,一个网名为Master的神秘围棋选手在网络对战中横扫中日韩三国的围棋高手(其中不乏柯洁、古力和朴廷桓等围棋大师),战绩是“60胜0负”,后来经证实这个Master就是AlphaGo的2.0版本。实际上,在此次柯洁与AlphaGo对战之前,几乎所有人包括柯洁自己都认为人类毫无胜算。
关键词:AlphaGo 谷歌 人工智能 阿尔法 棋手 潘多拉魔盒 自学能力 棋圣 恐怖 比分 1阿尔法狗会不会成为股市终结者?
阿尔法狗战胜围棋圣手李世石,让很多人开始心中发抖。
人工智能是否真像美国大片中那样,全民公敌即将主宰人类?
但可见的范围内,最该发抖的却是中小股民,人工智能正在成为交易杀手。
交易的本质就是用微弱优势,通过提高频率或者放大资金实现绝对收益。
而微弱优势的内含可以解构成两部分,其一是分析层面,正确的次数比错误的次数多;其二是执行层面,做对的时候赚的比做错的时候亏的多。
对于一个稍微研究过市场的人就会发现,做到前一条并不困难,只要你对某一种技术足够熟悉,深解其中内含,判断正确的概率肯定可以超过50%,以笔者的经验,做到75%左右也不稀奇。
但难在第二条,其中暗含着两道门槛,其一是资金管理的技巧,其二是情绪管理的强弱,最重要的还是心理因素、情绪控制。
举个很简单的例子,在资金管理中有一个非常有效的法则就是亏损时不加仓,浮赢再加仓,这样才能效率最大化,但笔者二十多年的经验里,一直很难克服这一误区,看到市价低于成本,通常都按捺不住补仓的冲动,看到涨过成本区,感觉太贵了,没有买到便宜货,死活不愿意再追,就这样一个误区就足以把你的交易毁得一败涂地,结果就是永远为扳平翻本而努力,无法进入放手赢钱的境界。您可能是相反的问题,但结果相信不遑多让。
这其中的关键就是心理惯性,巴菲特说他做股票时也有贪婪恐惧,所不同的是,他在大家贪婪的时候恐惧,在大众恐惧时贪婪,而绝大多数人正好相反,心理非常容易受到大众影响,结果对应的交易行为就是买在最高点,卖在最低点。
有人也试图制定交易的三大纪律八项注意,像持戒一样来控制自己,称之为铁血原则,但人心还是肉长的,面对现实的时候,真想铁了心是非常不容易的,于是就弹性大发,把制定好的交易计划执行得七零八落。
前述问题其实正是交易中的最核心问题,可以说是胜负手,常常困扰交易者一生。
二十年前在一上市公司负责投资,有三个操盘手来配合,其中一个是复旦大学的高材生,脑筯极其聪明,每次盘后制定好的交易策略,第二天开盘后,他都难免临场改动,而累积下来看,临场发挥综合结果肯定不如谋定后动,事后他也会检讨,恨不得剁掉自己的手,他形容说,面对市场,仿佛有一种魔力在控制着他的手。
从那时起,一直思考这一问题,直到八年前开始研究程序化交易才看到一点希望。
否则,如果这个问题不解决,经典如利弗莫尔,最后也难免饮弹自尽。
一个成功的交易包括分析与执行两个层面。
如前所述,分析并不特别困难,我是说找到一种适合自己的赢利模式,不是彻底战胜市场;执行本来更容易,但却常常毁在心理与情绪上面,变成了人类难以逾越的高峰。
但把这两者加到一起,你就可以发现,交易这件事情机器比人更合适。
人工智能恰好可以继承人类的优势同时杜绝人性的弱点。
把一套成熟的分析系统转换成计算机语言,在前几年可能还有很多程序上的不足,对于普通交易者比较困难;而随着人工智能研发深入,以及阿尔法狗爸爸蒂姆伯纳斯李这样的天才科学家以及谷歌公司推动,未来将不再是难事。
以笔者多年经验,不论是模式识别还是形态分析,虽然市场也是动态变化的,但并不比围棋之道更复杂。
中间所差的只是围棋有传承两千年的图谱,而交易却没有足够长的历史以及足够多堪为定量的形态,这一行业正处在研发成长之中。
其实此前已经有很多机构与个人去尝试,程序化交易已经有超过二十年的历史,比如美国纳指期货里有半数成交量都是程序完成,国内也有跟进多年,比如光大乌龙指就与程序交易有关,特别是在股指期货领域,重大转市时的峰谷值通常都是程序交易打出来的,令到市场看起来更惊心动魄,所以,去年救市时对这一块做了政策限制,阻碍了国内这方面的发展。
到目前为止,因为这种程序交易都近乎黑箱操作,闷声发财,所以,外界所知有限,公开可见的是胡润富豪榜排到第62位的詹姆斯西蒙斯,全美富豪榜上排名29。他的财富就是全部靠计算机量化投资实现的。
此公绝对是百年难遇的学神,23岁就获得加州大学伯克利分校的数学博士学位,然后同时在哈佛麻省任教,30岁就任数学研究院院长,曾经与中国著名的数学家陈省身共事,共同发明陈--西蒙斯定理。
1982年,西蒙斯用这颗顶级聪明脑袋创办文艺复兴科技公司,开始转做商品期货与金融投资,结果二十多年时间里,他开发了许多数学模型用来进行分析和交易,基本上是自动化完成,从而很轻松的交易并获利。到前几年他退休时,公司规模超过330亿美元。
他操盘的大奖章基金平均年回报率高达35%,较同期标普500指数年均回报率高20多个百分点,比“金融大鳄”索罗斯和“股神”巴菲特的操盘表现都高出10余个百分点。即便是在次贷危机爆发的2007年,该基金的回报率仍高达85%。
当阿尔法狗在全世界开始狂吠的时候,基本上意味着过去西蒙斯小众操作的量化交易即将开始进入泛滥时代,会有越来越多的更加成熟的模型、算法出现,越来越多的量化产品面世,对于中小股民来说,很多时候,您面对的对手将会越来越多的都是机器不是人,他们可以不吃不喝地工作,可以不喜不忧地执行,可以不眠不休地计算,且不说我们还达到不顶级的大脑,仅仅拼体力就无法与计算机相比,您觉着自己有胜算几何?
当然,聪明的您可能已经看出来了,西蒙斯并没有让巴菲特下课,似乎结果还是可以并存的。
不错,但要记住两点:
首先巴菲特是长线价值投资者,您是吗?您愿意是吗?这是一个问题,如果真是的话,阿尔法狗基本上咬不着你,老子认准万科老王,死抱二十年,狼也拿你没辙。
其次还要有巴菲特的心态,能在别人贪婪时恐惧,在别人恐惧时贪婪,这样才不至于中途下车,被振出局。
如果做不到这两点,还是在意眼前的得失,追涨杀跌,那根本上您还是一个交易者而不是投资者,那您必须从现在开始好好检讨一下,以免成为未来的狗粮,因为股市里的阿尔法狗专门猎杀交易者。
笔者自己想想都很怕,因为价值投资对于我等小散其实更难,大量的深度调研不太容易个体完成,从一开始咱就与专家团队不在同一起跑线上,所以,做技术交易竞争会更公平一些。
但目前的阿尔法狗势必向股市扑来,最后的公平也在倾斜,未来如何拥抱它,如何适应它,是摆在交易者面前一个很现实的课题。
大宗(现货)商品行情技术分析,投资方案解读解析微信交流:
责任编辑:
声明:本文由入驻搜狐号的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。
今日搜狐热点

我要回帖

更多关于 阿尔法狗围棋大赛 的文章

 

随机推荐