第二天一早。
江寒吃过早饭后,带着夏雨菲出门,直奔高新区。
来到大江和星空驻地之后,先和夏如冰见了一面。
目前,大江和星空这两家企业,都运转得十分不错。
星空已经实现了盈利,仅仅卖“坏苹果”的授权,就已经有了几个亿的净收入。
而且,后续还有好多大公司,在排队等着洽谈合作。
江寒看完账目,十分开心:“小姨辛苦了。”
夏如冰嫣然一笑:“我辛苦什么?不过是跑跑腿、磨磨嘴皮子……”
江寒思考了一下,问:“小姨,咱们星空现在最多能抽调多少资金?”
夏如冰不假思索:“三个亿绝对没问题。”
这是实话,以专利为主的科技公司,对于资金链本就不怎么倚重。
江寒欣然一笑:“3亿吗?差不多也够了……这样吧,您抽点时间,帮我跟世界上几家主要的超算制造商联系一下,买一套好一点的超级计算机。”
“地下室那么多服务器还不够用吗?”夏如冰好奇地问。
江寒微微一笑:“那才多少点算力?没有2~3个PFlops,怎么玩大数据?”
“那……咱们按照天河一号的指标买?”
江寒点了点头:“能买到当然好了,但咱们这点钱,我估计可能不太够……”
我国的“天河一号”超级计算机,曾经有差不多整整一年,保持了世界第一的排名。
即使在2013年初,仍能排进世界前三。
虽然有着4000多千瓦的恐怖功率,不过运算速度那是真的快!
要说江寒对其不眼馋,那当然是骗人的,只可惜,手里这点钱……
他现在很需要一台超算。
否则就算把阿法狗的算法开发出来,也没法得到“合法”的训练数据。
总不能用虚拟空间里的超算,来训练阿法狗吧?
就算得到了网络模型,又怎么解释来源?
安排完这件事之后,江寒又去看了下大江。
《绝地求生》的开发进度相当喜人,甚至已经可以跑图了。
无人机那边也进展顺利,估计再有两个月就能看到样品。
中文手写识别的核心算法,目前苹果公司等国内外厂商,都已经派人前来接触过了。
这些合作谈下来,肯定又是一笔笔源源不断的财富。
OCR软件的销售情况,也还不错,至少对得起它的品质和近乎垄断的地位。
老江气色也比之前好多了,江寒暗暗猜想,他和夏如虹的好事,也许快要成了?
这天回家之后,江寒就开始着手设计阿法狗算法。
一连花了好几天,总算弄出了一个大概。
当年他对于阿法狗,那也是相当感兴趣的。
毕竟这种既有趣又牛掰的玩意,放眼整个世界也并不多见。
当年他着实看了不少相关的报道和分析文章,虽然没读过DeepMind的原始论文,但阿法狗中到底用了哪些手段,大概还是有点印象的。
初代阿法狗的算法,其实相当简单,主要包括三大部分。
首先,通过输入人类的棋谱,使其得到“基本”的围棋知识;
然后,运用强化学习技术,使其在战斗中,自主提高棋力。
最后,通过蒙特卡洛算法,减少计算压力,提高可行性。
没搞过围棋算法的人,通常会很自然地设想:只要穷举每一种落子的可能性,不就可以了吗?
没错,当年击败了小卡的“深蓝”计算机,就是这么干的。
可那是国际象棋,围棋的复杂度要高多了。
围棋有19行、19列,一共381个交叉点,所以总的状态空间,就是3的361次方!
即使去掉一些不合法的状态,其复杂度也将达到2x10^170!
要知道,整个可观测宇宙中的原子总数,也不过才10^80个……
所以,围棋程序是无法穷举的。
就算把全世界的电脑都用上,也不可能在有限时间内算出答案。
同时,保存所有状态所需要的存储空间,也是现实中绝对无法满足的。
时间、空间的复杂度,和有限的算力之间,存在着深刻而突出的矛盾。
为了解决这个矛盾,阿法狗的原始研发团队,找到了一个巧妙的办法。
那就是将卷积神经网络,和蒙特卡洛树搜索算法,结合到一起!
他们分别实现了策略网络和价值网络,同时还训练了一个简化版的策略网络,用于快速走子,供蒙特卡洛树使用。
类比人类的思考和认知模式,策略网络就相当于大脑中负责深度思考的部分;而快速走子,则相当于大脑中,负责迅速感知的那个部分。
所有有人说,阿法狗是一个兼具了逻辑和直觉的伟大算法,可以让计算机真正理解围棋,“学会”下棋!
而不再仅仅是对人类棋手的拙劣模仿,更不是一般人以为的那样,只是利用超级算力欺负人……
江寒很快就理清了思路,然而要想设计出能力接近原版的阿法狗,并非一朝一夕之功。
本小章还未完,请点击下一页继续阅读后面精彩内容!