一、什么是AlphaGo
阿爾法圍棋(AlphaGo)是一款圍棋人工智能程序,由位于英國倫敦的谷歌(Google)旗下DeepMind公司的戴維·西爾弗、艾佳·黃和杰米斯·哈薩比斯與他們的團隊開發,這個程序利用“價值網絡”去計算局面,用“策略網絡”去選擇下子。
2015年10月阿爾法圍棋以5:0完勝歐洲圍棋冠軍、職業二段選手樊麾;2016年3月9日,AlphaGo對戰圍棋冠軍李世石,最終李世石投子認輸;3月10日,“圍棋人機大戰”第二局在韓國首爾的四季酒店開賽,結果阿爾法電腦執黑戰勝李世石,五番棋2-0領先;3月12日,阿爾法電腦執白再次戰勝李世石,五番棋3-0領先;3月13日,李世石戰勝阿爾法電腦,比分扳成1-3;3月15日,AlphaGo戰勝李世石,總比分定格在1比4;2016年3月,阿爾法圍棋分數為3586,排名世界第二;2016年7月18日,GoRatings公布了世界圍棋排名,阿爾法圍棋排名第1;2016年7月23日,GoRatings公布了圍棋世界職業棋手排名,AlphaGo以3606分排名第二。
二、 AlphaGo工作原理
阿爾法圍棋(AlphaGo)的主要工作原理是“深度學習”。“深度學習”是指多層的人工神經網絡和訓練它的方法。一層神經網絡會把大量矩陣數字作為輸入,通過非線性激活方法取權重,再產生另一個數據集合作為輸出。這就像生物神經大腦的工作機理一樣,通過合適的矩陣數量,多層組織鏈接一起,形成神經網絡“大腦”進行精準復雜的處理,就像人們識別物體標注圖片一樣。
三、AlphaGo在金融界的發展
投資界有關智能投顧的討論越來越多,華爾街產生一股“機器人投顧”熱,這股浪潮來自硅谷的Fintech企業。事實上,在中國人工智能與資本投資相結合的初期應用已經出現一段時間了,那就是“金融科技”。經過16年A股市場的血雨腥風,金融科技再次脫穎而出,整體表現優異,多數產品跑贏大盤。
在過去三年里,風投面向消費者的金融技術投入了超過10億美元的資金,而機器人顧問吸引了其中大量的份額。
在當前的經濟形勢下。很多人不喜歡全球化,而我個人認為,全球化對世界是極好的事情。唯一的問題在于,如何對全球化加以改善,讓更多的小企業和更多的年輕人參與進來。如果我們能采取新機制或新技術,讓10億人、20億人甚至30億人做貿易,會是怎樣的情況?提出e-WTP(世界電子貿易平臺)的設想,讓小企業、年輕人在全世界自由、開放和公平地做貿易。
機器人顧問所管理的資產從2012年零點,激增到2014年底的140億美元。報告預測,在未來十年時間里,機器人顧問管理下的資產將會呈現出爆發增長的勢頭,有望達到5萬億美元。
四、AlphaGo與金融科技
金融科技,也稱為程序化交易或者量化投資,可以理解為人工智能在證券投資領域的一個子分支,或者其技術在證券投資領域的具體應用。量化投資是區別于定性投資的一種形式,關鍵點就在于策略模型的大量使用,即利用現代統計學、數學方法,借助計算機處理海量數據和信息,并嚴格按照機器所構建的數量化模型來指導投資決策,以獲得穩健的持續的投資收益,與AlphaGo有異曲同工之處。
一般來說,公募基金或大型私募的量化投資部由兩部分組成,一部分是投研團隊,另一部分是IT團隊,投研團隊提出需求,IT團隊做出算法交易的模塊,解決基金經理們的需求。1.0時代主要依靠“主信號+約束條件”的辦法。2.0時代包含信號研發、信號組合與模型構建、風險模型、組合管理等等。現階段量化投資策略開發方式為:研究組或者交易組提出思路→研究組論證,提出基本模型→模型擬合估計→回溯檢驗→小規模測試→實盤投資。
其好處在于可以克服人性,做決策時不會像人類一樣受情緒和心理因素的干擾。可同時運用多個策略模型,對全市場各種信息進行實時監控,一旦出現合適的機會,能瞬間下達交易指令。
比如CTA基金的趨向性跟蹤指標,其調整多空頭寸的臨界點是由特定計算機算法規則的,并且嗅覺靈敏,能在第一時間改變陣營,下手迅速,更善于承擔人類不喜歡的空頭角色。一般這類品種是通過量化手段不斷交易,反復進行大概率獲得正收益的策略,會設置最大回撤值,一旦到“止損線”就立刻止損,因此風險并不會太高。
再或者相對價值策略中,金融科技的程序能短時間內根據估值模型,發現海量相關聯證券中存在的的價值誤差,需找到套利機會。當判斷一種證券的價值被高估,一種證券的價值被低估的時候,通過買入低估的證券,同時賣空高估的證券直至二者的價格趨于收斂而平倉,從而獲取微小的價差收益。這類產品不會瞬間賺取大錢,熊市中這種策略對于投資者的吸引力比較大,相對比較符合穩健型投資者的需求,也是組合投資中較好的一環。
此外,還有人類無法勝任的高頻交易,幾秒一次交易,甚至超高頻的一秒內數次。
然而,量化投資本身也存在著一定的缺陷,存在過度擬合的問題:所謂過度擬合,指的就是程序化交易中,對于樣本數據描述的準確度很高,而對于樣本外數據描述的準確度卻很差。導致歷史回測完美,而在實盤中失效。有時還可能導致黑天鵝事件,數據模型主要是根據歷史數據來構建的,所以它吸收新信息的能力比較緩慢和遲鈍,一旦外部環境發生變化或者發生某些重大事件,如基本面上的變化等,有效性就會大大受到影響。
如果將大量的數據放入AlphaGo 中的核心的“深度神經網絡算法(DNN算法)”,那就可以自動提取一些相關性,同時匹配結果。理論上可以彌補研究人員建立模型時,容易忽略一些變量,導致模型失效的問題,以及解決了回歸分析中會產生的過度擬合。
人類可以充分利用這個工具,充當一個掌舵手,通過前瞻性和對市場非理性機會的把握,對重大政治事件背后的洞察力,來對策略進行調整,保證時效性,構建穩健的投資策略。
圖片來源:找項目網