突然落寒不知道想到了什么,他拿出手機(jī)開始查看其他各省成績(jī)。
果不其然李子舟這個(gè)小正太,竟然進(jìn)決賽了,而且他還是人大附中的組長(zhǎng),拿了83分。
落寒證實(shí)了自己的猜想,這個(gè)李子舟簡(jiǎn)直就是一個(gè)心機(jī)表。
這下落寒對(duì)他印象更差勁了,一個(gè)男孩子天天哭哭啼啼的,一點(diǎn)男子漢氣概都沒有。
而且落寒最討厭這種考的還行,然后一副我考砸了求安慰的樣子的人了,落寒認(rèn)定了李子舟就是靠著年齡小在博同情。
他哪里知道李子舟這個(gè)天才少年上高中以前一直順風(fēng)順?biāo)?,樣樣都是第一?br/>
他又是班里最小的,大家都比較讓著李子舟,直到去年進(jìn)國決失敗,這是他第一次遭受到挫折。
李子舟憋了一口氣,默默的努力一年,就等著今年來雪恥的。
天有不測(cè)風(fēng)云,誰知道題目如此之難,李子舟并沒有把握晉級(jí),他在食堂想到自己努力一年可能會(huì)被淘汰了,情緒一下控制不住就哭了起來。
反正只是個(gè)路人,落寒沒想兩下就把李子舟從腦海里扔出去,反正以后不讓葉云嫣和他再接觸就好。
國預(yù)沒有個(gè)人獎(jiǎng)項(xiàng),國決除了設(shè)置特等獎(jiǎng),一二三等獎(jiǎng)外,還會(huì)設(shè)置個(gè)人的金銀銅牌。
不過只要進(jìn)了國決就會(huì)有將拿這是一定的,高考至少有5分加分,至于會(huì)不會(huì)被博雅水木等985大學(xué)看上提前簽約,就看各自水平及運(yùn)氣了。
落寒團(tuán)體特等獎(jiǎng)和個(gè)人賽金牌是志在必得,要是能提前簽約就更好了。
目前在學(xué)校上高中課程對(duì)落寒來說就是在浪費(fèi)時(shí)間,落寒在課堂上也不能太過分了,對(duì)老師保持必要的尊重那是一定的。
簽約后落寒就能專心按自己的規(guī)劃做事了,不過落寒覺得可能性不大。
博雅和落寒簽計(jì)算機(jī)專業(yè)的約有百分之八十的可能性,但問題是他要進(jìn)入數(shù)學(xué)專業(yè),博雅估計(jì)不會(huì)認(rèn)可落寒的數(shù)學(xué)水平。
他也沒參加過什么數(shù)學(xué)競(jìng)賽,主要就是重生是有點(diǎn)晚,數(shù)學(xué)競(jìng)賽的名早都報(bào)上去了。
下午還有幾個(gè)小時(shí)的休息時(shí)間,大家把心里的激動(dòng)興奮發(fā)泄完了就都散去了。
落寒和于老師打了一個(gè)招呼,獨(dú)自一個(gè)人徜徉在博雅的校園內(nèi),走走停停的看風(fēng)景,昨天只是粗略的逛了逛,說實(shí)話博雅的校園真的是很美。
博雅來都來了,索性好好了解一下自己未來四年將要生活的地方,落寒還特意去看了看醫(yī)學(xué)部和數(shù)院之間的所有路段,就當(dāng)提前考察一下。
以后少不了在這兩地之間奔波,還有顏偉的計(jì)算計(jì)學(xué)院,就是不知道顏偉能不能考上,以他現(xiàn)在的水平算上加10估計(jì)還是有點(diǎn)危險(xiǎn)。
落寒記得自己這界西北省一本分?jǐn)?shù)線是近十年來最高的,顏偉和上輩子完全已經(jīng)是完全不同了,能做的落寒都已經(jīng)做了。
剩下就看他的現(xiàn)場(chǎng)發(fā)揮了,不過有很大可能就算是考上了還會(huì)被調(diào)劑到別的專業(yè),就是不知道博雅轉(zhuǎn)專業(yè)困不困難。
落寒也沒怎么逛,大概熟悉了一下環(huán)境就回去了,晚上還有頓大餐,于老師請(qǐng)客,落寒可還是記得的。
......
晚上,于老師說話算話,請(qǐng)全體隊(duì)員吃了頓大餐,算是壯行。
明后兩天,落寒和他的小組將繼續(xù)戰(zhàn)斗,博雅的校園里從不缺少奇跡,亦不缺少人杰,這次,落寒能否創(chuàng)造奇跡?
一夜無話。
三月十八日上午,還是昨天考試的那棟教學(xué)樓,博雅二教,國決上半場(chǎng)即將開賽。
賽前所有參賽小組都已經(jīng)將作品提交,評(píng)委們已經(jīng)有了大致的了解。
國決是分上下半場(chǎng)的,今天8:30―12:30,這是三小時(shí)是上半場(chǎng)。
下午14:00―17:00,是下半場(chǎng)。
十二個(gè)晉級(jí)小組平均分到兩個(gè)半場(chǎng),一個(gè)半場(chǎng)六組,落寒他們被分在下半場(chǎng)。
下午兩點(diǎn),落寒第一個(gè)上臺(tái),打開提前準(zhǔn)備好的ppt,別上麥克風(fēng)。
“各位評(píng)委老師老師好,我是來自西北省梨城四中的落寒,我這次的參賽作品是一款可以下圍棋的機(jī)器人系統(tǒng),目前系統(tǒng)的圍棋水平已提升至專業(yè)四段?!?br/>
雖然早已看過落寒提供的系統(tǒng),但是當(dāng)他真正說出這款系統(tǒng)下棋水平的時(shí)候,臺(tái)下的評(píng)委都倒吸一口冷氣,有的還表示懷疑,并不相信。
之前他們都覺這款系統(tǒng)能有圍棋業(yè)余水平就已經(jīng)很不錯(cuò)了,沒想到竟然達(dá)到了專業(yè)五段。
這可不是什么五子棋,跳棋之類的簡(jiǎn)單棋類,而是繁雜無比的圍棋,光是棋譜就有幾十萬種,再加上其排列組合,變換無比復(fù)雜。
博雅也有相關(guān)的課題組,不過制作出來的成品都沒有這么高的水平。
底下一個(gè)帶著眼鏡,四十多歲頭有禿的評(píng)委,立刻激動(dòng)的站起來,出聲打斷道:“這個(gè)系統(tǒng)是獨(dú)立制作的么?你是采用什么了設(shè)計(jì)原理?
在沒有外界的資源的幫助下,你如何搜集到大量棋譜,提升其圍棋水平的?!?br/>
在看到落寒的系統(tǒng)比自己目前研究的高端許多后,這位評(píng)委根本沒辦法控制住自己按照流程等待落寒講解完場(chǎng)后在發(fā)問。
因此他直接不顧現(xiàn)場(chǎng)答辯規(guī)則,直接打斷落寒的講述,迫切的希望得到答案。
出聲破壞流程的是張衛(wèi)國,其他評(píng)委都面面相覷。
這個(gè)老張本來就是個(gè)技術(shù)癡,他還是研究智能系統(tǒng)這塊的,如今一個(gè)不到二十歲的小伙子,在自己浸淫二十多年擅長(zhǎng)的方面超越了自己,由不得他不激動(dòng)。
就跟有個(gè)五六歲的小孩,到你面前輕而易舉的解決了你數(shù)十年都沒有解決的難題。
其他評(píng)委換位思考,要是換做是自己,估計(jì)也會(huì)和他一樣,甚至更加激動(dòng)。
哪管的了什么大會(huì)流程,所以其他評(píng)委都默契的沒有阻止他的發(fā)問。
張衛(wèi)國以為落寒和他們采取了一樣的設(shè)計(jì)原理,博雅他們?cè)O(shè)計(jì)的系統(tǒng)包含了“策略網(wǎng)絡(luò)”“快速落子”和“價(jià)值網(wǎng)絡(luò)”。整個(gè)機(jī)器人包含了兩個(gè)大腦,“落子選擇器”和“棋局評(píng)估器”。
一個(gè)四人小組,尤其是其他四人還在打醬油的情況下,落寒想要通過記錄棋譜來提升系統(tǒng)的水平顯然是不可能。
“呃......”落寒有點(diǎn)懵,這才剛講一句話就被評(píng)委提問了,還這么激動(dòng),有點(diǎn)想要沖上臺(tái)來的樣子,這什么情況?
還是會(huì)長(zhǎng)看出來落寒的的疑問,開口到:“衛(wèi)國,你先坐下,你看你都嚇住這位同學(xué)了。
我要是沒記錯(cuò),這位同學(xué)是叫落寒吧,我們就跳過之前的階段,直接開始答辯吧!
我們都比較想知道你的設(shè)計(jì)原理?!?br/>
臺(tái)下的正在等待上臺(tái)的其他小組都難以置信。
臺(tái)下的評(píng)委都是什么人,至少都是博雅的副教授,現(xiàn)在他們都不知道落寒圍棋機(jī)器人系統(tǒng)的設(shè)計(jì)原理。
他們不知道落寒這個(gè)系統(tǒng)所代表的含義,不代表這些在行業(yè)內(nèi)研究幾十年的評(píng)委們不知道。
如果這個(gè)系統(tǒng)真的如落寒所說,那它就象征著計(jì)算機(jī)技術(shù)已進(jìn)入人工智能的新信息技術(shù)時(shí)代,其特征就是大數(shù)據(jù)、大計(jì)算、大決策,三位一體。
它的智慧正在接近人類。
“對(duì)不起,小同學(xué),你繼續(xù)講,我有點(diǎn)激動(dòng)了?!睆埿l(wèi)國此時(shí)也反應(yīng)過來了,訕訕一笑對(duì)落寒道了個(gè)歉坐下來了。
落寒一看,既然評(píng)委們都這么說了,他索性就放棄了之前準(zhǔn)備的演講稿,直接回答起問題來。
“我設(shè)計(jì)的這款系統(tǒng)是基于神經(jīng)網(wǎng)絡(luò)原理,與目前世面上機(jī)器人系統(tǒng)最大的區(qū)別就是,它不再需要人類數(shù)據(jù)。
也就是說,它一開始就沒有接觸過人類棋譜。它使用新的強(qiáng)化學(xué)習(xí)方法,讓自己變成了老師?!?br/>
看著臺(tái)下的評(píng)委都露出一股思索的表情,落寒繼續(xù)補(bǔ)充道:
“這個(gè)系統(tǒng)一開始甚至并不知道什么是圍棋,只是從單一神經(jīng)網(wǎng)絡(luò)開始,通過神經(jīng)網(wǎng)絡(luò)強(qiáng)大的搜索算法,進(jìn)行了自我對(duì)弈。
隨著自我博弈的增加,神經(jīng)網(wǎng)絡(luò)逐漸調(diào)整,提升預(yù)測(cè)下一步的能力,最終贏得比賽?!?br/>
落寒慢慢講訴著自己的設(shè)計(jì)理念,評(píng)委則是越聽越吃驚,心里都泛起驚濤駭浪,就算是不是研究智能系統(tǒng)這一方向的老師,都開始感興趣起來。
“理論上來說,它不光可以成為圍棋機(jī)器人,他甚至可以通過自我博弈學(xué)習(xí)任何一種棋類?!?br/>
落寒發(fā)現(xiàn)剛才那位評(píng)委又開始興奮起來,他趕忙說道:
“不過,我也不知道什么地方出來問題,導(dǎo)致這個(gè)系統(tǒng)在提升到職業(yè)五段的水平后,就停止不前了,目前我還沒找到解決辦法。”
張衛(wèi)國一聽又重新平靜下來,繼續(xù)問著關(guān)鍵問題:
“那你落子時(shí)如何選擇的?選擇方案是什么?”
“根據(jù)我了解的相關(guān)論文文獻(xiàn),到現(xiàn)在為止所有研究所設(shè)計(jì)的相關(guān)系統(tǒng),落子時(shí)的選擇都是基于兩方面的考慮?!?br/>
“一是通過訓(xùn)練形成一個(gè)‘策略網(wǎng)絡(luò)’,主要是將棋盤上的局勢(shì)作為輸入信息,并對(duì)所有可行的落子位置生成一個(gè)概率分布。
然后,訓(xùn)練出一個(gè)‘價(jià)值網(wǎng)絡(luò)’對(duì)自我對(duì)弈進(jìn)行預(yù)測(cè),以-1到1的標(biāo)準(zhǔn),預(yù)測(cè)所有可行落子位置的結(jié)果。
這兩個(gè)網(wǎng)絡(luò)自身都十分強(qiáng)大,而目前國際上所有的相關(guān)文獻(xiàn)描述的都是,將這兩種網(wǎng)絡(luò)整合進(jìn)基于概率的蒙特卡羅樹搜索中,實(shí)現(xiàn)了它真正的優(yōu)勢(shì)?!?br/>
張衛(wèi)國推了推眼鏡,額頭微點(diǎn),這個(gè)落寒肚子里倒是有不少貨啊,他說的正是他們的設(shè)計(jì)思路。
“而我的系統(tǒng)在設(shè)計(jì)如何落子時(shí)是將上述兩個(gè)神經(jīng)是網(wǎng)絡(luò)合二為一,摒棄了棋譜,通過它自己產(chǎn)生大量自我對(duì)弈棋局,為下一代版本提供了訓(xùn)練數(shù)據(jù),此過程循環(huán)往復(fù)。
讓它從低級(jí)的對(duì)戰(zhàn)慢慢成長(zhǎng),從而讓它能得到更高效的訓(xùn)練和評(píng)估”
落寒停頓了一下,觀察了一下評(píng)委,發(fā)現(xiàn)他們差不多消化了他所說的信息,繼續(xù)道:
“在獲取棋局信息后,圍棋系統(tǒng)會(huì)神經(jīng)網(wǎng)絡(luò)中根據(jù)策略網(wǎng)絡(luò)功能,探索哪個(gè)位置同時(shí)具備高潛在價(jià)值和高可能性,進(jìn)而決定最佳落子位置。
在分配的搜索時(shí)間結(jié)束時(shí),模擬過程中被系統(tǒng)最頻繁考察的位置將成為阿爾法圍棋的最終選擇。
在經(jīng)過先期的全盤探索和過程中對(duì)最佳落子的不斷揣摩后,圍棋系統(tǒng)的搜索算法就能在其計(jì)算能力之上加入近似人類的直覺判斷。”
前世包括阿爾法系統(tǒng)的舊版本,都是結(jié)合了數(shù)百萬人類圍棋專家的棋譜,以及強(qiáng)化學(xué)習(xí)的監(jiān)督學(xué)習(xí)進(jìn)行了自我訓(xùn)練。
而現(xiàn)在落寒所講述的方法,還沒有任何期刊雜志發(fā)表過,毫不過分的說落寒現(xiàn)在的方法是全球首創(chuàng)也不為過。
當(dāng)然這是在獲得深度睡眠學(xué)習(xí)系統(tǒng)后,在夢(mèng)里附身前世阿爾法的機(jī)器人的主創(chuàng)人員學(xué)到的辦法,只是時(shí)間有些短,現(xiàn)在還有一些問題沒有解決。
......
臺(tái)上,落寒對(duì)著一堆博雅的教授副教授繼續(xù)侃侃而談,回答者他們各種各樣的問題。
落寒根本不像是在進(jìn)行答辯,反而像是在給他們開報(bào)告會(huì),只是地點(diǎn)有些不對(duì)罷了。
問題回答的差不多了兩方又開始分析系統(tǒng)沒達(dá)到預(yù)期效果的原因,集思廣益,所有的評(píng)委都參與進(jìn)來,眾人開始討論。
“我覺的進(jìn)化到專業(yè)五段就停止,問題還是在你構(gòu)建的單一神經(jīng)網(wǎng)絡(luò)上,會(huì)不會(huì)是你的網(wǎng)絡(luò)太簡(jiǎn)略,已經(jīng)到達(dá)了極限無法支撐其繼續(xù)自我博弈。”
“我不這么覺得,既然可以自我學(xué)習(xí),就代表神經(jīng)網(wǎng)絡(luò)應(yīng)該沒問題。
可能是你的電腦硬件的方面的問題,儲(chǔ)存空間有限,畢竟你是自己在單打獨(dú)奏,設(shè)備跟不上是有很大可能的?!?br/>
一個(gè)皮膚黝黑,理著光頭三十歲左右的老師開口道,這還是他今天第一次開口詢問。
落寒從上午看到這位老師,就有點(diǎn)疑惑他真的是研究計(jì)算機(jī)的么?
隔著衣服都能感覺到他身上的肌肉塊棱角分明,出去說他是健身教練一點(diǎn)都不為過。
。