主頁(http://www.www.xzhtuan.com):人工智能管理無線頻譜——開創(chuàng)無線通信新時代
━━ ━━ 21世紀初,藍牙差點被不合時宜地終結(jié)。第一批藍牙設備曾竭力避免與無線路由器產(chǎn)生沖突。(無線路由器是無線頻譜上功率更高、更穩(wěn)定的一類設備,藍牙設備與其共享頻率。)最終,藍牙工程師們修改了標準,為藍牙設備開發(fā)了跳頻技術(shù),根據(jù)對無線信號的探測,將藍牙操作切換到未被占用的頻段,從而避免了藍牙技術(shù)早早夭折。 頻率跳頻只是避免干擾的一種方法,這個問題從一開始就困擾著無線電。監(jiān)管機構(gòu)從很久以前就開始管理頻譜,使得新興的無線生態(tài)系統(tǒng)中不同的無線電用戶能夠分配到不同的專用頻率。雖然這種做法避免了在使用中檢測傳輸狀況和變換頻率的問題,但由于部分頻譜被閑置,因此頻譜利用率非常低。 如今,對有限的無線電頻譜資源的需求正在高漲。在過去幾年里,無線數(shù)據(jù)傳輸以每年約50%的速度增長,主要原因是人們越來越多地在智能手機上觀看視頻和瀏覽社交媒體。為了滿足這一需求,我們必須盡可能有效地分配頻譜,這也就意味著無線技術(shù)不能有獨占頻率,必須共享可用頻譜。解決方案中將包括藍牙所使用的跳頻技術(shù),但為了應對激增的需求,我們還需要做更多。 ━━ ━━ 為了解決頻譜稀缺問題,我在美國國防部高級研究計劃局(DARPA)創(chuàng)辦了頻譜協(xié)作挑戰(zhàn)賽(SC2),并擔任項目經(jīng)理。SC2是一個為期3年的公開賽,來自世界各地的團隊將重新思考頻譜管理問題。各團隊正在設計新的無線電,使用人工智能來學習如何與競爭對手共享頻譜,最終目標則是提高總體數(shù)據(jù)吞吐量。這些隊伍正在爭奪今年10月在洛杉磯舉行的SC2錦標賽中將近400萬美元的獎金。兩年的競爭讓我們第一次目睹了自主無線電集體共享無線頻譜,傳輸?shù)臄?shù)據(jù)遠遠超過了為每個無線電分配專用頻率所能傳輸?shù)臄?shù)據(jù)。 在SC2之前,DARPA的多個項目已經(jīng)證明,少數(shù)無線電可以像藍牙一樣,通過跳頻技術(shù)來自主管理頻譜,從而避免彼此干擾。那么,我們?yōu)槭裁床话烟l技術(shù)應用到更廣泛的無線電領(lǐng)域,用這種方法來解決頻譜有限的問題呢?
可惜跳頻只能在一定程度上起作用,其有效性取決于未使用頻譜的數(shù)量,如果試圖發(fā)送信號的無線電設備太多,就不會有太多(如果有的話)未使用的頻譜可用。為了達到SC2競賽的目的,我們意識到,需要在多個場景下測試相互競爭的團隊,這些場景中將有幾十臺無線電設備試圖同時共享一個頻段。這樣一來,我們就可以確保每臺無線電廣播設備都不會有自己的專用頻道,因為沒有足夠的頻譜可供使用。 考慮到這一點,我們開發(fā)了一系列循環(huán)比賽的場景,在大約1平方公里的區(qū)域內(nèi),3個、4個或5個獨立的無線網(wǎng)絡一起廣播。無線網(wǎng)絡將被允許訪問相同的頻率,每個網(wǎng)絡會使用一個人工智能系統(tǒng)來解決如何與其他網(wǎng)絡共享這些頻率的問題。我們將根據(jù)完成的任務(如電話和視頻流)數(shù)量來確定比賽的成功程度。假如某組的無線網(wǎng)絡比另一組完成了更多任務,那該組將在比賽中獲勝。我們的主要目標是讓團隊開發(fā)出人工智能管理的無線電網(wǎng)絡,使這種網(wǎng)絡能夠共同完成更多的任務,而不是每個無線電都使用一個專用頻段。 我們很快發(fā)現(xiàn),把這些無線電設備放在現(xiàn)實世界中是不切實際的。我們無法保證每個參賽隊伍的無線條件始終是一樣的。此外,移動一個個無線電設備來設置每個場景和每場比賽非常復雜和耗時。 于是我們建造了世界上最大的射頻仿真試驗臺——Colosseum。Colosseum目前位于馬里蘭州勞雷爾市約翰霍普金斯大學的應用物理實驗室。它包含了21個服務器機架,功率為65千瓦,需要的制冷量與10套大型住宅相當。它可以同時在128臺無線電設備之間模擬超過6.5萬種獨特的交互場景,比如短信或視頻流。此外還有64個現(xiàn)場可編程門陣列,可通過一起執(zhí)行超過150萬億浮點運算(teraflops)來處理模擬演練。 每一場比賽中,我們都會插上無線電,這樣他們就可以直接向Colosseum“廣播”射頻信號。該試驗臺具有足夠的計算能力,可以根據(jù)給定環(huán)境的詳細數(shù)學模型計算這些信號的行為。例如,Colosseum內(nèi)部有模擬墻,可以“反射”信號。還有模擬的暴風雨和池塘,其中的信號會被部分“吸收”。 模擬演練會為團隊的人工智能提供所有必備信息,以便其在每個模擬場景中根據(jù)觀察結(jié)果做出適當決策。例如,面對一個充斥著無意義噪聲的手機干擾器,人工智能可能會選擇將其頻率更改為不受干擾器影響的頻率。
━━ ━━ 為人工智能構(gòu)建一個協(xié)作管理頻譜的環(huán)境是一回事,而創(chuàng)造這些人工智能則完全是另一回事。要了解在SC2中競爭的團隊如何構(gòu)建這些人工智能系統(tǒng),你需要了解人工智能在過去幾十年中的發(fā)展情況。 概括來說,研究人員在幾次“浪潮”中推進了人工智能的發(fā)展,重新定義了這些系統(tǒng)的學習方式。人工智能的第一波浪潮是專家系統(tǒng)。這些人工智能是通過采訪特定領(lǐng)域的專家,并從中派生出一組規(guī)則來創(chuàng)建的,自主系統(tǒng)在試圖完成某件事時,可以根據(jù)這些規(guī)則來做出決策。這些人工智能擅長解決問題,比如國際象棋,這些問題的規(guī)則可以用一種直截了當?shù)姆绞綄懴聛怼J聦嵣希谝淮斯ぶ悄茏钪睦又痪褪荌BM的“深藍”(Deep Blue),它在1997年首次擊敗了國際象棋大師加里卡斯帕羅夫。 更新潮的第二代人工智能依靠的則是大量的數(shù)據(jù)而非人類的專業(yè)知識,從而學習有關(guān)給定任務的規(guī)則。人類很難把所有細微之處都記下來,而且例外情況往往多于規(guī)則的那些問題,是第二代人工智能尤其擅長解決的。語音識別就是一個例子。這些系統(tǒng)能夠接收復雜的原始數(shù)據(jù),比如音頻信號,然后對數(shù)據(jù)做出決策,比如說了什么詞。在Siri和Alexa等數(shù)字助理所使用的語音識別系統(tǒng)中,我們就能了解到第二代人工智能。 如今,第一代和第二代人工智能都沒有用于管理無線頻譜。這意味著我們可以同時考慮這兩代人工智能,以及研究人員在教這些人工智能解決問題時所采用的方式,從而找到解決我們問題的最佳方案。最終,將頻譜管理視為強化學習問題是最容易的,即我們在人工智能成功時獎勵它,在它失敗時懲罰它。例如,人工智能可能會因為成功傳輸數(shù)據(jù)而得1分,或者因為傳輸失敗而丟1分。通過在訓練期間積累分數(shù),人工智能會記住成功的方式并試圖重復它們,同時也會放棄失敗的戰(zhàn)術(shù)。 在我們的比賽中,其他無線電廣播設備的傳輸干擾常常會造成傳輸中斷,所以我們也必須把無線管理視為一項協(xié)作挑戰(zhàn),因為同時會有多個無線電廣播。人工智能管理的無線電性能優(yōu)于傳統(tǒng)的靜態(tài)分配,其關(guān)鍵是開發(fā)人工智能,使自己的分數(shù)最大化,同時為其他人工智能留下空間。當團隊在追求可用頻譜的過程中盡可能多地成功傳輸數(shù)據(jù)且避免了不斷的相互碰撞時,他們就會得到獎勵,這將預防他們最大限度地利用頻譜。 這樣的難度似乎并不大,還有另外一重難題使得頻譜協(xié)作比許多類似的問題更加難以解決。比如,如果你和從未見過的人一起打籃球,這樣組成的球隊一起協(xié)同參賽的能力肯定不如一起訓練多年的隊伍。迄今為止,涉及多個代理的最成功的挑戰(zhàn)是人w工智能參與接受培訓的挑戰(zhàn)。最近的一個案例是2018年的一個項目,在該項目中,非營利性人工智能研究公司OpenAI證明,在電子游戲Dota 2中,一支由5個人工智能組成的團隊可以打敗一支人類玩家戰(zhàn)隊。
━━ ━━ 2018年12月9日,我和DARPA的同事終于有機會知道一組人工智能能否成功解決如此復雜的多主體問題。我們擠在酒店會議室里的一組電腦旁,離Colosseum的安裝地點只有一個街區(qū)。一個星期以來,酒店一直是我們的指揮中心,我們分析了300多場比賽以確定得分最高的隊伍。我們希望在3天內(nèi)頒發(fā)多達8個75萬美元的獎項,每組頂尖團隊都有一個獲獎。不過直到那一刻,我們都還不知道要頒發(fā)多少個獎項。 在一年前舉行的第一次資格賽中,評判隊伍的標準僅僅是它們的相對排名,而這一次要想獲獎,頂尖團隊還必須證明他們的無線電能夠比傳統(tǒng)的專用頻道更好地管理頻譜。 為了比較自主無線電和專用頻率管理,我們設計了最后一組比賽。首先,我們采用了一個基線,為每個團隊分配了專用頻率來了解他們能夠傳輸多少數(shù)據(jù),然后我們?nèi)∠讼拗疲纯匆粋團隊的網(wǎng)絡是否可以在不妨礙共享頻譜中其他4個無線網(wǎng)絡的情況下傳輸更多數(shù)據(jù)。 我們在酒店房間里焦急地等待著最后一組比賽的結(jié)束。如果沒有人能越過我們?yōu)樗麄冊O立的門檻,兩年的努力就可能付之東流。我們突然發(fā)現(xiàn),一腔熱情之下的我們沒有考慮到,如果所有人都失敗了,我們并沒有后備計劃。SC2走到這一步的時候,我們已經(jīng)開始看到一些方法的局限性,但這并不能安撫我們的緊張情緒。 幸運的是,我們也開始發(fā)現(xiàn)一些成功的關(guān)鍵點。比賽開始時,幾乎所有的團隊都采用了第一代人工智能方法。在開始的時候,這種方法是有用的,因為還沒有用于管理頻譜的人工智能系統(tǒng)。在第一代方法中,團隊正試圖編寫協(xié)作使用頻譜的一般規(guī)則。 當然,每個團隊編寫的規(guī)則略有不同,不過他們開發(fā)的每個系統(tǒng)都有一些通用的原則。首先,系統(tǒng)應該監(jiān)聽每個網(wǎng)絡要求使用的頻率。第二,在剩下的頻段中,每個頻段只能分配一臺無線電設備,而且每個團隊都不得要求超過其公平份額。第三,如果沒有空閑頻段,無線電應該選擇干擾最小的頻段。 可惜這些規(guī)則未能捕捉到無線管理的所有特性,這導致了意想不到的后果,影響了無線電協(xié)同工作的能力。在SC2中,我們目睹了許多這樣的例子,這些看似簡單的規(guī)則失敗了。 例如,第二條規(guī)則——做一個好鄰居而不是獨占頻率。原則上,如果其他無線電需要,這種合作方式應該為它們提供更多使用頻譜的機會。在實踐中,我們看到了這種策略的錯誤之處,有一次,3個團隊留下了大量完全未使用的頻譜。 通過這些結(jié)果,我們發(fā)現(xiàn)有一個團隊堅持使用不超過1/3的頻譜。雖然這種策略非常無私,但也限制了他們?yōu)橥瓿勺约旱娜蝿斩⒌倪B接,從而局限了他們的分數(shù)。當另一個系統(tǒng)注意到第一個系統(tǒng)沒有得到足夠的分數(shù)時,情況變得更糟了,它因此限制了自己的頻譜使用,允許第一個系統(tǒng)使用更多的頻譜,而這是第一個系統(tǒng)永遠也不會做的事。基本上,這些系統(tǒng)過于恭順,結(jié)果就是頻譜浪費。 要用第一代人工智能解決這個問題,團隊必須編寫另一條規(guī)則。當新規(guī)則導致另一個意想不到的結(jié)果時,他們又編寫另一條規(guī)則來應對。諸如此類。這些不斷出現(xiàn)的“驚喜”和隨之而來的新規(guī)則是第一代人工智能的主要缺點。一個看似簡單的問題,到頭來可能比看上去要麻煩得多。 與依賴一些硬性的規(guī)則相比,讓每臺無線電廣播設備根據(jù)共享頻譜的其他無線電來調(diào)整策略似乎是更好的方法。實際上,無線電廣播設備應該從大量數(shù)據(jù)(Colosseum擅長生成的數(shù)據(jù))中挖掘出一系列不斷增長的規(guī)則。因此,我們在2018年12月9日的實驗中看到有一些團隊轉(zhuǎn)向第二代人工智能方法。幾支團隊已經(jīng)建立了初具雛形的第二代人工智能網(wǎng)絡,該網(wǎng)絡可以快速識別其他網(wǎng)絡的比賽情況,并利用這些信息動態(tài)地改變各自無線電的規(guī)則。 當SC2開始時,我們猜想許多團隊會采用一種簡單的方法,即使用“感知并避免”策略。當藍牙設備發(fā)現(xiàn)它想要的頻譜被無線路由器使用了,它就會跳到一個新的頻率。藍牙的跳頻功能之所以能夠發(fā)揮作用,部分原因在于無線網(wǎng)是以一種可預測的方式工作(也就是說,它以特定的頻率廣播,并且不會改變這種行為)。在我們的比賽中,每支隊伍的無線電的行為都非常不同,而且完全無法預測,這使得“感知并避免”的策略毫無意義。 相反,我們看到了一個更好的方法,也就是預測未來的頻譜。預測之后,一臺無線電廣播設備就可以利用這些預測結(jié)果來決定哪些頻率可能會打開,即使時間很短暫,也足以傳輸少量的數(shù)據(jù)。更精確的預測將使相互合作的無線電能夠利用每一個機會去傳輸更多數(shù)據(jù),而不會因為在同一時間獲取相同的頻率而受到干擾,F(xiàn)在我們希望,第二代人工智能能夠?qū)W習以足夠高的精度預測頻譜環(huán)境,而不浪費頻譜。 ━━ ━━ 當然,如果人工智能管理的系統(tǒng)不能超越傳統(tǒng)的分配方案,那么所有這些理論都是無用的。因此,當晚在酒店房間里,Colosseum的比賽結(jié)果公布后,得知前8名的隊伍中有6支取得成功,我們非常高興!這些團隊證明,當他們合作共享頻譜時,他們的無線電可以比使用專用頻率時共同傳輸更多的數(shù)據(jù)。3周后,另外4個團隊也做到了,獲得成功的團隊總數(shù)達到10個。 我們欣喜若狂。不過,盡管結(jié)果令人鼓舞,但現(xiàn)在說什么時候能積極使用人工智能來管理無線電頻譜還為時過早。有關(guān)DARPA重大挑戰(zhàn)賽很重要的一點是,它們與競賽結(jié)束時的技術(shù)狀況無關(guān)。相反,這些挑戰(zhàn)旨在確定是否可能發(fā)生根本性轉(zhuǎn)變?纯碊ARPA在2004年舉辦的“自動駕駛大挑戰(zhàn)賽”吧!又過了10年,自動駕駛技術(shù)才開始以非常有限的方式應用在商用汽車中。 總而言之,我們最初的比賽結(jié)果很鼓舞人心。到目前為止,我們已經(jīng)發(fā)現(xiàn),當3個無線電網(wǎng)絡共享頻譜時,其預測比4到5個團隊試圖共享相同的頻譜時要好得多。不過,這不是終點,我們的團隊正在構(gòu)建更好的系統(tǒng)。也許,2019年10月23日,在洛杉磯世界移動通信大會美洲區(qū)的SC2錦標賽上,這些系統(tǒng)將比以往任何時候都能更成功地證明,人工智能操作的無線電可以合作開創(chuàng)一個無線通信的新時代。 作者:Paul Tilghman (中國集群通信網(wǎng) | 責任編輯:李俊勇) |







