第758章 流形學習

姚夢娜提出的這個問題,對於常浩南來說,不難理解。

只是很難解決。

真要說起來的話,這涉及到文本挖掘、數據可視化、信息檢索、數據挖掘、機器學習乃至人工智能等一系列問題。

如果真做到姚夢娜所設想的那樣全自動化生產,那就是工業4.0了。

在1999年這個時間點上,顯然不大現實。

但不可能完全實現這一整套東西,並不意味着其中沒有可以作爲突破口的部分。

比如數據挖掘和信息檢索,就是千禧年附近很火熱的研究方向。

也就是一維數據。

再假設X中的數據樣本來自於或近似來自於低維嵌入空間中的數據Y={y1,y2,…,yn}Rd。

倒是旁邊的小超市,來來往往的人流量不少。

但當年的他作爲一個工科出身的普通技術人員,並沒有太多理論功底。

“信息……”

“這個麼……”

姚夢娜看了看紙上的一個名詞和三句話,也知道常浩南大概是沒什麼思路,乾脆站起身道:

“要不先去吃個飯?”

給定一組高維數據X={x1,x2,…,xn}RD,n爲數據樣本個數,D爲高維數據的維數。

不過,這個思路卻是可以被借鑑的。

3、提取到高質量的數據特徵,提升後續的數據表示和分類任務的效果。

而對於稍複雜一些的情況來說,要完全描述一個含義,往往需要一組數據。

姚夢娜的反應稍微慢了一點,剛想起身,又意識到還沒結賬,只好掏出錢包,無奈地走向收銀臺。

“在封裝步驟之前,專門找個人在流水線旁邊看着不就行了麼?”

餐桌周圍又恢復了平靜,只剩下偶爾發出的微弱咀嚼聲。

2、消除,或者至少降低隱藏在原始高維數據中的噪聲。

“?”

但與此同時,這一組數據又往往不只能描述這一個含義。

但主成分分析法只相當於找到投影距離最小的意義下的最佳線性映射,而現實中卻沒有那麼多簡單的線性問題。

常浩南思索半晌,又在紙上寫下了三個基本條件:

幾分鐘之後,當朱雅丹都快要吃完麪前盤子裡的炒麪時,常浩南突然開口道:

確實有點餓了。

1、對原始高維數據進行壓縮,降低原始高維數據的維度,進而節省存儲空間,同時也降低高維數據的計算複雜度。

朱雅丹瞬間縮了縮頭:

“我只是隨便一說……但有些時候人腦的作用或許還是沒辦法代替的……”

實際上,在常浩南重生之前,飛機設計和製造領域已經開始應用這方面的技術,他本人也接觸過不少。

正在低頭吃飯的姚夢娜一愣,旋即意識到常浩南這還是在思考剛纔她提出來的問題。

顯然,這並不能被算作是“完整且可行”的思路。

更何況數學這種東西,光靠俺尋思是尋思不出個一二三的。

小學和中學時候做的應用題,大體上就是這樣。

常浩南放下只吃了一口的羊湯麪,蹭地站起身,快步離開食堂。

不如先放鬆一下,換個思路。

……

常浩南搖搖頭否定道。

姚夢娜猜測道:

雖然她覺得在兩位博士面前有點班門弄斧,但最後還是沒忍住:

沒有反應。

但到了99年這會,大學生在宿舍備上幾袋甚至一箱,都不算什麼稀罕事了。

而對於理論研究來說,明確地提出問題,幾乎也就相當於走完了成功之路的一半。

朱雅丹滿腦袋問號地擡起頭,但看着常浩南思考的樣子,很有自知之明地沒有打擾。

實際生活中面臨的,其實大多數也是這種問題。

十五分鐘後,三人(連同朱雅丹)已經圍坐在了食堂二層的一個圓桌旁邊。

直到一陣來自腹部的叫聲把它從深思中吵醒。

“人類的大腦能夠通過某種辦法解析高維數據,從而獲取對外部世界的感知。”

在理想化的模型中,最好是一個數據就可以精確且唯一地描述一個含義。

“換句話說,具有高維數的外部信息必定潛在於一個低維空間中的非線性流形結構上……”

常浩南面前擺着一份熱氣騰騰的羊湯麪,但卻並沒有急着動筷子,而是出神地看着不遠處樓梯口上上下下的人羣。

常浩南突然開口道:

“那個……”

要想在數學上描述這種一組(多個)數據對應多個含義的現象,就需要將一組數據在不同的維度上進行展開。

回到辦公室的常浩南重新找到了剛纔那張紙。

而如果想要讓計算機處理這些高維數據……

“你們說……”

旁邊的朱雅丹左看看常浩南,右看看姚夢娜,實在是不知道這兩個人爲什麼突然討論起這個問題了。

這裡算是個點餐制的小竈,價格比下面的大食堂貴一些,加上還要多上一層樓,因此來這裡吃飯的人並不算多。

這就導致如今他腦子裡空有一大堆名詞,但卻不知道哪個是破局的關鍵——

在近70年前,美國統計學家哈羅德·霍特林就已經提出過將高維數據進行降維的主成分分析法。

而系統,則首先需要構建出一個完整且可行的思路出來。

儘管仍然沒有給出完整的思路,但是,他至少已經把三個抽象的基本條件解析成爲了一個具體的數學問題。

“嗯……但麪餅重量本身就有誤差,而且調料包有好幾種,稱重只能證明總量沒問題,但不能保證沒放錯……”

在三個基本條件下方又寫下了幾行字。

90年代這會,方便麪還屬於非常流行的即食類食品。 常浩南讀本科那陣子,大家的條件普遍比較差,有閒錢吃得起的人不多。

而生產方便麪的企業,顯然不太可能有多麼高大上的設備和技術。

沒有靈感,說啥都沒用。

身負安保職責的朱雅丹趕緊跟上。

他認爲方差越大提供的信息越多反之提供的信息越少,於是通過原分量的線性組合構造方差大、含信息量多的若干主分量,再進行矩陣奇異值分解,實現數據維數的降低。

“調料包大概佔整包方便麪重量的10%左右,如果少放或者多放,那應該很容易檢測出來。”

姚夢娜單手扶額:

“我們就是在想,如何才能不用這個人,但實現一樣的效果。”

常浩南從旁邊扯過一張紙,在紙的最中間寫下了兩個字。

給方便麪裡面塞調料包和給飛機打鉚釘,在數學模型上其實是差不多的。

實際上,他此時就面臨着無法從大量繁雜信息中提取出有價值信息的困境。

“大概……稱重?”

但常浩南仍然沒有動筷子。

不知不覺間,常浩南就在辦公桌前枯坐到了快要吃午飯的時候。

常浩南不是那種死鑽牛角尖的人。

尋找一個從高維觀測空間到低維嵌入空間的映射關係,使得yi=(xi),以及一個一對一的重構映射關係^-1,使得xi=^-1(yi)。

仍然沒能想出一個很好的思路。

“生產方便麪的企業,是怎麼保證不漏裝或者多裝調料包的?”

而反過來,現實中收集到的信息,在多數情況下,本身就是已經展開過的高維數據。

“你說得對。”

他在腦子裡把這三條內容過了一下,然後試圖讓系統給出一個結果。

這是由數學理論推向現實的情況。

“也好。”

其核心目的是從海量數據庫和大量繁雜信息中提取出有價值的知識,並進一步提高信息的利用率。

寫到這裡,常浩南的臉上露出了一個滿意的微笑。

想到這裡,他回到這張紙的最上面,重新寫下六個字。

流形學習方法。

第792章 需要預警機347.第347章 搞重型模鍛壓機!第26章 發個專利吧第413章 給父母買個房第564章 對圖160有點想法?第467章 日本軸承產業感到有些不安第791章 靈活的胖子第648章 這麼好的平臺,光拿來對281.第281章 老對手,來湊熱鬧的F4EJ第861章 育種專家第73章 特別優待第565章 真空電子束焊接技術第528章 頂級凡爾賽,江湖上盡是我的傳說382.第382章 受洪水威脅的01號原型機第591章 連升兩級的戰鬥英雄第1091章 衛星姿態機動第982章 原來常總每天都這麼爽的?第421章 空警200,正式立項第909章 不是吧,我對常總?第1098章 全球鷹第499章 一不小心就做了眼鏡蛇機動(四更求第1009章 真海空聯動了第945章 把秘密武器拿出來用一用第739章 火炬實驗室第563章 渦扇10的潛力第121章 白月光與(爲上月月票金主flankerr第719章 上閱兵!第450章 法國人的設計,不合理!361.第361章 對燕京大學的無情NTR第776章 不會真有戰忽局吧?第1011章 來自常總的新要求第178章 精工計劃(二合一)第70章 差分進化算法(55)251.第251章 技術換技術第944章 最後的戰略轟炸機(算昨天的)第803章 來跳個舞吧245.第245章 基於數字射頻的雷達干擾技術第457章 汽車行業,要洗牌了第203章 在做了在做了(新建文件夾)第86章 遠程偵察第844章 渦扇10的產能分配第1066章 必須體現出華夏的作用!281.第281章 老對手,來湊熱鬧的F4EJ379.第379章 煥然一新的殲教9324.第324章 決定賣身的圖波列夫和米格395.第395章 渦扇10的全新設計方法第741章 數學不會就是不會第1096章 對華夏搞空中偵察?第1001章 以軟件優勢推動硬件發展第490章 十一號工程的進度329.第329章 國企負責人提名,三百萬的項目第872章 未雨綢繆第723章 不講武德,偷襲幻影2000第512章 終於能自主生產渦扇了!第1083章 我很大,但很輕第490章 十一號工程的進度234.第234章 干擾吊艙,逆向工程第109章 抉擇第715章 抱歉,我也是剛剛想出來第854章 正常的垂髮第457章 汽車行業,要洗牌了第754章 把黑海造船廠打包帶走第86章 遠程偵察第193章 首見殲10(上)第1083章 我很大,但很輕第777章 種瓜得豆279.第279章 以爲是主角,其實是龍套第1072章 奇怪的風扇設計第694章 幽靈出擊406.第406章 給領導畫餅第609章 火炬質量認證體系291.第291章 平流層飛艇和國際互聯網第977章 你倆挺會玩啊第452章 進口替代第869章 野獸掛載殲11B218.第218章 已經有思路了242.第242章 在關鍵技術上要有底線思維231.第231章 院長,我要寫教材!(二合一)第103章 製造難題(爲月票金主flankerr加更第17章 院士的青睞第889章 來自大洋彼岸的壓力第537章 殲轟7A,更重 更遠 更安全第174章 工藝問題第1057章 沒關係,他們會回來的第945章 把秘密武器拿出來用一用第529章 獲獎懸念揭曉!253.第253章 預警機的高低搭配第529章 獲獎懸念揭曉!第32章 出結果了第574章 真就造假仙人啊?第964章 懷疑人生的印度設計師第952章 航空文化第1059章 什麼叫樂極生悲啊?第624章 渦扇10,全權限數字控制系統第69章 超級計算機(45)405.第405章 怎麼又是你?(日萬,求月票)第459章 我們中出了一個叛徒!第769章 不一樣的尾噴口369.第369章 揚眉吐氣!