第255章 那就自己造好了
劃著名滑鼠,把達文西系統的核心技術拆開來一條一條細細研究。
等把所有檢索到的資料看過一遍之後,肖宿歪了一下頭。
有意思。
他雖然不懂所謂的工藝,但拋去所有不知所云的設計,直面本質,電機的運轉精度,剝掉那層工程外皮,內核不就是一個多變量動態系統的控制優化問題嗎?
關節的運動軌跡、受力平衡、誤差補償,每一項都可以寫成連續可微的幾何函數。
而恰好,他之前研究出的加權度量和流形優化理論,核心就是在一個高維幾何空間裡,給定一堆約束條件,找出一條最優路徑。
它要解決的就是這樣的難題。
也就是說,只要學懂了他之前的理論,那麼完全可以解決達文西的電機精度問題。
用一個他更熟悉的說法,伺服電機的控制問題本質上是在一個非交換李群上求解測地線方程。
這條測地線對應著電機從當前位置到目標位置的最優運動軌跡,而關節的摩擦、慣性、回差,不過是在測地線上加了幾組擾動項而已。
甚至都不需要怎麼思考,只需要計算就可以了。
他拿出筆和紙把需要的定理和方法寫了下來,越寫,他發現熟悉的東西越多。
擾動項的處理方法其實也已經有解決辦法了。
他在《粘性流體中和樂的演化方程與耗散結構》那篇論文裡寫得很詳細,把耗散源拆成頻帶分量,逐一帶寬約束,系統穩定性就能守住。
肖宿蹙著眉又在草稿紙的空白處多加了幾行字。
繼續往下看,他發現力反饋的信號處理問題其實也不是很難。
他之前在TOIS發的那篇《基於李群理論的圖分割框架》,核心思路是把一個大規模網絡分割成若干子圖,讓子圖之間的連接儘量稀疏、子圖內部的連接儘量緊密。
當時用到的數學工具是李群表示論,就是通過群作用約束分割邊界,保證拓撲結構的穩定性。
這個思路只要稍微轉一個彎,完全就可以用到這裡來。
畢竟力反饋本質上也是一個動態信號在閉環迴路里的實時解算問題。
傳感器的採樣信號是一堆高頻數據,裡面有醫生的主動操作,有手部的生理震顫,還有機械本身的噪聲。
要把這三樣東西在毫秒之內分離開,過濾掉震顫和噪聲,只把真正的力反饋信號傳給醫生。
這不就是個信號的特徵解耦問題嗎?
他在SACI上發的那七篇自監督學習論文,做的就是特徵解耦。
用群論框架把糾纏在一起的特徵表示一層一層剝開,每個特徵對應一個獨立的群表示,互不干擾。
平移過來的話,力反饋信號也可以被模型分解成幾個獨立的頻帶分量:
低於一赫茲的是醫生的操作意圖,八到十二赫茲是生理震顫,更高頻的是機械噪聲。
用一個基於小波變換的頻帶濾波器把這三個分量拆開,醫生的操作信號走一條快速通道,震顫和噪聲各走各的濾波通道,最終合成回來的時候,延遲就被壓縮到了採樣周期的量級。
肖宿一旦思考起來,腦子就活躍的不得了。
夏日的夜晚寂靜安逸,整個房間裡,就只剩下筆尖落在紙上的沙沙聲,清晰又急促。
他寫字一直很快,不過十分鐘,紙面上已經寫滿了計算方程和相關的定理,墨跡還未完全乾透,他就毫不猶豫地抽過下一張,埋頭繼續寫。
待思緒落到第三項核心技術的時候,肖宿手上的筆停了一下。
這項技術的數學內核,怎麼看怎麼熟悉。他仔細一想,發現竟然和自己證明哥德巴赫猜想時用到的方法很相似。
當時,他為了讓分層篩法與鞍點圓法的融合,就通過把二維的素數分布信息,「 lift 」到更高維的流形上去處理,從而構造了一個新的幾何工具。
而達文西的成像方式也是另一種形式的升維。
它是通過把兩個微型攝像頭伸進人體,將拍攝的二維畫面實時合成,然後放大十倍,就變成的醫生能夠看到的三維立體影像。
這種多視圖幾何重建,說白了就是把多個二維投影還原成三維空間結構。
這件事的數學基礎是辛幾何,因為光學成像系統的哈密頓量天然具有辛結構,兩個攝像頭之間的視差關係可以用一個辛矩陣來描述。
而辛幾何。
現在全世界最完整的辛幾何統一框架,是他寫的。
只要把光學系統的辛矩陣往他構建的顧辛流型里一套,投影關係自動就解出來了,而且可以繞開直覺外科那套算法里好幾個冗餘的計算步驟,重建速度會更快,畫面精度會更高。
他看著屏幕上的內容,放下筆,沉默了幾秒。
這三項核心技術,每一項拆開來,底層全是他已經解決的東西,幾何優化、群論解耦、辛幾何重建,這些東西在他的論文裡已經被翻來覆去地用了不知道多少遍。
肖宿皺了皺眉,怎麼也沒發現這個東西的難度在哪兒。
可他分明記得剛才看的材料里寫著,全世界能造出這種精度手術機器人的公司,只有直覺外科一家。
從二零零零年到現在,整整二十六年過去了,德國的西門子、日本的奧林巴斯、華國的幾家企業,投了不知道多少錢,全卡在這三個地方過不去。
這就很奇怪了。
突然,許銘拿著框架上門的場景又出現在了眼前,也許,那些研究員和許銘差不多呢?
肖宿搖了搖頭,已經放棄去思考他們為什麼不會了。
他把手稿收好,打算明天讓高長安去打聽一下。
如果實在沒有,那就自己造好了。
指揮小智把所有的資料全部整理歸檔之後,肖宿躺在床上,慢慢沉入了徹底的黑暗中。
等把所有檢索到的資料看過一遍之後,肖宿歪了一下頭。
有意思。
他雖然不懂所謂的工藝,但拋去所有不知所云的設計,直面本質,電機的運轉精度,剝掉那層工程外皮,內核不就是一個多變量動態系統的控制優化問題嗎?
關節的運動軌跡、受力平衡、誤差補償,每一項都可以寫成連續可微的幾何函數。
而恰好,他之前研究出的加權度量和流形優化理論,核心就是在一個高維幾何空間裡,給定一堆約束條件,找出一條最優路徑。
它要解決的就是這樣的難題。
也就是說,只要學懂了他之前的理論,那麼完全可以解決達文西的電機精度問題。
用一個他更熟悉的說法,伺服電機的控制問題本質上是在一個非交換李群上求解測地線方程。
這條測地線對應著電機從當前位置到目標位置的最優運動軌跡,而關節的摩擦、慣性、回差,不過是在測地線上加了幾組擾動項而已。
甚至都不需要怎麼思考,只需要計算就可以了。
他拿出筆和紙把需要的定理和方法寫了下來,越寫,他發現熟悉的東西越多。
擾動項的處理方法其實也已經有解決辦法了。
他在《粘性流體中和樂的演化方程與耗散結構》那篇論文裡寫得很詳細,把耗散源拆成頻帶分量,逐一帶寬約束,系統穩定性就能守住。
肖宿蹙著眉又在草稿紙的空白處多加了幾行字。
繼續往下看,他發現力反饋的信號處理問題其實也不是很難。
他之前在TOIS發的那篇《基於李群理論的圖分割框架》,核心思路是把一個大規模網絡分割成若干子圖,讓子圖之間的連接儘量稀疏、子圖內部的連接儘量緊密。
當時用到的數學工具是李群表示論,就是通過群作用約束分割邊界,保證拓撲結構的穩定性。
這個思路只要稍微轉一個彎,完全就可以用到這裡來。
畢竟力反饋本質上也是一個動態信號在閉環迴路里的實時解算問題。
傳感器的採樣信號是一堆高頻數據,裡面有醫生的主動操作,有手部的生理震顫,還有機械本身的噪聲。
要把這三樣東西在毫秒之內分離開,過濾掉震顫和噪聲,只把真正的力反饋信號傳給醫生。
這不就是個信號的特徵解耦問題嗎?
他在SACI上發的那七篇自監督學習論文,做的就是特徵解耦。
用群論框架把糾纏在一起的特徵表示一層一層剝開,每個特徵對應一個獨立的群表示,互不干擾。
平移過來的話,力反饋信號也可以被模型分解成幾個獨立的頻帶分量:
低於一赫茲的是醫生的操作意圖,八到十二赫茲是生理震顫,更高頻的是機械噪聲。
用一個基於小波變換的頻帶濾波器把這三個分量拆開,醫生的操作信號走一條快速通道,震顫和噪聲各走各的濾波通道,最終合成回來的時候,延遲就被壓縮到了採樣周期的量級。
肖宿一旦思考起來,腦子就活躍的不得了。
夏日的夜晚寂靜安逸,整個房間裡,就只剩下筆尖落在紙上的沙沙聲,清晰又急促。
他寫字一直很快,不過十分鐘,紙面上已經寫滿了計算方程和相關的定理,墨跡還未完全乾透,他就毫不猶豫地抽過下一張,埋頭繼續寫。
待思緒落到第三項核心技術的時候,肖宿手上的筆停了一下。
這項技術的數學內核,怎麼看怎麼熟悉。他仔細一想,發現竟然和自己證明哥德巴赫猜想時用到的方法很相似。
當時,他為了讓分層篩法與鞍點圓法的融合,就通過把二維的素數分布信息,「 lift 」到更高維的流形上去處理,從而構造了一個新的幾何工具。
而達文西的成像方式也是另一種形式的升維。
它是通過把兩個微型攝像頭伸進人體,將拍攝的二維畫面實時合成,然後放大十倍,就變成的醫生能夠看到的三維立體影像。
這種多視圖幾何重建,說白了就是把多個二維投影還原成三維空間結構。
這件事的數學基礎是辛幾何,因為光學成像系統的哈密頓量天然具有辛結構,兩個攝像頭之間的視差關係可以用一個辛矩陣來描述。
而辛幾何。
現在全世界最完整的辛幾何統一框架,是他寫的。
只要把光學系統的辛矩陣往他構建的顧辛流型里一套,投影關係自動就解出來了,而且可以繞開直覺外科那套算法里好幾個冗餘的計算步驟,重建速度會更快,畫面精度會更高。
他看著屏幕上的內容,放下筆,沉默了幾秒。
這三項核心技術,每一項拆開來,底層全是他已經解決的東西,幾何優化、群論解耦、辛幾何重建,這些東西在他的論文裡已經被翻來覆去地用了不知道多少遍。
肖宿皺了皺眉,怎麼也沒發現這個東西的難度在哪兒。
可他分明記得剛才看的材料里寫著,全世界能造出這種精度手術機器人的公司,只有直覺外科一家。
從二零零零年到現在,整整二十六年過去了,德國的西門子、日本的奧林巴斯、華國的幾家企業,投了不知道多少錢,全卡在這三個地方過不去。
這就很奇怪了。
突然,許銘拿著框架上門的場景又出現在了眼前,也許,那些研究員和許銘差不多呢?
肖宿搖了搖頭,已經放棄去思考他們為什麼不會了。
他把手稿收好,打算明天讓高長安去打聽一下。
如果實在沒有,那就自己造好了。
指揮小智把所有的資料全部整理歸檔之後,肖宿躺在床上,慢慢沉入了徹底的黑暗中。