第12章 手搓錄取通知書1

投票推薦 加入書籤 小說報錯

  第二日,林遠被鬧鐘準時叫醒。

  狹窄逼仄的出租單間內,一張床、一張桌子、一把椅子,再無其它的陳設。衣服被隨意放在一個打開的行李箱內,滿目可及疊放最多的就是各種書籍。

  《C語言程序設計》

  《嵌入式軟硬體設計》

  《Java網絡編程》

  《機器學習入門與實踐(Python)》

  《電機控制導論》

  《機電原理基礎》

  《PCB設計綱要》

  《數字圖像原理》

  。

  。

  這些書籍多到桌子上放不下,部分只能被擺在地上。

  有些書的封面上是一眼可見的已經散開了底色的筆畫,這是林遠淘來的二手書。有的書則是排版不齊裝訂粗糙,這種顯然就是盜版。

  這總計30多本書涵蓋了計算機軟硬體以及自動控制領域五花八門的知識,自然不可能在半年內全部看完。林遠不僅是挑著學,兼帶著還把這些書當作是參考資料庫。

  至於為什麼要弄實體書,而不是用電子書。

  因為學習讀書不是看小說,實體書的體驗是電子書根本無法比擬的。電子書無法達到隨手翻閱隨時記筆記那種人書合一的質感。

  這張桌子除了擺書的地方,其實還留有不少的空白。但是林遠日常吃飯或寫代碼只使用其中很小的一塊地方,因為半張桌子都被鋪上了綠色防靜電台墊。

  台墊上頭則是一個恆溫焊台,兩個滿是各種小格子組成的元器件料盒,還有鑷子、焊錫絲、電路板等各式物件。

  這是一個小型手工焊板工作站。功能自然是用來手工貼焊PCB板。

  算力系統指引林遠入學紫金航院的計算機系,一般來說計算機專業很少有和硬體直接打交道的機會。但是因為涉及到了AI方向,而AI是一個綜合性學科,所以也就順理成章離不開各種電機和電路。

  林遠本以為這些超出傳統計算機知識範疇之外的東西,在面試的時候會有用。卻哪知對方根本不認可這種獨自在小房間裡鼓搗出來的東西。

  所幸他最終依靠算力系統的強橫來了個「一招破敵」。

  入學一事上雖已經獲得張教授幾乎板上釘釘式的認可,但是系統面板卻依然沒有結算獎勵。

  【任務:入學紫金航空航天大學計算機專業。完成度:99.9%。】

  林遠並不清楚算力系統是如何計算任務完成度的,他權且認為:最後那缺的0.1個百分點,是因為自己還沒有收到正式的入學通知書。

  當前任務告一段落,在沒有新的任務之前,林遠只得繼續他原先的日常--一是繼續學習系統推薦的那些書,二是為了養活自己繼續送外賣。

  林遠看了眼房間角落地上那個明晃晃的黃色頭盔,這份工作實在不是什麼好差事。

  六月的天氣眼看就要熱起來,到了七八月份,紫金這個大火爐的空氣都會仿佛熱的沸騰起來,林遠光是想想就已經頭大。

  可是不做這個又能幹什麼呢?

  林遠尋思著:不知道紫金航校的研究生入學通知書什麼時候到,要是有了那東西,就可以藉此去混一份家教。

  紫金老三的准碩士研究生,找份家教還是不難的。然後就可以坐在空調間裡,靠著一張嘴巴拉巴拉就把錢掙了。

  很無奈,林遠眼下還是只得撿起了他黃色的「王冠」。

  他打開了房門,然後保持了這個動作約摸十秒鐘。林遠終究是沒有邁出去。

  『我不能被一份通知書制約嘛,不就是一張紙嘛。有它沒它我都將是紫金航院的碩士研究生。不如。。。』

  林遠坐到了電腦前,用搜尋引擎開始了檢索--圖片搜索:紫金航校計算系研究生的入學通知書。

  很快,藍底的碩士入學通知書圖片映入眼帘。

  不愧是航校,連入學通知書都是藍天的顏色。

  林遠忍不住幻想自己接到入學通知書的那一刻,想想就很激動。

  但是,此時他先需要手搓一份。

  暑假很快就要到了,家教的黃金季節就要來了。林遠已經腦補完成了自己的家教簡歷,就差這一張錄取通知書。


  錄取通知書不是印鈔,林遠想來應該隨便找家GG公司應該就能夠列印出來。不就是一張彩印的硬質卡片嘛。

  問題就在於電子版的錄取通知書不好搞。

  網上是可以找到很多相關的圖片,在那些圖片上用PS改個名字和照片也是很容易的事情。但問題是,如果要追求逼真的話,那錄取通知書的色彩以及尺寸還是得儘量準確。

  但想從網上檢索到的圖片中獲取通知書各個部位的色彩色號,以及大小尺寸,這並非是一件簡單的事情。

  首先,哪怕是同一張通知書,不同的人在不同的時候用不同的手機攝像頭,都會拍出不同的色號來。

  其次,想從圖片裡面還原出通知書實際的尺寸,也是要費一點功夫的。

  林遠隨後打開了webstorm,他準備用Python祭起爬蟲腳本。

  學好數理化,走遍天下都不怕。

  你看,這個時候就用到了。

  為了解決色號的問題,林遠打算用爬蟲腳本來大批量爬取網上的紫金航校研究生錄取通知書圖片。然後綜合匯總之後做個篩選,再取個平均值。

  篩選是必須的。因為這年頭拍照用美顏太普遍了,鬼知道會把實物的色號改的如何面目全非。

  至於什麼是「色號」。顧名思義:就是標識每一種色彩的編號,相當於顏色的身份證。

  由於計算機世界的一切數據都是數字,那顏色自然也就不例外。最常見的顏色定義格式就是RGB三基色,R(red)、G(green)、B(blue)紅綠藍三基色可以調製出各種不同顏色。

  當然,除此之外還有CMYK、HSB等等。但在計算機世界中,還是RGB格式使用更廣。

  這個級別的爬蟲並不難寫。林遠只需要爬取某度搜尋引擎的搜索結果,然後從中摘取出圖片,再通過OCR字符識別過濾一遍,把帶有紫金航校研究生錄取通知書字樣的圖片挑選出來。

  接著來一個目標識別--將圖片中的錄取通知書所在區域摳圖摳出來。然後再做一份數字圖像直方圖,就是把錄取通知書圖片中每種色號做個統計。

  接下去再對統計結果做一個排布。就好比跳水比賽的打分,去掉最高分和最低分,取個中間值即可。

  這種方式相對簡單,其實就是篩選出中間值。

  但是這個過程還是涉及了一些計算機和數字圖像處理方面的內容,好在如今這個年代得益於摩爾定律的強大推動,計算性能的天花板被一再突破,計算機科學與AI技術發展飛快。

  20年前在大型實驗室里才能嘗試的圖像目標識別,如今僅憑一台古董級別的T440就能運行。

  當然,這並非是圖像目標識別這件事情簡單,而是在無數的人開源貢獻之下,讓這項技術使用起來變得簡單。

章節目錄