在人工智能領域中,計算機視覺(Computer Vision, CV)被稱為(wei) 是人工智能時代的眼睛,具有廣泛應用和巨大潛力。它為(wei) 機器提供了對圖像的高層次理解,以複製人類視覺能力為(wei) 最終目標。2022年是計算機視覺的蓬勃發展之年,也是迄今以來計算機視覺的巔峰之年,出現了無數新科技(視覺Transformer、Pix2Seq)、新產(chan) 品(Imagen、DALL-E2)、新模型(YOLOv7)。那麽(me) ,對於(yu) 計算機保研er來說,計算機視覺方向如何呢?今天老師就來和大家一起聊聊這個(ge) 熱門話題,以及該如何準備計算機視覺保研。
01、計算機視覺介紹
什麽(me) 是計算機視覺?
計算機視覺是使用計算機及相關(guan) 設備對生物視覺的一種模擬,它的主要任務就是通過對采集的圖片或視頻進行處理以獲得相應場景的三維信息。計算機視覺既是工程領域,也是科學領域中的一個(ge) 富有挑戰性重要研究領域。作為(wei) 一門綜合性的學科,它已經吸引了來自各個(ge) 學科的研究者參加到對它的研究之中。其中包括計算機科學和工程、信號處理、物理學、應用數學和統計學、神經生理學和認知科學等。
計算機視覺有哪些研究方向?
01、圖像分類
圖像分類是根據各自在圖像信息中所反映的不同特征,把不同類別的目標區分開來的圖像處理方法。它利用計算機對圖像進行定量分析,把圖像或圖像中的每個(ge) 像元或區域劃歸為(wei) 若幹個(ge) 類別中的某一種,以代替人的視覺判讀。圖像分類應用在許多領域,如醫學成像、衛星圖像中的目標識別、交通控製係統、刹車燈檢測、機器視覺等。
02、目標檢測
目標檢測,也叫目標提取,是一種基於(yu) 目標幾何和統計特征的圖像分割。它將目標的分割和識別合二為(wei) 一,其準確性和實時性是整個(ge) 係統的一項重要能力,是計算機視覺的一個(ge) 重要分支。目標檢測多用於(yu) 人臉識別、智慧交通(異常事件檢測、交通流量監控與(yu) 紅綠燈配時控製)、工業(ye) 檢測等。
03、目標跟蹤
目標跟蹤(Tracking-by-Detection)旨在跟蹤一段視頻中的目標的運動情況。它可以用來區分主體(ti) 和背景之間的差異,並已成為(wei) 首選的跟蹤方法。目標跟蹤目前廣泛應用在體(ti) 育賽事轉播、安防監控和無人機、無人車、機器人等領域。
04、語義(yi) 分割
語義(yi) 分割是對圖像中的每一個(ge) 像素進行分類,目前廣泛應用於(yu) 醫學圖像與(yu) 無人駕駛等。分割是計算機視覺的重要組成部分,它將整個(ge) 圖像劃分為(wei) 可以標記和分類的像素組。更具體(ti) 地說,語義(yi) 分割試圖理解每個(ge) 像素在給定圖像中的作用。這一領域主要分為(wei) 有監督語義(yi) 分割、無監督語義(yi) 分割、視頻語義(yi) 分割等。
05、······
計算機視覺應用案例
引用自圖書(shu) :Computer vision: algorithms and applications
02、計算機視覺發展前景
國家政策大力支持
近年來,我國政府對計算機視覺行業(ye) 給予了高度重視,並出台了多項政策支持其發展,為(wei) 計算機視覺行業(ye) 提供了良好的政策環境,促進其健康發展。
圖源華經產(chan) 業(ye) 研究院官網
www.huaon.com
計算機視覺技術正處於(yu) 發展的上半場,隨著人臉識別性能、限定場景識別準確率等效果的不斷提升,許多對象識別和分類問題將實現工業(ye) 化,滲透到更多的行業(ye) 應用中。國家政策已從(cong) 多方向促進產(chan) 業(ye) 發展,督促企業(ye) 在重視前沿算法研發的同時,加強算法與(yu) 商業(ye) 應用的融合,以提供更全麵、及時的服務。未來,我國的醫療影像、智慧物流、工業(ye) 製造、批發零售等創新應用領域也將進一步解鎖,大力支持和引導中國人工智能的健康發展。
學術界多方向發展
近年來,計算機視覺領域的學術成果以爆發式增長,發展非常迅猛。計算機視覺頂會(hui) (CVPR、ICCV、ECCV等)每年都會(hui) 收到大量的論文投稿,其中一些論文以出色的表現獲得了大量的關(guan) 注,例如GoogleNet VGG在不到8年的時間裏就獲得了10萬(wan) 次引用,而2015年的ResNet更是在更短的時間內(nei) 獲得了接近10萬(wan) 次的引用。雖然不少方向已經邁向技術成熟階段,但仍有很多新的研究領域有待探索。
圖源學術範官網
https://www.xueshufan.com/field/31972630?s=001001008001004
結合深度學習(xi) 領域幾大頂會(hui) 以及產(chan) 業(ye) 界的需求,不難發現三維視覺、視頻理解、多模態融合等技術慢慢成為(wei) 新的研究趨勢。更貼近現實場景的三維視覺技術,包括三維感知(點雲(yun) 獲取及處理)、三維重建(大規模場景的三維重建、動態三維重建)、三維理解(三維物體(ti) 的識別、檢測及分割等)在近五年來得到快速發展。此外,隨著5G時代的到來,視頻數量呈爆炸式增長,視頻的智能化理解成為(wei) 亟待解決(jue) 的問題。在計算機視覺愈發成熟後,多個(ge) 傳(chuan) 感器之間的相互保護和融合,也即多模態融合,也成為(wei) 未來發展的機遇和挑戰。
就業(ye) 崗位和薪資
隨著計算機視覺技術的不斷進步,越來越多的企業(ye) 開始采用計算機視覺技術,以提高生產(chan) 效率,提升服務質量。據《2020年度中國計算機視覺人才調研報告》顯示,在人工智能技術領域中,計算機視覺是中國市場規模最大的應用方向,占據了整個(ge) 中國人工智能市場應用的34.9%。
目前,最受歡迎的是算法工程師崗,有算法的實際產(chan) 品化及視頻分析經驗的人才大受歡迎。除算法工程師外,計算機視覺與(yu) AI產(chan) 業(ye) 催生的AI產(chan) 品經理、AI算法測試工程師、AI售前解決(jue) 方案工程師等成為(wei) 企業(ye) 急需人才。此外,研究院、高校、政府機構也在吸納計算機視覺領域人才。
圖源澎湃新聞網
https://m.thepaper.cn/baijiahao_11433021
03、計算機視覺保研準備
背景知識
紮實的基礎知識是我們(men) 在保研筆試、麵試中的最大底氣,那麽(me) 對於(yu) 想要保研該方向的同學來說需要加強哪些方麵的知識呢?老師為(wei) 大家總結為(wei) 以下三大方麵:
01、圖像處理,大致包括的內(nei) 容:光學成像基礎、顏色、濾波器、局部圖像特征、圖像紋理、圖像配對等。
02、立體(ti) 視覺,大致包括的內(nei) 容:相機幾何模型、雙目視覺、從(cong) 運動中恢複物體(ti) 結構、三維重建技術等。
03、人工智能,大致包括的內(nei) 容:場景理解與(yu) 分析、模式識別、圖像搜索、數據挖掘、深度學習(xi) 等。
學習(xi) 平台介紹
工欲善其事,必先利其器。人工智能(尤其是算法)的實現需要強大的計算能力的支撐,特別是深度學習(xi) 算法的大規模使用,對計算能力提出了更高的要求。計算機視覺由於(yu) 針對圖像、視頻,更需要算力較強的計算機來運行。
在學習(xi) 中個(ge) 人的計算機配置可能難以達到令人滿意的要求,或是由於(yu) 配置不夠導致計算較慢,效率較低。但幸運的是,國內(nei) 外多家企業(ye) 和團體(ti) 提供了AI平台開源服務,使得我們(men) 可以利用免費高效的在線雲(yun) 計算編程環境,甚至白嫖一些公開的數據集和常用代碼。下麵老師就給大家介紹一些好用的線上平台。
01、百度AI Studio
百度AI Studio是一個(ge) 麵向AI學習(xi) 者的在線一體(ti) 化學習(xi) 與(yu) 實訓社區,它匯集了多種AI教程、深度學習(xi) 樣例工程、各領域的經典數據集、雲(yun) 端的超強運算及存儲(chu) 資源,以及比賽平台和社區,旨在解決(jue) 學習(xi) 者在AI學習(xi) 過程中遇到的諸多問題,如教程水平不一、教程和樣例代碼難以銜接、高質量的數據集不易獲得,以及本地難以使用大體(ti) 量數據集進行模型訓練等。
02、阿裏雲(yun) 人工智能平台
自2009年創立以來,阿裏雲(yun) 一直是全球領先的雲(yun) 計算及人工智能科技公司,致力於(yu) 通過在線公共服務的方式,為(wei) 用戶提供安全、可靠的計算和數據處理能力。阿裏雲(yun) 平台整合資源涉及自然語言處理、智能語音、視覺計算等多個(ge) 熱門領域。
03、華為(wei) 雲(yun) AI平台
華為(wei) 的AI平台建立在華為(wei) 雲(yun) 的基礎上,它依托華為(wei) 的硬件,特別強調麵向開發者的服務。Model Arts是華為(wei) 雲(yun) 的AI一站式開發平台,可以支持開發者完成從(cong) 數據到AI應用的全流程開發,包括數據處理、模型訓練、模型管理和部署等操作。
04、Kaggle
Kaggle是一個(ge) 數據建模和數據分析競賽平台,企業(ye) 和研究者可在其上發布數據和問題,吸引各界人士在平台上競賽以產(chan) 生最好的解決(jue) 模型。如果提交的結果符合指標要求並且在參賽者中排名第一,可以獲得比賽豐(feng) 厚的獎金。對於(yu) 初學者而言,Kaggle每周提供的30h的GPU免費使用權也是非常有誘惑力的,這意味著我們(men) 可以在Kaggle平台上運行自己的深度學習(xi) 代碼。
招生學校/實驗室推薦
01、北京大學智能學院信息科學中心
北大智能學院成立時間較短,但師資力量雄厚(院士1人,“長江學者”2人,傑青2人,優(you) 青2人),且學校title也很好。它屬於(yu) 弱com,導師具有很大話語權,所以一定要提前聯係導師,通過導師的考核基本就能拿到offer。
02、中科院自動化研究所模式識別國重
該實驗室曆史較久(1987年),實力在國內(nei) 數一數二,擁有眾(zhong) 多大牛導師。屬於(yu) 強com,需要通過麵試考核拿到優(you) 營(60%比例),直博和學碩的招生人數都很多,值得推薦。
03、中科大智能信息處理重點實驗室
該實驗室成果豐(feng) 富,在國內(nei) 也很有名氣,屬於(yu) 報名火爆的院校。是強com院校,需要經曆幾輪測試(筆試,機試and麵試),根據最終成績錄取。大部分是學碩,直博很少。
04、相關(guan) Q&A
Q1、哪些專(zhuan) 業(ye) 的同學適合這個(ge) 方向?
老師通過對近年來各高校、研究所老師的招生要求分析,發現數學、計算機科學與(yu) 技術、軟件工程、自動化等專(zhuan) 業(ye) 的學生都比較受該專(zhuan) 業(ye) 青睞,有計算機視覺、深度學習(xi) 、計算機圖形學、人工智能等課程或者科研項目經曆者能夠被優(you) 先考慮。此外,良好的數理基礎、快速迭代實現的編程能力、機器學習(xi) 的基本知識和較好的英文閱讀和寫(xie) 作能力都是老師們(men) 格外看重的能力。
上海交通大學葉南陽助理教授招生條件可供參考(https://ynysjtu.github.io/)
Q2、電信/自動化同學能否跨保?
答案是肯定的。作為(wei) 一個(ge) 交叉性較強的前沿專(zhuan) 業(ye) ,計算機視覺歡迎各種專(zhuan) 業(ye) 背景的同學們(men) 加入,可以說跨保門檻較低。目前大多數理工科專(zhuan) 業(ye) 都會(hui) 學習(xi) 一些基本的數理和計算機技術,這為(wei) 我們(men) 學習(xi) 計算機視覺打下了良好的基礎。計算機視覺專(zhuan) 業(ye) 在招生上比較包容,因此各專(zhuan) 業(ye) 的同學在跨保時一定要對自己有信心!
Q3、計算機視覺看重專(zhuan) 業(ye) 還是學校title?
作為(wei) 一個(ge) 新興(xing) 的研究方向,為(wei) 它專(zhuan) 門開設一門專(zhuan) 業(ye) 的院校其實並不是特別多,更多情況下是納入計算機應用技術專(zhuan) 業(ye) 招生,或者從(cong) 事該方向的老師發布具有針對性的招生要求。因此,可以根據自己的實際情況來判斷到底是專(zhuan) 業(ye) 還是學校title更重要。如果已經下定決(jue) 心致力於(yu) 計算機視覺領域,那麽(me) 選擇實力強、具有權威性、走在前沿的導師組或者院校是很有幫助的。這會(hui) 使得你在讀研期間有豐(feng) 富的經費和資源支持、專(zhuan) 業(ye) 性極強的指導,從(cong) 而獲得更快速的成長、更廣闊的發展空間。如果你還並未下定決(jue) 心,隻是在沒有明確目標的情況下想嚐試這個(ge) 方向,那麽(me) 綜合實力更強、排名更前的學校可能更適合你。即使以後想改換專(zhuan) 業(ye) ,也能有更多的退路。
老師對計算機視覺領域詳細的介紹和解讀有沒有幫助到你呢?祝願每個(ge) 計算機保研er都能找到自己心儀(yi) 的道路~
評論已經被關(guan) 閉。