緒論:寫作既是個人情感的抒發,也是對學術真理的探索,歡迎閱讀由發表云整理的11篇數字圖像處理綜述范文,希望它們能為您的寫作提供參考和啟發。
【中圖分類號】G642 【文獻標識碼】A 【文章編號】1006-9682(2012)10-0001-03
一、引 言
數字圖像處理作為一門學科大約形成于20世紀60年代初期,并首次在航空航天領域取得了成功應用。數字圖像處理技術的發展除了與計算機技術、信息技術的快速發展密切相關以外,還得益于其在航空航天、工業、生物醫學、軍事、通信工程、商務、環境、林業等諸多領域的廣泛應用,正是這些應用需求,促進了數字圖像處理技術的深入研究和快速發展。“數字圖像處理”課程是隨著計算機和信息技術發展應運而生的一門新興課程,已成為信息類專業本科生的重要專業課。通過該課程的學習,要求學生掌握數字圖像處理的基本概念和原理,能夠對圖像進行各種處理,如圖像增強、圖像運算、圖像編碼、邊緣檢測等,為圖像通信、模式識別、計算機視覺以及其他交叉學科等工程領域的應用奠定基礎。
“數字圖像處理”課程的理論教學很抽象,僅僅通過理論教學學生很難掌握數字圖像處理的基本原理。如果把數字圖像處理的廣泛應用引入課堂理論教學,將具體知識點與其在實踐中的使用相結合,同時為學生提供邊學邊實踐的機會,不僅可以提高學生的學習興趣,加深對抽象理論知識的理解,增強其動手實踐的能力,還可以拓展學生的視野,與目前學科前沿技術相銜接。
二、視覺測量技術
在現代三維測量新技術中,視覺測量是由計算機視覺、圖像處理、模式識別等多學科交叉結合而形成的科學。圖1所示,視覺測量是一種非接觸性測量手段,以數字圖像作為信息載體,對被測目標進行成像,通過提取多個像面的二維像點信息,標定相機內、外參數,并重建、優化被測目標的三維信息,實現測量。視覺測量基于嚴謹的理論和現代的硬軟件設施,可以達到相當高的精度和可靠性,便于對大型工件、設備的尺寸、位置、三維輪廓等進行高精度測量,而且移動方便,可快速靈活地構建適于不同測量對象的系統,進行現場測量。目前,視覺測量技術已經廣泛應用于建筑工程、航空航天、汽車制造、生物醫學、考古等各個領域。[1~5]因此,視覺測量技術正在深入工業生產和社會生活的各個領域,研究和應用新的基于光學、數字圖像和視覺信息融合的三維測量方法,既具有重要的理論意義,又具有重大的實用價值,應用前景非常廣闊。
根據視覺測量的基本原理,利用數字圖像處理技術獲取的二維信息是視覺測量中相機標定、三維重建等環節的基礎,對于系統的測量精度、穩定性等方面具有決定性的影響,是視覺測量領域的關鍵技術。在長期的數字圖像處理課程教學以及視覺測量研究工作中發現,可以將視覺測量中關于數字圖像處理的應用內容引入課堂教學中,與具體理論知識相結合,加深學生對于課程理論的理解,使其接觸到科學研究的前沿內容。此外,通過設置開放性實驗等環節,引導有興趣和能力的學生進行實踐能力的培養,使學到的知識“活”起來。
三、視覺測量與數字圖像處理課程的融合
為了改善數字圖像處理課程的教學效果,提高教學效率,將視覺測量技術與數字圖像處理課程相融合,本文主要在教學方法和教學手段改革、視覺測量需求與理論知識點結合、實踐動手能力提高等方面進行了研究。
1.教學方法和教學手段改革
為了貫徹學生是教育主體的教育思路,使學生學會學習,并充分激發學生的創新能力和素質培養,促進學生個性的發展,同時有利于師生彼此促進共同進步的原則,針對數字圖像處理課程的特點,采取了以下措施:
(1)重視數字圖像處理課程的基礎理論教學。數字圖像處理內容豐富,應用靈活廣泛,但學生在掌握某些具體應用技術時感到理解困難。因此,在實際教學上,首先需要注重相關的基礎理論教學。[6]例如,數字圖像的本質是數字信號,所以在課程前期階段,專門有針對性地復習和講解了信號分析與處理方面的基本理論,包括數字信號處理的常用方法、離散傅里葉變換和快速傅里葉變換、離散余弦變換等,這些理論在數字圖像處理課程中有具體應用。這不僅有利于對數字圖像處理內容的掌握,也可以反過來加深對相關理論的理解。另一方面注意授課內容的精選,內容不在于多,而在于少而精,突出重點,使學生在有限學時內有最大的收獲。例如,在頻域空間進行圖像增強時,不能將頻域空間的所有方法都對學生講授,而是突出講解了關于頻域空間與時域空間處理之間的關系,針對頻域圖像平滑介紹一種低頻濾波器,分析其原理和特點。這樣不僅節省了教學時間,而且重點突出,同時也引導學生查閱其他相關方法,讓他們自己去動腦思考,提高其思維能力。
(2)完善和改革課堂教學方法。在課堂教學過程中,我們始終重視啟發式教學,遵循“提出問題”、“啟發式思考”、“解決問題”的教學過程,使用“問題教學法”引導學生去思考、分析問題,激發學生學習的積極性,提高教學效果。課堂開始時,根據授課內容,提前向學生拋出相關問題,在講課過程中則圍繞該問題講解課程內容,最后提出問題的解決方法。例如,在講解“直方圖均衡化圖像增強技術”一節內容時,首先向學生展示了兩幅曝光不足和曝光過量的圖片,并且為了提高學生的學習興趣,認識數字圖像處理的實際應用,圖片取自于視覺測量、航空交會對接定位等領域的實際圖片,向學生提問,“如果實際應用中,由于環境光的影響,拍攝到了這樣的圖片,應該怎么辦?”課堂講解過程中,隨著直方圖、直方圖增強技術的理論、直方圖均衡化方法等內容的展開,使學生逐漸理解并掌握直方圖均衡化方法,最后,給學生演示了直方圖均衡化方法的實現,并看到了利用該方法對圖片增強前后的圖片效果。這種啟發引導式的課堂教學方法,取得了良好的效果。
(3)傳統和現代化教學手段相結合。隨著計算機、通信技術應用的迅速普及,國內高校的課堂教學已普遍采用了多媒體技術,利用計算機、投影儀、幻燈機等現代化教學設備,結合計算機輔助教學(CAI)展示教學內容。這些現代化技術的確為課堂帶來了很多豐富多彩的教學手段。數字圖像處理是以圖像為處理對象,其輸出的形式主要以圖像和圖形為主,該課程也十分適宜將教學內容制成課件,采用多媒體計算機開展現代化教學。借助多媒體,使學生較直觀地看到各種圖像的處理需求、處理過程、處理效果等,這是普通教材和參考資料所無法比擬的。因此,我們針對課堂教學需求,進行了多媒體課程教學資源建設,如教學大綱、教學日歷、授課教案和課件等通過多媒體平成,便于講課,同時也便于學生課后的復習。例如,將視覺測量原理、過程等,通過多媒體課件的形式演示出來,相比較口頭介紹等方法具有更加直觀的效果。除了多媒體教學手段,傳統的板書式教學作為補充手段也在數字圖像處理課程中得到應用,主要用在課堂教學內容框架展示、理論推導等方面。
2.視覺測量與理論知識點結合
為了提高算法對于目標特征的識別效果,視覺測量通常采用圓形或方形特征點(圖2),在獲取的圖像中對特征的成像位置進行識別和精確定位。視覺測量對于圖像處理的要求主要包括圖像預處理、特征粗定位、特征精定位等內容,對應數字圖像處理課程中的圖像增強、邊緣檢測、特征識別、幾何運算等知識點。[7]
圖2 視覺測量常用特征點
(1)圖像預處理。圖像預處理的主要方法包括彩色圖像灰度化、圖像增強等,為此,在講解彩色圖像內容時,介紹了RGB、HSI等彩色模型以及不同彩色模型之間的轉換,并引出如何將彩色信息轉換成灰度信息。通過分析彩色表示模型,建立了彩色到灰度圖像的轉換。
向學生展示常用視覺測量圖像效果的基礎上,為了減少圖像噪聲的影響、提高圖像識別效果,提出改善圖像質量的目標,需要進行圖像增強。結合圖像增強中常用的直方圖增強技術、空域和頻域圖像增強方法在視覺測量圖像處理中的實際應用,給學生展示直觀的處理效果,加深對圖像增強方法的理解。
(2)特征點粗定位。數字圖像處理的邊緣檢測是該課程比較重要的一部分內容,邊緣檢測中包含了多種方法,便于學生對不同邊緣檢測算法的作用效果有直觀印象,將各種算法應用于視覺測量圖像征點的邊緣檢測,并有針對性地選擇相應參數,使學生不僅學習了各種邊緣檢測算法的使用,也看到了算法的特點。
根據視覺成像的特點,圓形特征點成像后一般為橢圓,所以,利用邊緣檢測得到的邊緣像點數據,講解用邊緣點進行指定特征識別的方法,如基于Hough變換的特征檢測方法。為了引導學生思考,采用啟發式講課方法,講解了Hough變換檢測直線的方法,引出如何用Hough變換檢測像面上的圓或橢圓,并鼓勵有能力的學生實現相應算法。
(3)特征點精定位。特征點精定位的目的是在實現特征點粗定位的基礎上,對圓形特征點中心在像面上的精確坐標進行定位。精確定位主要設計到數字圖像處理中的點運算,但需要考慮采用的具體定位算法,如灰度重心法、加權灰度重心法、橢圓擬合法等。引導學生通過文獻資料查找和實現相關定位算法,并且與國際領先的專業軟件進行定位精度對比。通過比較,可以使學生發現不同算法之間的區別,并分析不同的原因。進一步,引導學生嘗試對定位算法做一定的改進,這種改進,不需要從算法根本上做出很大的創新,只是從某一方面進行微小的變化,使其能夠適合特定的應用需求。例如,如果對視覺測量像面上特征點定位采用加權灰度重心法時,通過調整加權系數,得到不用的效果,從而分析加權系數對于定位精度的影響,并據此得出適用于該需求的結論。
四、開放性實驗
長期以來,“數字圖像處理”課程教學主要采用課堂理論教學,教學內容也多為經典的內容,很難反映課程內容的時代特征。實驗教學是高等教育的重要組成部分,是抽象思維與形象思維、傳授知識與訓練技能相結合的過程,在人才培養中具有課堂理論教學環節不可替代的作用,對培養理工科大學生的創造性是不可缺少的。雖然目前大多數課程都設置了實踐環節,但也普遍存在著很多問題,[8]例如,實驗課成績占課程成績比例小,學生對實驗的重視度不夠,存在著抄襲他人實驗結果和報告的現象;實驗模式單一,實驗內容陳舊、呆板,多為驗證性實驗,缺乏創新性和挑戰性,學生完全處于被動狀態,最終導致實驗不認真,敷衍了事,所學的知識和操作技術遺忘快;不能保證每個學生都有充分的時間和機會做實驗,個別學生逐漸養成依賴心理,最終只有一部分學生得到了鍛煉;理論課與實驗課教學老師分離,造成理論和實踐環節脫節等。
針對目前“數字圖像處理”課程實驗的現狀,根據視覺測量像面特征點定位需求,開設相關開放性實驗項目“視覺測量特征點提取定位實驗”,實驗要求學生結合數字圖像處理課程知識理論,對視覺測量采集的數字圖像進行處理,提取相關特征點。針對視覺測量中常用的特征點(圓形、方形)進行自動檢測,并實現高精度定位,主要實驗內容包括:圖像預處理、特征點粗定位、特征點精定位、算法設計與實現、實驗結果分析等。
教師在開放性實驗項目中承擔的角色主要是方案設計和實施過程中的指導、監督,對方案的具體實現方法不做限制性要求,主要由學生結合課堂教學內容以及查閱文獻資料來設計并完成。為了提高項目完成的效率,教師可以通過適當的引導為學生指出主要方向。
對于單個學生來說,這樣的實驗項目有些困難,“團隊合作”也是新時期對科技人才素質的要求,所以可以通過建立項目小組的方式開展實驗。小組成員將實驗內容進行分工,每人負責不同的部分,通過相互合作、幫助,完成整個實驗項目。通過這種形式,也在某種程度上鍛煉了學生的團隊合作意識和合作方法。
五、結束語
通過將視覺測量領域研究成果引入“數字圖像處理”課程,并在教學方法、教學手段、教學內容、開放性實踐等方面的改革和嘗試,逐步做到科學研究成果與課堂理論教學的有機結合,不僅豐富了課程的教學內容,提高了學生的學習興趣,加深了對理論知識的理解,而且使學生接觸到科學研究的前沿領域,開拓了視野,對創新能力的培養鍛煉等方面也具有重要意義。
參考文獻
1 E.M. Mikhail, J.S. Bethel. Introduction to Modern Photogramme
-try[M]. New York: John Wiley & Sons,2001
2 胡安文、季錚、盛慶紅.基于近景數字視覺測量的飛機表面模型重建[J].地理空間信息,2004(6):23~25
3 Nicola D’Apuzzo. Overview of 3D surface digitization technologi-es in Europe[C]. Three-Dimensional Image Capture and Applications VI, Proc. of SPIE-IS&T Electronic Imaging, San Jose (CA),2006
4 劉常杰、邾繼貴、葉聲華.汽車白車身機器視覺檢測系統[J].汽車工程,2000(6):373~376
5 彭三城、孫星明、劉國華.三維人體自動測量技術綜述[J].計算機應用研究,2005(4):1~5
【中圖分類號】TP391.41【文獻標識碼】A【文章編號】1672-5158(2013)02-0129-02
1.數字圖像處理技術的內容及特點
1.1 研究內容
不管應用到哪個領域的圖像處理圖像數據都要輸入、加工和輸出圖像,其研究內容:
(1)獲取、表示和表現圖像――把圖像信號轉化為計算機可以識別的形式,并把數字圖像顯示和表現出來。
(2)圖像復原――已知圖像發生退化的緣由時,對圖像進行修復,關鍵是建立退化模型。復原是以模型和數據的圖像恢復為基礎,消除退化的影響。
(3)圖像增強――對圖像質量的常規改善。當不知道圖像退化原因時,還可用此技術比較主觀的改善圖像。
(4)圖像分割――人類視覺系統可以輕松地將觀察到的對象區分開來,但計算機卻很難。分割的基本問題目前是將各種方法融合使用,以此提高處理的質量。
(5)圖像分析――檢測和測量圖像中的目標,獲取其客觀信息,是從圖像到數據的過程。
(6)圖像重建――指從數據到圖像的處理。
(7)圖像壓縮編碼――為減少數據容量、降低數據率、壓縮信息量,在不影響其效果的前提下減少圖像的數據量。
1.2 數字圖像處理技術的特點
(1)圖像再現性好――不會因為對圖像的變換操作而影響到圖像質量;
(2)圖像處理精度高――可以將圖像數字處理為任意大小的數組;
(3)適用面寬――來自不同信息源的圖像被變換為數字編碼形式后,都可以用數組來體現灰度圖像。
(4)靈活性高――圖像處理可完成線性及非線性處理。
2.應用領域
數字圖像處理技術被應用到越來越多的領域中,如醫療保健、航空航天、交通通信、軍事、工業、農業、林業等。下面選取幾方面進行分析:
(1)試聽資料證據――視聽資料證據是重要的訴訟證據,在司法訴訟活動中發揮著越來越重要的作用,數字圖像處理技術是視聽資料證據中圖像證據資料技術性司法鑒定的常用手段,是圖片原始性、真偽性、相關性認定的基本方法,如名捕監控錄像模糊圖像處理系統,該系統是手印、足跡、槍彈痕跡、工具痕跡、印章檢驗、文件檢驗以及錄像帶處理等痕檢、文檢、視頻圖像處理工作的必備工具;以及實時視頻降噪儀,能夠實時處理現場錄像流,增強視頻的清晰度,該在錄像安全系統中加強監視錄像的清晰度,或者在警方實地調查拍攝錄像后回到警署再進行降噪。
(2)電子商務――當前的電子商務中,圖像處理技術也大有可為,如身份認證、產品防偽和水印技術等。
(3)軍事公安領域――軍事的目標是偵察、制導和警戒系統和自動滅火器的控制及反偽裝;公安部門的現場照片、指紋、手跡、印章和人像等的處理和辨識;歷史文字和圖片檔案的修復和管理等。而數字圖像處理技術將數碼攝影和圖像處理技術結合起來以其獨特的優勢在公安領域中逐步開始擔當重任,在刑事攝影、檔案管理、痕跡檢驗、文件檢驗、法醫、物證提取以及公安教學或宣傳中發揮著巨大作用,為廣大的公安人員開闊了視野、拓展了思維空間,為執法的公正性提供了有力保證,應用提高了工作效率,減少了人、財、物的消耗,大大提高了工作效率。
(4)智能交通――圖像處理具有算法柔性大、適應能力強等特點,在智能交通系統中取得了廣泛的應用價值,例如車牌識別(車牌定位、車牌傾抖校正與字符分割、車牌字符識別變換等)和車輛檢測與跟蹤系統(包括感興趣區域提取、車輛檢測、車輛跟蹤等),智能車輛導航、車型識別、交通控制等。
(5)航空航天通信――包括圖像傳輸、電視電話和視會議等,主要是進行圖像壓縮甚至理解基礎上的壓縮。
(6)遙感技術――航空航天和衛星搖撼圖像獲取中和獲取后都要用圖像處理技術進行加工處理,提取出有利用價值的信息。主要用來對地形地質、礦藏資源搜索以及農業、水利、森林和海洋等資源調查研究,對自然災害進行預測預報、檢測環境污染、處理氣象衛星云圖以及識別地面軍事目標。
(7)生物醫學領域――圖像處理在醫學界的應用非常廣泛,圖像處理首先應用于細胞分類、染色體分類和放射圖像等,臨床診斷和病理研究中都大量接住了圖像處理技術。它的直觀、安全方便、無創傷的優點受到醫生和患者的青睞。
(8)工業生產中的應用――在生產線中對產品及部件進行無損檢測
(9)機器人視覺――機器視覺相當于智能機器人的重要感覺器官,可以對三維景物進行理解,醫院、工廠、郵政以及家庭中的智能機器人,識別和定位裝配線工件,太空機器人的自動操作。
(10)視頻及多媒體系統――目前,電視制作系統中廣泛使用圖像處理、變換和合成技術,使電視效果更佳。在多煤體系統中廣泛使用靜止圖像和動態圖像的采集、處理、存儲、傳輸和壓縮,以達到使用者的目的。
(11)科學可視化――圖像處理和計算機圖形學的緊密結合,使科學研究得各個領域有了更為新穎的研究工具。
(12)宇宙探測――由于探索太空的需要和太空技術的快速發展,需要用數字處理技術來處理從外太空獲取的大量星體照片。
(13)地質勘探――近年來發展起來的以數字圖像處理技術為基礎、綜合多門學科知識的地學信息處理新技術的多源地學信息綜合圖像處理,使用一些特定的圖像處理方法,實現了多源地學信息綜合圖像處理,用來輔助地質填圖,構造地質研究,進行寸產資源的預測和評估,成為當前地質工作者正在研究和探討的一個問題。
由圖像處理技術在以上幾個領域中的應用可以看出,圖像處理技術在各領域中的重要程度:計算機圖像生成技術在航空航海中可以充當仿真訓練系統,還可以應用到廣告和動畫制作,跟友人將其應用到網游中;圖像傳輸與通信還可在多媒體教學、網絡視頻領域得到廣泛應用;在醫學上,醫學圖像處理和材料分析也日益重要,如超聲成像、X光成像、Y光成像以及核磁共振成像,對醫生工作產生了巨大的輔助;圖像跟蹤和光學制導在戰略技術武器中發揮了重要作用。
3.發展方向
隨著計算機的發展,圖像處理技術將越來越成熟,對各領域的影響也越來越大,總的來說,圖像處理技術的發展有以下幾個趨勢:
(1) 在目前的基礎上,圖像處理速度越來越快,分辨率越來越高,多媒體應用光來月廣泛,標準化、立體化程度越來越高,并產生智能化的趨勢;
(2) 在目前二維基礎上將出現多維成像的趨勢;
(3) 芯片廣泛運用到圖像處理技術中,使用起來更加方便;
(4) 將出現新的算法與理論。
圖像處理技術在各個領域的應用與發展,大大降低了相應領域的工作難度,效率更高,質量也無可挑剔,使人類受益匪淺。日后圖像處理技術將進一步根據人類需求,在相關科研人員的努力奮斗下而實現新的突破,在更為廣闊的領域造福人類事業。
參考文獻
[1] 李紅俊,韓冀皖.數字圖像處理技術及其應用. 計算機測量與控制,2009.
[2]W.K.Pratt.DIGITAL IMAGE PROCESSING.Johnwiley & Sons,inc, 2008.
[3]楊枝靈,王開.Visual C++數字圖像獲取、處理及實踐應用.人民郵電出版社,2003
中圖分類號:TP312 文獻標識碼:A
1 數字圖像技術概述
數字圖像處理工具箱函數包括以下15類:(1)圖像顯示函數;(2)圖像文件輸入、輸出函數;(3)圖像幾何操作函數;(4)圖像像素值及統計函數;(5)圖像分析函數;(6)圖像增強函數;(7)線性濾波函數;(8)二維線性濾波器設計函數;(9)圖像變換函數;(10)圖像鄰域及塊操作函數;(11)二值圖像操作函數;(12)基于區域的圖像處理函數;(13)顏色圖操作函數;(14)顏色空間轉換函數;(15)圖像類型和類型轉換函數。
MATLAB圖像處理工具箱支持四種圖像類型,分別為真彩色圖像、索引色圖像、灰度圖像、二值圖像,由于有的函數對圖像類型有限制,這四種類型可以用工具箱的類型轉換函數相互轉換。MATLAB可操作的圖像文件包括JPG、HDF、JPEG、PCX、TIFF、XWD等格式。下面就圖像處理的基本過程討論工具箱所實現的常用功能。
圖像的讀寫與顯示操作:用imread( )讀取圖像,imwrite( )輸出圖像,把圖像顯示于屏幕有imshow( ),image( )等函數。imcrop()對圖像進行裁剪,圖像的插值縮放可用imresize( )函數實現,旋轉用imrotate( )實現。
圖像增強是數字圖像處理過程中常用的一種方法,目的是采用一系列技術去改善圖像的視覺效果或將圖像轉換成一種更適合于人眼觀察和機器自動分析的形式。
2 MATLAB圖像處理工具箱運用實例
為了證明MATLAB語言是一種簡潔,可讀性較強的高效率編程軟件,本文通過運用圖像處理工具箱中的有關函數對一實拍的芯片圖像進行處理。如圖1,圖“Fig.jpg”為一幅原圖像,該圖像右邊的剪切圖像為從“Fig.jpg”中剪切出的將用于分析的子圖像塊。為了便于分析與觀察,把子圖像塊旋轉90度置于水平位置并把該圖存在名為“Fig1.jpg”的圖像文件中。以上的過程可用以下代碼實現。
x=imread('E:\study\電子與通信\Term 2\數字圖像處理DIP\Fig.jpg');
figure,imshow(x);
y=imcrop(x);
figure,imshow(y,[]);
z=imrotate(y,90);
imwrite(z,'E:\study\電子與通信\Term 2\數字圖像處理DIP\Fig1.jpg','jpg');
isrgb(z)
原圖Fig.jpg 剪貼圖Fig1.jpg
圖1
經判斷得知該圖像為一真彩色圖像,首先把它轉換為灰度圖像,以下所有的進一步處理均采用經過灰度化處理后的圖像作為原圖。
通過比較灰度原圖和經均衡化后的圖形可見圖像變得清晰,均衡化后的直方圖形狀比原直方圖的形狀更理想。效果比較見圖2,程序代碼如下:
x=imread('E:\study\電子與通信\Term 2\數字圖像處理DIP\Fig1.jpg');
y=rgb2gray(x);
subplot(221),imshow(y);title('Fig1.jpg 灰度化圖像');
subplot(222),imhist(y);title('均衡化前直方圖');
I=histeq(y);
subplot(223),imshow(I);title('均衡化后圖像');
subplot(224),imhist(I);title('均衡化后直方圖');
圖2
3 結論
以上圖像處理實例只是對MATLAB圖像工具箱的一小部分進行運用,經過更進一步的圖像分割、二值化、歸一化等處理,可以把芯片中的字符特征提取出來送入神經網絡分類器進行識別,我們應用MATLAB神經網絡工具箱對字符分類進行模擬仿真也取得了較好的效果。由此可以看出MATLAB語言簡潔,可讀性強,工具箱涉及的專業領域廣泛且功能強大。圖像工具箱幾乎包括所有經典的圖像處理方法。由于工具箱具有可靠性和開放性,我們可以方便地直接加以使用,也可以把自己的代碼加到工具箱中以改進函數功能,同時,MATLAB中的小波工具箱也有許多函數可運用于圖像處理技術。因此,在圖像處理技術中使用MATLAB語言可以快速實現模擬仿真,大大提高實驗效率, 如果要開發實用程序,MATLAB語言還可以通過MEX動態連接庫實現與C語言的混合編程,為工程應用提供了更多的便利條件。
參考文獻
摘要:為了預防礦井下電機車撞人事故的發生,提出了一種基于數字圖像處理技術的軌道行人識別算法,首先對圖像進行尺度變換,裁剪,中值濾波,維納濾波,垂直邊緣檢測,二值化,密度模板匹配,閾值分割,連通域篩選和軌道擬合,識別出軌道,然后用行人和非行人樣本對支持向量機的參數進行訓練,最后運用支持向量機對軌道上的行人進行識別。運用該算法,對現場采集到的圖片進行Matlab仿真實驗,實驗結果表明該算法能很好的識別出軌道上的行人,做到提前報警。
關鍵詞 :電機車;數字圖像處理;軌道檢測;行人識別;報警
中圖分類號:TD7文獻標志碼:A文章編號:1000-8772(2014)19-0202-01
1 引言
礦用電機車多年來一直作為礦井下的主要運輸設備,由于礦井下情況復雜,機車運行頻繁,可能會發生電機車撞人事故,因此急需要一種監測報警系統,對行人進行識別報警。
目前運用在車輛上的檢測障礙物方法主要有:超聲波檢測、毫米波雷達檢測、紅外線檢測、激光檢測和攝像頭檢測等,在運動的電機車上,攝像頭檢測更具優勢,攝像頭檢測即圖像識別[1,2]。行人檢測被廣泛用于行人流量統計、智能車輛輔助駕駛、智能交通、防盜報警,行人報警等方面,具有廣大的應用前景[3]。行人檢測即從圖像或視頻中識別出行人,主要有兩步:特征提取和分類定位,行人的特征包括HOG特征,紋理特征,SIFT特征等;行人檢測的方法有:基于運動的方法、基于形狀的方法、基于模板匹配的方法和基于統計分類的方法等[3,4]。
將現有的行人識別算法用于礦井下軌道上的行人識別,具有豐富的理論依據和廣大的應用前景,可降低礦下機車撞人事故的發生。本文行人檢測的思想是:先識別軌道,再識別軌道上的行人。
2 MATLAB仿真
設原圖像的尺寸為:M×N M,N都為偶數,則下采樣后圖像的尺寸為:M/2×N/2。在下采樣后圖像中裁剪的區域為x坐標:x1x2,y坐標:y1y2。中值濾波的尺寸為3×3,維納濾波的尺寸為5×5,垂直邊緣檢測算子為:。 密度匹配模板尺寸為3×3。垂直邊緣檢測出的圖像和密度圖像的二值化閾值都采用Otsu方法求得。檢測窗口的大小為,塊的大小為64×128,塊的重疊率為,一個塊內的單元數為4,單元的大小為8×8,在[-π/2,π/2]將梯度方向均勻的劃分成9個區間[5-9]。圖1中白色矩形區域為經支持向量機識別出的行人。
3、結論
一種基于數字圖像處理技術的軌道行人識別算法能識別出軌道和行人,做到提前報警,本文僅從算法上實現,還需結合硬件,才能將該算法用到實處,在現實環境中,該算法的性能也有待檢驗。該行人識別算法可進一步推廣,用到現實中各種場合的行人識別。
參考文獻:
[1] 王榮本,趙一兵,李琳輝等.智能車輛的障礙物檢測研究方法綜述[J].公路交通科技,2007,11:109-113+124.
[2] 賈慧星,章毓晉.車輛輔助駕駛系統中基于計算機視覺的行人檢測研究綜述[J].自動化學報,2007,01:84-90.
[3] 王興寶.復雜場景下多姿態行人檢測與識別方法研究[D].蘇州大學,2012.
[4] 蘇松志,李紹滋,陳淑媛,蔡國榕,吳云東.行人檢測技術綜述[J].電子學報,2012,04:814-820.
[5] 范昕煒.支持向量機算法的研究及其應用[D].浙江大學,2003.
[6] 方莉,張萍.經典圖像去噪算法研究綜述[J].工業控制計算機,2010,11:73-74
[7] 陳剛.基于多特征的行人檢測方法研究[D].吉林大學,2012.
中圖分類號:TP3 文獻標識碼:A 文章編號:1007-9416(2014)02-0120-02
Abstract:DSP hardware based license plate recognition system characteristics, analyzes plate region improved positioning algorithm, character segmentation algorithm to improve the efficiency of the license plate recognition.
Key Words:license plate identification;DSP;algorrithm
1 引言
據公安部相關數據統計,現如今我國汽車保有量已達2.4億輛,且每年的增長率都在15%以上,應用智能交通系統來解決隨之產生的交通問題已是大勢所趨。基于DSP的車牌識別方法是智能化車牌識別的有效方法。現如今,自動車牌識別技術已被廣泛應用,但由于算法的復雜性與效率的矛盾,及算法于系統上的應用的困難性,對車牌識別的關鍵算法還有待于更深入的研究。
2 硬件系統結構
通用可編程的DSP芯片的硬件技術的發展給數字圖像處理帶來了飛躍性的進步。要實現車牌識別,需要數字圖像處理技術中的很多復雜的算法,基于DSP的車牌識別系統也因此得到了廣泛的研究與應用。為了提高整個系統的可操作性及性價比,當前應用最多的是分布式的處理模式,即聯合PC機與DSP的優勢共同完成車牌識別系統,其總體結構及具體結構如(圖1)所示:
3 車牌識別關鍵算法
算法流程為圖像預處理、車牌定位、車牌分割,最后字符識別。圖像預處理為提高攝像機攝取的圖像質量,便于后續處理。利用DSP技術在處理車牌識別關鍵算法中的車牌的定位與字符分割方面優勢顯著。
3.1 車牌定位
基于灰度圖像的定位技術日趨成熟,但彩色圖像包含了圖像的更多信息特征,加之車牌的底色是有規律可循的,所以基于彩色圖像的定位技術越來越成為在發展定位技術上的突破點。本文定位的思路為:
(1)圖像從RGB空間轉換到HSI空間,其算法為(以藍底白色車牌為例):
(3)對二值圖像進行水平投影[1],從車牌固有的矩形特征中的高度特征提取車牌圖像,如圖3所示。再使用特征顏色邊緣檢測法,檢測車牌正確位置,如圖4所示。
(4)根據車牌固有的矩形特征中的寬度特征,使用垂直投影法提取車牌圖像,如(圖5)所示:
3.2 字符分割
字符分割是字符識別的關鍵前提。在2013年新交通法規中規定,對故意遮擋、污損、不安規定安裝車牌的扣12分的處罰,這項規定的出臺,也間接降低了算法的復雜性。本文采用車牌字符間隔的特征在垂直投影中的規律來進行字符分割。
其算法原理為:
(1)設垂直投影值為T,閾值為V,在確定前還要充分考慮字符粘連、斷裂及“1”字符的特殊性。當時,T=0。
(2)設數組為從左向右掃描的投影值,當掃描的數組的值時,字符的寬度設為。根據規律[2],單個字符的寬度約為45mm,除第2、3字符的間隔為34mm,其它字符的間隔均為12mm。由此,得出以下3中情況:
(1)時,為字符粘連,取為單個字符的寬度;
(2)且后面的字符也如此時,為字符斷裂,合并這兩個字符;
(3)且不滿足字符斷裂,此字符為數字“1”。
實驗結果如(圖6)所示:
4 結語
本文在以DSP處理器TMS320DM6437嵌入式系統上對以上兩大關鍵算法進行實驗研究,在150張不同類型的車牌進行識別后,測試結果的正確率92.3%,且處理的速度達到實時處理的需求。為以后在智能交通控制系統中的車牌識別技術的提高和發展提供了參考基礎。
參考文獻
中圖分類號:TP212 文獻標識碼:A 文章編號:1007-3973(2012)011-059-02
1 引言
電網GIS平臺是提供電網圖形和分析服務的企業級電網空間信息服務平臺,該平臺建設主要工作就是基礎地理數據及電力設施坐標數據采集。在將原始影像信息如矢量地圖、航空航天影像、數字高程模型、導航數據等應用在GIS平臺用于分析、決策、管理之前,對原始數據的處理展現必不可少。
對圖像進行一系列的操作,以達到預期的目的的技術稱作圖像處理技術。公共設施、發電、輸電、變電、配電等方面都對數據有不同精度的采集要求,在像源一定的情況下,對已采集到的數據使用圖像處理技術進行二次加工,以滿足不同程度的應用需求也是目前亟待研究的課題之一。
2 圖像處理基本技術
數字圖像處理的研究源于兩個領域:其一是為了便于人們分析圖像信息進行改進;其二是為使機器自動理解而對圖像數據進行存儲、傳輸及顯示。
由于電網GIS影響多來源于衛星影像,而衛星傳感器系統所采集的圖像受到所在平臺、太陽位置及角度、外界天氣條件、飛行器位置姿態等等條件的制約和影響,會表現出一定程度的模糊、失真、扭曲變形、斑點噪聲等等現象,在一定程度上降低了圖像的質量,這就使得這些原始圖像數據并不能直接被用于電網分析、決策,圖像處理技術的應用必不可少。
2.1 圖像幾何校正
遙感圖像幾何校正是針對圖像幾何畸變而展開的誤差校正。遙感圖像的幾何畸變表現為像元相對于地面目標實際位置發生擠壓、扭曲、變形等。其基本環節有兩個,即像素坐標變換和重采樣。一般步驟如圖1所示。
2.2 圖像重采樣
圖像重采樣的目的主要是保證圖像像素的連續性,因為對遙感圖像空間分辨率進行提升時,需要利用插值的手段在空出的像素上補上對應的值,使整個圖像平滑,有利于進一步處理。其最基本方法有三種:最近鄰插值、雙線性插值和雙三次插值。
2.3 圖像增強
圖像增強就是采用一定的方法對圖像的某些特征進行調整,以突出圖像中的某些感興趣信息,同時抑制或去除不需要的信息來提高圖像質量。它的主要目的是改變圖像的灰度等級,提高對比度;消除邊緣噪聲,平滑圖像;突出邊緣及圖像主要信息,銳化圖像、壓縮數據量等。
圖像增強主要方法根據處理空間的不同,分為空間域方法和頻率域方法兩大類??臻g域增強主要是通過改變像元及相鄰像元的灰度值達到增強的目的。而頻率域增強則是通過對圖像進行傅里葉變換后改變頻域圖像的頻譜來達到圖像增強的目的。此外,根據圖像處理的范圍又可以將增強處理技術分為全局(整幅圖像)處理和局部(部分圖像)處理兩種。
2.4 圖像融合
圖像融合也是信息融合的一種,它把針對同一目標或場景的由相同或不同傳感器、相同或不同成像方式、同時相或不同時相獲得的多個圖像,通過一定的融合規則取長補短變成一幅能反映多重原始圖像信息的、能對目標或場景做綜合描述的融合圖像,以便于進一步處理。
高效的圖像融合方法可以根據需要綜合處理多源通道的信息,從而有效地提高了圖像信息的利用率、系統對目標探測識別地可靠性及系統的自動化程度。其目的是將單一傳感器的多波段信息或不同類傳感器所提供的信息加以綜合,消除多傳感器信息之間可能存在的冗余和矛盾,以增強影像中信息透明度,改善解譯的精度、可靠性以及使用率,以形成對目標的清晰、完整、準確的信息描述。
依據在融合處理流程中所處的階段,按照信息的抽象程度及目標識別層次上,可以將圖像融合分為三個層次,即像素級融合,特征級融合和決策級融合三種。
2.5 圖像裁剪與拼接
圖像裁剪顧名思義就是將圖像中的感興趣區域提取出來。而圖像拼接技術則是將數張有重疊部分的圖像(可能是不同時間、不同視角或者不同傳感器獲得的)拼成一幅大型的無縫高分辨率圖像的技術。圖像配準和圖像融合是圖像拼接的兩個關鍵技術。
圖像配準就是對同一景物在不同時間、用不同探測器、從不同視角獲得的圖像,利用圖像中公有的景物,通過比較和匹配找出圖像之間的相對位置關系。一般而言,圖像配準方法包括特征空間、搜索策略和相似性推測三個部分。圖像配準技術經過多年的研究分為三個基本類別:基于灰度信息的方法,基于變換域的方法和基于特征的方法。
圖像配準是圖像融合的基礎,而且圖像配準算法的計算量一般非常大,因此圖像拼接技術的發展很大程度上取決于圖像配準技術的創新。
2.6 圖像壓縮與編碼
圖像的壓縮與編碼所解決的問題是盡量減少表示數字圖像時所需要的數據量。減少數據量的基本原理是出去其中多余的數據,以數學的觀點來看,這一過程實際上就是將二維像素陣列名變換為一個在統計上無關聯的數據結合,這種變換在圖像存儲或傳輸之前進行。經典壓縮編碼方法有:哈夫曼編碼,算術編碼,游程編碼、變換編碼等。
3 GIS平臺與圖像處理
GIS是近些年迅速發展起來的一門空間信息分析技術,它是一個綜合的學科產物,隨著計算機科學、地理學、數學、測繪等學科的發展而飛速發展。GIS不僅可以有效地管理具有空間屬性的各種資源環境信息,對資源環境管理和實踐模式進行快速和重復的分析測試,便于制定決策、進行科學和政策的標準評價,而且可以有效地對多時期的資源環境狀況及生產活動變化進行動態監測和分析比較,也可將數據收集、空間分析和決策過程綜合為一個共同的信息流,明顯地提高工作效率和經濟效益,為解決資源環境問題及保障可持續發展提供技術支持,GIS平臺建設也是電網建設的重點項目之一。
數字圖像處理是GIS平臺的底層操作基礎,如GIS中的編輯、查詢、存儲等都是運用了數字圖像處理的理論。GIS圖像的像源多源自遙感影像,圖像處理技術則貫穿于從遙感影像成像到進入決策分析的全過程。在GIS的發展中也會越來多用到遙感影像處理技術,并且GIS要實現動態分析需要處理海量數據,圖像壓縮與編碼技術則是不可或缺的解決方案。
4 結語
本文致力于將電網GIS平臺可能會涉及的圖像處理技術對讀者進行簡要說明,讓讀者對其產生感性認識。其內容包括但不限于上文中所提到的領域,圖像處理技術的發展日新月異,且領域也在不斷擴展,相信未來會有更多、更先進的圖像處理方法會應用于電網GIS中,以不斷提高分析決策水平。
參考文獻:
[1] 岡薩雷斯.數字圖像處理[M].北京:電子工業出版社,2007.
[2] 湯曉春.遙感圖像增強方法的研究及實現[D].華中科技大學,2008.
[3] 廉明.遙感中的幾何校正技術[D].北京化工大學,2007.
[4] 宋智禮.圖像配準技術及其應用的研究[D].復旦大學,2010.
中圖分類號:TM76 文章編號:1009-2374(2016)21-0047-03 DOI:10.13535/ki.11-4406/n.2016.21.023
1 概述
隨著信息技術的發展,人類逐漸步入信息化時代。在此過程中所引起的信息革命給許多傳統行業帶來了巨大的沖擊,信息化時代的四大特點――智能化、電子化、全球化、非群體化成為了許多行業變革的風向標。而信息化時代的代表性象征――計算機在各行各業中的必要性與日俱增,在電力行業中也不可避免。
而電力行業作為關乎國計民生的傳統行業,在信息化時代中也面臨著如何更高效地利用能源、如何更安全可靠地供電、如何更好地了解用戶需求等諸多方面的新挑戰,于是“智能電網”的概念應運而生。
2 智能電網
2.1 智能電網的概念
智能電網是將信息技術,如通信技術、傳感技術、計算機技術和控制技術等融入電力系統之中,使整個電力系統更加安全可控,成為高效智能的新型電網。由于各國的國情不同,因此各個國家對智能電網的具體要求也會有不同的側重點。因為我國還是一個發展中國家,與國外發達國家的電力工業已步入成熟期不同,我國在發展智能電網的同時,還需要加強骨干電網建設。因此除了要建設能夠充分滿足用戶對電力的需求和優化資源配置,確保電力供應的安全性、可靠性和經濟性,滿足環保約束,保證電能質量,適應電力市場化發展的堅強智能電網外,我國的智能電網建設還需要滿足以特高壓電網為骨干網架,各級電網高度協調發展。
2.2 智能電網的特點
智能電網一般包括有以下七個特點:
2.2.1 能量互聯網:智能電網要求實現供電方和用戶之間的交互,構建多向電力流,它主要由能量管理系統和配電管理系統組成。其中能量管理系統提供整個電網的實時狀態信息,并根據實時信息選擇最優發電方案,減少輸電損耗,維護系統可靠性以確保供電穩定;配電管理系統提供配電網絡的實時狀態信息,允許供電方遠程控制斷電的隔離與恢復,管理可再生能源發電。
2.2.2 降低損耗:智能電網能夠基于“能量互聯網”中的實時信息,根據用戶的需求來供電,通過電壓控制來降低電力損耗。同時還可以沿輸電線放置傳感器和電容器,通過無功負載控制來減少電力損耗。減少電力損耗的同時還會降低二氧化碳的排放量,使電網系統更加低碳環保。
2.2.3 融入可再生能源發電:目前可再生能源發電的最大缺點在于可變性過大,產電不穩定。智能電網能夠通過儲電技術,在產電過剩時將多余電能存儲起來,在供不應求時再通過智能電網的自動化技術供能,進而解決可再生能源產電不穩定的問題。
2.2.4 減少輸電阻塞:智能電網能夠檢測輸電線的實時度數,在可能發生輸電阻塞時,傳感器和控制器會及時地重新安排電力輸送線路,使得電力能夠最大限度地流過線路而不發生阻塞。
2.2.5 分布式發電:通過智能電網的雙向電力流,用戶自行通過太陽能、風能等可再生能源產生的電力可以出售給供電方,流入配電網絡中,使電網系統在用電高峰期可以為用戶提供更穩定的供電服務。
2.2.6 自愈:智能電網能夠基于實時測量的概率風險評估確定最有可能失敗的設備、發電廠和線路,及時進行隔離和恢復,從而減少大面積用電故障的出現。同時,智能電網還能實時分析電網的整體健康水平,及時觸發可能導致電網故障發展的早期預警,并根據具體情況確定是否立即進行檢查或采取相應措施。
2.2.7 用戶需求管理:智能電網能夠通過智能電表實時通知用戶其電力消費成本、實時電價、電網的狀況、計劃停電信息等信息,使用戶可以根據這些信息制定自己的電力使用方案,繼而通過影響用戶需求來促進電力供求平衡。
2.3 智能電網的相關技術
智能電網的關鍵基礎技術主要包括集成的通信技術、先進的傳感和測量技術、先進的電網設備技術、先進的控制技術以及決策支持和可視化技術。
3 計算機科學在智能電網中的應用
在電網智能化的過程中,計算機是必不可少的。而計算機科學在智能電網中也有諸多應用,其中云計算、數字圖像處理、數據挖掘、人工智能和軟件工程這些計算機科學相關技術在智能電網中尤為重要。
3.1 云計算
云計算是分布式計算的一種特殊形式,根據美國國家標準與技術研究院的定義,云計算可以實現隨時隨地、便捷、按需地從可配置計算資源共享池中獲取所需的資源,資源可以快速供給和釋放,使管理的工作和服務提供者的介入降低至最少。
云計算技術能夠整合優化電網系統中的各種異構資源,如電力系統中的監控維護資源、配電管理資源和市場運營資源等。利用云計算支持廣泛企業計算和普適性強的特點,能夠構建更加高效的智能電網數據中心,實現基礎設施資源的自動化管理。例如利用Google的Borg能夠使大量服務器協調工作,繼而實現大規模系統的可靠性管理。
而智能電網信息系統所產生的大量數據,更需要通過云計算來實現分布式存儲和管理。利用云計算來實現海量數據的分布式存儲,可以通過冗余存儲和高可靠性軟件來提高數據的可靠性,并能較好地達到成本、可靠性和性能的最佳平衡。例如利用Google的GFS文件系統可以實現數據的冗余存儲,并大幅度降低主服務器的負擔,使系統IO高度并行工作,從而提高系統的整體性能。智能電網所產生的數據種類眾多,而云計算的數據管理技術能夠較好地滿足智能電網信息平臺數據種類繁多的海量服務請求,因此云計算能夠高效地管理智能電網信息平臺中的多元數據。例如,利用Google的BigTable,通過一個巨大的分布式多維數據表,將數據都作為對象,并通過關鍵字、列關鍵字和時間戳來進行索引,滿足各類數據的性能要求,進而實現多元數據的高效管理。
為了保證電網系統運行的安全穩定,智能電網需要通過大規模的電力系統計算來監控整個電網系統的運行狀態,如暫態穩定計算、故障計算、拓撲分析、數據挖掘與智能決策等,計算量極大,而云計算可以為智能電網提供高性能的并行計算與分析服務。例如利用Google的MapRduce,可實現針對大規模數據集的并行計算。
3.2 數字圖像處理
數字圖像處理是指通過計算機對圖像進行去噪、增強、復原、分割以及提取特征等處理,從而改善圖示信息,以便人們解釋或機器自動理解。
在智能電網系統所產生的海量數據中有不少的數據都是圖像數據,例如對輸電線路狀態的遠程監測常常通過線路圖像/視頻監控系統來實現。為了能夠實現對輸電線路狀態全天候全方位的實時監控,采用智能化和自動化的手段來代替人工是必然的趨勢。但原始圖像中包含的噪聲太多了,價值密度低,難以用于智能識別。在這種情況下,可以通過數字圖像處理中的灰度變換、直方圖修正、小波包去噪、圖像銳化以及邊緣檢測等處理方式來增強圖像對比度,去除噪聲,加強圖像的輪廓特征,以便于特征的提取和識別,進而產生價值密度較高的特征數據集,為輸電線路狀態的智能識別過程做好圖像數據的預處理。
3.3 數據挖掘
數據挖掘是指從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的,但又是潛在有用的信息和知識的過程。數據挖掘的方法包括分類、聚類、關聯分析、預測等。
由于智能電網系統中的數據具有數據量巨大、數據類型繁多、價值密度低以及處理速度快的特點,智能電網系統中的數據屬于無法在一定時間內用傳統數據庫軟件工具對其內容進行抓取、管理和處理的“大數據”,需要通過數據挖掘來提取其中隱含的有價值的信息,從而實現對整個電網系統多角度、多層次的精確感知。例如,通過對長期的、大量的用戶用電數據進行數據挖掘,對不同地區以及不同用戶進行分類,可以得到有助于優化配電調度的信息,并能為電費定價調整提供參考;由于在當今社會中各行業的發展都離不開能源的使用,因此對用電數據進行挖掘甚至還可以歸納總結出各種指標增長率與社會用電情況的一般規律,便于政府了解和預測社會各行業發展狀況及用能情況,為政府決策提供參考。而通過對長期的、大量的電動汽車充電數據進行數據挖掘,可以為充電站的布點提供參考。通過對長期的、大量的可再生能源發電情況進行數據挖掘,有利于降低可再生能源產電不穩定對供電網絡的影響,進而更好地融入可再生能源發電。此外,數據挖掘還有利于用戶能效的分析管理、業務拓展分析、供電輿情監測預警分析、電力系統的故障預測和狀態檢修、短期電網負荷預測、城市電網規劃等。智能電網系統的數據特性表明了數據挖掘在智能電網中有著廣泛的應用。
3.4 人工智能
根據著名人工智能科學家Michael R.Genesereth和Nils J.Nilsson在1987年提出的定義,人工智能是研究智能行為的科學,它的最終目的是建立關于自然智能實體行為的理論和指導創造具有智能行為的人工制品。人工智能是一門研究如何將人的智能轉化為機器智能或者用機器來模擬或實現人的智能的學科。
數據挖掘在智能電網中有著廣泛的應用,而數據挖掘需要人工智能技術來提供數據分析的技術支持,因此人工智能在智能電網中也有著十分重要的應用。例如,通過構建人工神經網絡來對經過數字圖像處理所得的典型線路狀態的監控圖像特征數據集進行訓練識別來實現輸電線路狀態的智能識別。除了故障診斷外,人工神經網絡還可應用于智能控制、繼電保護、優化運算等
方面。
除了為數據挖掘提供數據分析的技術支持外,人工智能還可以通過人類專家提供的經驗和知識來構建相應的專家系統,如電網故障診斷和調度處理專家系統和操作票專家系統等,模擬人類專家解決問題的過程來進行決策,從而實現電網自動化和智能化。
而采用遺傳算法、粒子群算法等進化算法求解諸如發電廠和輸電線架設的規劃問題以及電力系統中各種控制參數的最優解等問題或利用模糊集理論來處理電力系統中難以實現精確控制的復雜問題,也是人工智能在智能電網中的重要應用。
3.5 軟件工程
根據Fritz Bauer在NATO會議上給出的定義,軟件工程是建立和使用一套合理的工程原則,以便獲得經濟的軟件,這種軟件是可靠的,可以在實際機器上高效的
運行。
為了便于管理和使用,無論是供電管理方還是用戶方都會希望通過一個穩定可靠,功能完備,并具有友好人機界面的軟件來方便操作。因此在建設智能電網的過程中勢必需要開發相應的軟件,軟件工程便應用于其中。尤其是對用戶端而言,在移動設備使用越來越廣泛的今天,開發相應的移動端的APP無疑能夠更好地促進用戶參與到交互過程中。一個針對用戶個體,能夠實時顯示如電力消費成本、實時電價、電網狀況、計劃停電信息等的智能電表提示信息,結合數字家庭技術,能夠遠程控制家電開關以便于用戶隨時隨地調整自己的用電情況,并整合線上業務申請、繳納電費等功能的APP能夠極大程度地減輕用戶的操作負擔,方便用戶的使用,使智能電網更加高效智能。
4 結語
計算機科學在智能電網中的廣泛應用使電力行業在信息化時代中能夠更好地應對各種新挑戰,為整個社會的發展帶來深遠的影響。
參考文獻
[1] 肖世杰.構建中國智能電網技術思考[J].電力系統自動化,2009,33(9).
[2] 李乃湖,倪以信,孫舒捷,等.智能電網及其關鍵技術綜述[J].南方電網技術,2010,4(3).
[3] 楊德昌,李勇,C.Rehtanz,等.中國式智能電網的構成和發展規劃研究[J].電網技術,2009,33(20).
[4] 王德文,宋亞奇,朱永利.基于云計算的智能電網信息平臺[J].電力系統自動化,2010,34(22).
[5] 彭小圣,鄧迪元,程時杰,等.面向智能電網應用的電力大數據關鍵技術[J].中國電機工程學報,2015,35(3).
[6] 宋亞奇,周國亮,朱永利.智能電網大數據處理技術現狀與挑戰[J].電網技術,2013,37(4).
[7] 張東霞,苗新,劉麗萍,等.智能電網大數據技術發展研究[J].中國電機工程學報,2015,35(1).
[8] 金華,王民,昝濤,等.基于數字圖像處理的輸電線路狀態智能識別技術[J].微計算機信息,2012,28(4).
[9] 韓禎祥,文福拴,張琦.人工智能在電力系統中的應用[J].電力系統自動化,2000,24(2).
1 引言
近年來,人們提出了許多方法用于檢測和跟蹤序列圖像中的運動目標,但是由于受到計算機速度和算法復雜度的限制,使得在檢測和跟蹤運動目標的實時性和魯棒性方面總是不太理想。同時在設備不斷小型化、集成化、網絡化的今天,FPGA由于其可編程的特點成為嵌入式開發的最佳平臺。因此,本設計核心模塊為Altera公司的Cyclone系列FPGA EP4CGX150DF3117N核心處理器,以提高系統的整體的性能。[1]
2 系統工作流程和原理
系統主要由一體化攝像機、高速數字云臺、視頻解碼器SAA7113H、圖像存儲器SRAM,FPGA控制器、以太網模塊、監視器、報警模塊等部分構成。
該跟蹤系統的工作過程為:系統開機后FPGA加載程序,然后根據算法對采集到的圖像進行處理,獲得控制云臺的參數并傳遞給云臺控制器,從而跟蹤目標運動。具體實現過程:攝像頭安裝在跟蹤轉臺上,攝像頭輸出的電視制式的信號(含有圖像和同步、行場消隱信號)一路送到監視器上進行實時監視,另一路經過視頻預處理,經過SAA7113變換后送入圖像處理單元FPGA進行圖像處理,圖像處理單元首先形成一個檢測(波門)窗口,然后在窗口中檢測、識別、提取出目標圖像信號,確定出目標在當前幀觀測圖像中的精確坐標,經計算得到相對于攝像頭瞄準線的偏差量,送至伺服機構,云臺輸出控制信號控制步進電機轉動,帶動云臺上的攝像頭轉動,使目標始終處于視場中心,從而達到跟蹤的目的[2]。通過以太網上傳目標坐標數據,用于進一步分析。
3 裝置硬件的具體實現
本裝置對核心處理器、視頻解碼芯片,以太網模塊等器件的選擇關系到整個裝置的性能和價格,即選擇性能價格比高且能滿足設計需要的器件。
3.1核心處理器選擇
處理器需要根據算法及實際被測目標對處理能力的要求來選擇。目前的處理器主要有單片機、ARM、DSP、FPGA等等。本裝置核心模塊主要是Altera公司的Cyclone系列FPGA EP4CGX150DF3117N,該芯片有149760個邏輯單元,RAM 635520 bit, 8個鎖相環,用戶I/O 508個,芯片具有很高的性價比,還支持SOPC ,從而完成各模塊功能,并協調整個系統工做。芯片功能很強大,為以后系統升級,算法改進,數據量增大提供很大空間。
3.2 視頻解碼芯片SAA7113 和以太網W5100配置
為了使視頻解碼芯片SAA7113H可以按照預想的方式工作,需要對其進行初始化,視頻解碼芯片為I2C串行總線,在上電后首先修改SAA7113H的內部寄存器的數值,進行正確初始化[3]。
W5100是一款多功能的單片網絡接口芯片,內部集成10/100以太網控制器,內部集成為全硬件形式,且具有經過多年市場驗證的TCP/ IP協議棧,太網介質傳輸層MAC和物理層PHY 硬件,TCP/IP等協議已經在很多領域經過多年驗證[4]~[5]。
W5100內部集成有16KB的存儲器用于數據傳輸,使用W5100不需要考慮以太網的控制,只要進行簡單的端口SOCKET編程。此外,其接口非常簡單,可選擇SPI接口。
對上述兩個模塊的設計采用SOPC方法,SOPC是一種用于嵌入式開發的片上可編程系統,設計靈活,可剪裁,可升級軟硬件在系統可編程的功能,運用FPGA 的NIOS II 對 I2C,對SPI口配置過程為:運行QUARTUS II 軟件中的SOPC BUILDER 添加I2C,SPI 模塊,從而構成功能強大的32位NIOS嵌入式系統。
4 目標的跟蹤定位
確定目標位置的方法分兩類,即波門跟蹤和相關跟蹤算法。本文采用形心跟蹤算法,該算法對跟蹤窗內的數字圖像處理得到一閾值,再從跟蹤窗內的數字圖像中分割出目標像元,然后根據分割出的全體目標像元位置數據和目標像元的點數,計算出目標的形心,目標的形心相對于視場中心的位置數據則作為目標偏差數據[6]。
5 結論
本文介紹了一種移動目標跟蹤裝置。該裝置是以ALTERA公司的FPGA芯片EP4CGX150DF3117N為核心處理器。通過以太網上傳的跟蹤信息來看,看該系統取得了較好的跟蹤效果,實驗結果證明該裝置能夠很好的適應目標檢測和跟蹤算法,該裝置對運動目標監視和跟蹤產品有一定的參考意義。
參考文獻
[1]楊宜禾,周維真.成像跟蹤技術導論[M].西安電子科技大學出版社,1992.
[2]王栓,艾海舟,何克忠.基于差分圖像的多運動目標檢測與跟蹤[J].中國圖形圖像學報,1994(6).
[3]郝迎吉,劉青,徐凌志.基于EPP和FPGA的CMOS圖像傳感器的數據采集[J].電子設計應用,2002(01).
[4]黃釘勁,阮照軍,王剛,郭小莉.基于FPGA的圖像采集與遠程傳輸系統設計[J].西安工業大學學報,2008.
[5]放璐,楊天怡,牟萬軍.數字圖像遠程監控系統的組網方式[J].電子產品世界,2002(21).
0 引言
圖像復原技術是當今圖像處理研究領域的一個重要分支。目的是去除或減輕在獲取數字圖像過程中發生的圖像質量下降即退化的問題,從而使圖像盡可能接近真實的場景。景物形成過程中可能出現畸變、模糊、失真或混入噪聲,使所成圖像降質,則稱為圖像的“退化”。
運動模糊圖像的產生原因可能是由于攝像機與被攝物體之間的相對運動或曝光瞬間相機抖動造成的。通過硬件上的去模糊技術并不容易實施且往往價格昂貴。因此,軟件補償非常流行。先通過數學方法將運動模糊建模為點擴展函數(psf)與圖像的卷積。再由去模糊方法如迭代算法Lucy-Richardson或非迭代算法 Wiener 算法[1]或更復雜的方法如Bussgang算法[2]重建原始圖像。由于清晰的源圖像信息是未知的,因此為了重建圖像需要估計點擴散函數。很多方法估計psf已經發展的很好[3-4]。估計點擴散函數的方法很大程度依賴于特定類型的圖像如天文學和天體物理學的照片,電腦斷層掃描圖像,或顯微鏡圖像。本文提出一個估計點擴散函數參數的新方法。對圖像先進行預處理,在做參數識別和復原濾波,從而更準確的恢復清晰圖像。實驗結果證明本文方法效果較好。
1 圖像恢復方法的數學模型
2 快速恢復算法
2.1 點擴散函數的估計
如果引起圖像退化的點擴散函數具有零點,這些零點就會迫使退化圖像的頻譜在某些特定的頻率上變成0,表現在頻譜上就會出現一系列暗線。對于水平勻速直線運動的模糊圖像而言,會在n/L處存在零點,其中n為整數,L為模糊的長度,因而圖像在頻率平面上存在一些垂直的等間距直線。對于任意方向運動模糊圖像,例如β方向的模糊圖像,其頻譜一定在β+90°的方向存在暗線。圖像頻譜暗線的個數即為圖像實際運動的距離,單位為像素。圖1(a)顯示lena圖像由于運動模糊降質退化。在傅里葉頻譜的圖像中,如圖1(b)平行深色的線條是顯而易見的。
2.2 去模糊的新算法
4 結論
本文提出了一個精確性、魯棒性較好的方法恢復模糊圖像。對圖像去模糊之前先做預處理,利用Butterworth帶通濾波器先進行濾波,再結合Radon變換和Richardson-Lucy(RL)算法進行復原。實驗結果證明本文算法能獲得較好結果。
實際上,圖像復原算法很多,無法判斷哪種更好,只是適用的領域不同,因此本文還有改進空間,可以使該算法適合更多更廣泛的圖像。
【參考文獻】
[1]程姝,趙志剛,呂慧顯.順序結構的運動模糊圖像復原技術綜述[J].計算機應用,2013(S1):161-165,185.
[2]S. Colonnese, P. Campisi, G. Panci, G. Scarano, Blind image deblurring driven by nonlinear processing in the edge domain, EURASIP J. Appl[Z]. Signal Process. 16 (2004):2462-2475.
[3]趙志剛,程姝,王國棟.基于運動估計的模糊圖像盲復原[J].光電子?激光,2012,(10):2010-2016.
[4]M.A. Santiago, G. Cisneros, E. Bernues, Iterative desensitisation of image restoration filters under wrong PSF and noise estimates, EURASIP J. Adv[Z]. Signal Process(2007), Art. No. 72658.
中圖分類號:C37 文獻標識碼:A
一、概述
隨著計算機視覺技術的發展,近年來利用機器視覺直接觀察焊接熔池,對焊
接質量進行閉環控制是通過圖像處理獲取熔池的幾何形狀信息,已是當前研究的主要方向。
和傳統的手工焊和半自動焊接過程相比,使用機器視覺進行直接觀測焊接熔池有著很明顯的優點,采集的數字圖像信息豐富,表象直觀,且數字化的圖像數據可以實時傳輸到計算機高速緩存內,提取特征信息, 進行實時處理,同時作出在線判決,可以實現焊接過程質量實時控制和傳感。
在傳統的手工焊接和半自動焊接過程當中,對于一個有經驗的焊工,通過直接觀察熔池的行為、接頭的位置、焊道外形及電弧形狀,能夠感知焊接的狀態。若是感覺到實際焊接過程中同最佳狀態不一致,為了達到最佳狀態可以通過調節各參數,以獲得高質量的焊縫。可以把這個過程劃分為眼-腦-手的控制過程。圖像處理在焊接過程中的重要意義就等同于手工焊接過程中人的眼睛,可以實現采集和處理焊接位置的傳感、焊接時熔池、焊道對中、熔寬和熔深的信息,然后利用計算機發出指令,實現焊接過程的各種工藝參數如電流、電壓、焊接速度的調節和電弧或焊絲的對中。
二、圖像處理的概念
圖像處理(image processing),用計算機對圖像進行分析,以達到所需結果的技術。又稱影像處理。一般圖像處理就指的是對數字圖像處理。數字圖像是指用數字攝像機、掃描儀等設備經過采樣和數字化得到的一個大的二維數組,該數組的元素稱為像素,其值為一整數,稱為灰度值。圖像處理技術的主要內容包括圖像壓縮,匹配、描述和識別以及增強和復原這3個部分。常見的處理包括有圖像復原、圖像數字化、圖像增強、圖像編碼、圖像分析和圖像分割等
三、焊接圖像攝取方法
圖像的處理一般包括量化、圖像識別和圖像預處理等幾個步驟。圖像預處理包括圖像增強、圖像變換和圖像恢復,盡量把因為隨機因素的干擾和攝像中各種條件的限制而產生的不足和噪聲減小,繼而可以獲取焊縫位置的精確信息;量化由圖像卡完成;圖像識別包括邊緣提取和圖像分割等,可借助小波變換、快速傅立葉變換、概率統計等數學工具對圖像進行理解、分析、模式識別和特征提取。
從國內外大量文獻來看,利用機器視覺采集焊接熔池圖像的方法主要分為被動式直接視覺傳感和主動式直接視覺傳感兩大類,視覺傳感器常采用CCD攝取原始圖像。CCD是英文(Charge-Coupled Devices)的縮寫,意即“電荷耦合器件”。具有體積小、耐震動、重量輕、穩定性好、壽命長、速度高,幾何失真小及耐高壓等一系列優點。CCD是固態圖像傳感器的一種,固態圖像傳感器是指把布設在半導體襯底上的許多感光小單元的光-電信號,用所控制的時鐘脈沖讀取出來的一類功能器件。
動式直接視覺傳感利用窄帶復合濾光系統濾除非連續光譜的電弧強光,并采用高強脈沖激光或具有圖像增強器的高頻閃光燈作為輔助光源,可有效地抑制弧光獲得清晰圖像。被動式直接視覺傳感是利用焊接過程中的結構光進行成像。主被動式直接視覺傳感存在強光干擾的問題,激光焊接中,通常采用中性減光的辦法解決強光干擾的問題;在電弧焊中,對于短路電弧焊和脈沖電弧焊.可在短路期間或基值電流期間獲取圖像數據,或者在攝像機前通入部分保護氣,減少煙霧和飛濺的影響;TIG/MIG/MAG焊時弧光在600~700nm波段內相對光強最弱最穩定,選用這一波段內的干涉濾光片和防熱玻璃可有效地排除弧光及紅外干擾。
四、圖像處理在焊接中的應用
現如今,對于圖像處理主要集中應用在脈沖機器人焊接、TIG焊、激光焊和焊縫質量的檢測等領域。圖像技術在機器人焊接領域應用較廣。由于機器人需要有很強的適應能力,借助三維視覺傳感系統和計算機圖像處理技術,焊接機器人可對焊接環境進行實時控制。通過圖像的采集,可幫助機器人進行焊縫的對中,為機器人焊接提供實時特征信息,如熔深、熔寬和熔池的形狀等,從而實現焊接過程的智能控制。目前國內哈工大的吳林教授在這方面作了較深入的研究,從焊縫位置的傳感到熔滴的過渡,從過程實時控制到最后焊接質量的檢測都進行了較為系統的研究。
哈工大的何景山博士在脈沖TIG焊熔深及熔透的彩色圖形法傳感方面進行了較深入的研究。圖像處理目前用得最廣的領域是在脈沖TIG焊中,國內外許多學者都對該領域進行了積極的探索。首先創建了一套適用于脈沖TIG焊的彩色圖像法熔深和熔透的傳感系統,通過對脈沖峰值和脈寬的控制實現對熔深和熔透的控制,其控制信息來源于基值期間,進行圖像信息的采集。
此外,圖像處理還在焊接的其它領域中有一定的應用。有的將圖像處理用于焊接缺陷的自動監測與缺陷尺寸的保真,也都收到了良好的效果。有些科技工作者還將圖像處理用于水下濕法焊接,通過復合濾光技術和水下CCD攝像系統,采集出了藥芯焊絲水下濕法焊接電弧區域的圖像,用中值濾波和梯度算子的電弧區域圖像邊緣檢測方法,有效地區分了電弧燃燒區域和電弧氣泡區域。哈爾濱工業大學的何景山、楊春利等人結合采用埋弧焊進行容器類焊接結構制造過程中的工藝特點及實際工況,設計了一種將微型攝像機、微型半導體激光發生器及具有濾光功能的光學系統三者集成一體的焊縫視覺傳感器。
焊接控制過程中的一個重要環節就是焊接縫隙檢測,圖像處理在這方面的應用也有許多學者研究。為了實現電弧焊過程的自動對中和焊縫質量控制,必須對焊接縫隙的相對位置和坡口幾何參數進行檢測。西安交大的梁晉、賈昌申等在《圖像法焊接縫隙檢測的研究》一文介紹了一套自行設計的計算機焊接縫隙檢測系統,包括圖像采集卡、計算機接口、光學傳感器、圖像處理軟件,分析了它們的基本結構和工作原理,討論了提高光學傳感器、圖像處理軟硬件等抗干擾能力的措施。該系統工作原理是:由光源和CCD攝像機組成的光學傳感器攝取圖象,CCD攝像機把圖象轉換為電信號,再經圖象采集卡把模擬信號變為數字信號存儲于計算機內,計算機對此信號進行必要的處理,即可得到縫隙位置和坡口幾何參數信息,在監視器屏幕上顯示出來,或經過D/A電路給執行機構,修正焊槍位置,實現閉環對中控制。有的將圖像分割和小波分析應用于焊接領域,小波分析在焊縫視覺跟蹤過程中檢測焊縫,采用多次小波變換可獲得清晰的焊縫邊緣,大大簡化了硬件設備;圖像分割法可減小焊縫識別的圖像處理的復雜性,使得焊接過程的實時性增強。
五、圖像處理在焊接中應用的展望
為焊接現象的描述及內在規律的解釋提供了極佳的條件和直接的證據,推動焊接理論和實踐的發展就是通過圖像傳感的這種方法。同時也使得研究者能夠觀察到其它傳感方法所不能觀察到的被強光所淹沒的豐富直觀的信息。
把圖像處理技術應用到現代焊接技術中,將會推動焊接過程質量實時傳感與控制的發展和成熟,使得焊接過程通過閉環反饋控制而實現完全自動化,保證焊接質量,提高焊接生產效率。
總之,作為智能控制中關鍵技術―數字圖像技術,在焊接過程中發揮的作用將會越來越大,將為焊接智能化生產作出貢獻?,F代工業正朝著信息化和智能化方向發展,現代焊接技術也必然要實現智能化。
參考文獻:
[1]段佳佳,楊迎春.圖像處理在自動焊接中的應用[J].電子測試,2012,02:12-15.
[2]陳彥賓,李俐群,陳鳳東,陳杰.圖像處理在自動焊接中的應用和展望[J].材料科學與工藝,2003,01:106-112.
中圖分類號:TP3 文獻標志碼:A 文章編號:1006-8228(2015)01-26-03
Research and application of image segmentation technology
Wang Wei1, Zeng Xiaoneng2
(1. Changsha Information technology School, Changsha, Hunan 410116, China; 2. Central South University)
Abstract: Image segmentation is about decomposing an image into a number of mutually non-overlapping region while having the same attribute. It is a key technology of digital image processing, which directly affects the effectiveness of segmentation accuracy of subsequent tasks, hence having important significance. The existing segmentation algorithm achieved success to some extent, but the image segmentation problem is far from being solved, research in this area still faces many challenges. The existing problems of image segmentation methods are analyzed. The classical algorithm for image segmentation is improved. A new segmentation method is given and applied to the machine vision-related products which achieve good results.
Key words: digital image processing; image segmentation; segmentation algorithm; machine vision
0 引言
圖像分割是數字圖像處理中的一項關鍵技術,它通常用于對圖像進行分析、識別、編碼等處理之前的預處理環節,其分割的準確性直接影響后續任務的有效性,因此具有十分重要的意義。自上世紀70年代以來,已經出現了多種圖像分割方法,而每一種圖像分割方法都是為了解決一些特定的應用問題。該技術成功地應用于許多領域,例如:交通路口的電子警察、光學字符識別(OCR)、指紋識別、機動車牌號識別等等。
圖像分割是指將一副圖像分解為若干互不交疊的有意義且具有相同屬性的區域。好的圖像分割應具備的特性:①分割出來的各區域對某種性質如灰度、紋理而言具有相似性,區域內部比較平整;②相鄰區域對分割所依據的性質有明顯的差異;③區域邊界上是明確和規整的[1]。
大多數圖像分割方法只是部分滿足上述特征。如果強調分割區域的同性質約束,則分割區域很容易產生大量小孔和不規則邊緣;若強調不同區域間性質差異的顯著性,則易造成不同區域的合并。具體處理時,不同的圖像分割方法總是在各種約束條件之間尋找一種合理的平衡。
雖然圖像分割方法已經有了很大的發展,但由于它的復雜性,仍有很多問題沒有很好地得到解決。因此,人們至今還一直在努力發展新的、更有潛力的分割算法,以期實現更通用、更完美的分割結果。實踐表明,對圖像分割理論與技術的進一步研究仍然具有非常重要的意義。
本文首先對數字圖像分割的一些經典分割方法作了概述,然后分析了現有項目開發中使用的圖像分割方法所存在的問題,最后基于經典算法進行技術改進,實現了一種新的分割方法,并將其應用到實際的產品當中,取得了良好的效果。
1 圖像分割方法的現狀
從上世紀五十年代開始,學者一直熱衷于研究圖像分割技術。迄今為止,已提出上千種圖像分割算法,依這些算法對圖像處理的特點,主要可分為以下幾類方法[2]。
1.1 閾值分割法
閾值分割法作為一種常見的區域并行技術,它通過設置閥值,把像素點按灰度級分若干類,從而實現圖像分割。由于是直接利用圖像的灰度特性,因此計算方便簡明、實用性強。顯然,閾值分割方法的關鍵和難點是如何取得一個合適的閾值,而實際應用中閾值設定易受噪聲和光亮度影響。近年來關于閾值分割法主要有[3]:最大相關性原則選擇閾值法、基于圖像拓撲穩定狀態法、灰度共生矩陣法、熵法、峰值和谷值分析法等。其中,自適應閾值法、最大熵法、模糊閾值法、類間閾值法是對傳統閾值法改進較成功的幾種算法。更多的情況下,閾值的選擇會綜合運用兩種或兩種以上的方法,這也是圖像分割發展的一個趨勢。例如,將圖像的灰度直方圖看作是高斯分布的選擇法與自適應定向正交投影高斯分解法的結合,較好地擬合了直方圖的多峰特性,從而得到了更為準確的分割效果。閾值法的缺陷主要在于它僅僅考慮了圖像的灰度信息,而忽略了圖像的空間信息。對于非此即彼的簡單圖像處理(如一些二值圖像的處理)是有效的,但是對于圖像中不存在明顯的灰度差異或各物體的灰度值范圍有較大重疊的圖像分割問題則難以得到準確的分割效果。
1.2 基于邊緣的圖像分割法
邊緣總是以強度突變的形式出現,可以定義為圖像局部特征的不連續性,如灰度的突變、紋理結構的突變等。邊緣常常意味著一個區域的終結和另一個區域的開始,圖像的邊緣包含了物體形狀的重要信息,它不僅在分析圖像時大幅度地減少了要處理的信息量,還保護了目標的邊界結構。對于邊緣的檢測常常借助空間微分算子進行,通過將其模板與圖像卷積完成。兩個具有不同灰度值的相鄰區域之間總存在灰度邊緣,而這正是灰度值不連續的結果,這種不連續可以利用求一階和二階導數檢測到。
當今的局部技術邊緣檢測方法中,主要有一次微分(Sobel算子、Roberts算子)、二次微分(拉普拉斯算子等)和模板操作(Prewitt算子、Kirsch算子和Robinson算子)等。這些邊緣檢測器對邊緣灰度值過渡比較尖銳且噪聲較小等不太復雜的圖像可以取得較好的效果,但對于邊緣復雜(如邊緣模糊、邊緣丟失、邊緣不連續等)的圖像效果不太理想。此外,噪聲的存在使基于導數的邊緣檢測方法效果明顯降低,在噪聲較大的情況下所用的邊緣檢測算子通常都是先對圖像進行適當的平滑,抑制噪聲,然后求導數,或者對圖像進行局部擬合,然后再用擬合光滑函數的導數來代替直接的數值導數,如Marr算子、Canny算子等。有關學者曾給出了一種基于彩色邊緣的圖像分割方法,這是對傳統邊緣分割方法只適用于灰度圖像狀況的一個突破。
在未來的研究中,用于提取初始邊緣點的自適應閾值選取、用于圖像層次分割的更大區域的選取,以及如何確認重要邊緣去除假邊緣將變得非常重要。
1.3 基于聚類的分割法
對灰度圖像和彩色圖像中相似灰度或色度合并的方法稱之為聚類,通過聚類將圖像表示為不同區域即所謂的聚類分割方法。此方法的實質是將圖像分割問題轉化為模式識別的聚類分析,如k均值、參數密度估計、非參數密度估計等方法都能用于圖像分割。常用的聚類分割有顏色聚類分、灰度聚類分割和像素空間聚類分割。
顏色聚類分割實際上是將相似的幾種顏色合并為一色,描述顏色近似程度的指標是色差,在標準CIE勻色空間中,色差是用兩個顏色的距離來表示的。但是顯示器采用的RGB空間是顯示器的設備空間,與CIE系統的真實三原色不同,為簡單起見,一般采用RGB色空間中的距離來表示。
灰度聚類分割就是只把圖像分成目標和背景兩類,而且僅考慮像素的灰度,這就是一個在一維空間中把數據分成兩類的問題。通過在灰度空間完成聚類,得到兩個聚類中心(用灰度值表征),聚類中心連線的中點便是閾值。顯然這個概念也可以輕松地延擴至多閾值和動態閾值的情況。
像素空間聚類分割在某些特定的尺度上觀察圖像,比如說把圖像信號通過一個帶通濾波器,濾波的結果將使圖像的局部信息更好地被表達。通過一個多尺度分解,輪廓信息可以在大尺度圖像上保留下來,細節或者突變信息可以在中小尺度上體現,基于多尺度圖像特征聚類的分割方法漸漸得到了人們的關注。
1.4 函數優化法
基于函數優化的分割方法是圖像分割中另一大類常用的方法,其基本思路是給出一個目標函數,通過該目標函數的極大化或極小化來分割圖像,G.A.Hewer等人提出了一個具有廣泛意義的目標函數。統計學分割法、結合區域與邊緣信息法、最小描述長度(MDL)法、基于貝葉斯公式的分割法等是目前幾種活躍的函數優化法。
統計學分割法就是把圖像中各個像素點的灰度值看作是具有一定概率分布的隨機變量,且觀察到的實際物體是作了某種變換并加入噪聲的結果。統計學分割方法包括基于馬爾科夫隨機場法(MRF)、標號法(Labeling)和混合分布法(Mixture)等。
結合區域與邊緣信息法是基于區域信息的圖像分割的主要方法。區域增長有兩種方式:一種是先將圖像分割成很多一致性較強的小區域,再按一定的規則將小區域融合成大區域,達到分割圖像的目的;另一種是事先給定圖像中要分割目標的一個種子區域,再在種子區域基礎上將周圍的像素點以一定的規則加入其中,最終達到目標與背景分離的目的。分裂合并法對圖像的分割是按區域生長法沿相反方向進行的,無需設置種子點,其基本思想是給定相似測度和同質測度,從整幅圖像開始,如果區域不滿足同質測度,則分裂成任意大小的不重疊子區域;如果兩個鄰域的子區域滿足相似測度則合并。
最小長度描述法(MDL)的基本思路是用一種計算機語言來描述圖像的區域和邊界信息,得到一個描述長度函數,以此作為目標函數,根據圖像極小化描述長度從而得到分割結果。MDL準則主要應用于區域競爭中,即通過這種規則對比若干個種子區域,找出其中的壞種子。它常常與其他方法結合使用。
2 圖像分割技術的研究與應用
2.1 圖像掃描分割
根據實際產品的需要,要根據分割的特殊要求,采用簡單的圖像掃描分割。
2.1.1 算法思想
獲取二值化要分割的圖像,然后轉換為圖像指針并獲取圖像的左右邊界、上下邊界,然后再分割圖像[4]。
2.1.2 分割過程實現
下面介紹基于FrameWork4.0,采用C#實現對圖像進行分割處理的主要步驟。
⑴ 二值化要分割的圖像
BaseFilterHandler.ImgConvertToFormat8(c_Bitmap);
BaseFilterHandler.ImgBradleyLocalThresholding(c_Bitmap);
⑵ 轉換為圖像指針并獲取圖像中的左右邊界
BitmapData bmData=c_Bitmap.LockBits(new Rectangle
(0,0,c_Bitmap.Width,c_Bitmap.Height),ImageLockMode
.ReadWrite, c_Bitmap.PixelFormat);
List<int[]> widthLeftRight=GetImgLeftRight(bmData,
c_Bitmap, throldValue);
⑶ 獲取圖像的上下邊界
int[] yValues=img.GetPicTopBottom(sourceMap, 1, sourceMap
.Height-2, widthLeft[widthLeftIndex],
widthRight[widthLeftIndex]);
top=yValues[0]; bottom=yValues[1];
⑷ 分割圖像
Rectangle sourceRectangle0=new Rectangle
(widthLeft[widthLeftIndex],tempTop, widthRight
[widthLeftIndex]-widthLeft[widthLeftIndex], tempHeight);
Bitmap tempMap=sourceMap.Clone(sourceRectangle0,
sourceMap.PixelFormat);
2.1.3 實際效果
存在干擾情況下的分割效果,如圖1所示。
<E:\方正創藝5.1\Fit201501\圖\ww圖1.tif>
圖1 圖像掃描分割
圖像掃描分割的結果存在多干擾點,一些字符不能完整地被分割出來,多個字符連接在一起,分割效果不是很好。
2.2 findContours分割
2.2.1 算法思想
該算法是提取圖像的輪廓信息,一個輪廓一般對應一系列的點,也就是圖像中的一條線[5]。在算法中用序列cvSeq來保存提取到的序列集,序列中的每一個元素就是曲線中的一個點的位置。
2.2.2 分割過程實現
下面介紹采用C++實現對圖像分割處理的主要步驟。
⑴ 圖像的預處理(二值化、平滑處理等)
threshold(input,img_threshold,60,255,
CV_THRESH_BINARY_INV);
IplImage* input_image=&IplImage(img_threshold);
IplImage* dst_image=cvCreateImage(cvGetSize
(input_image),IPL_DEPTH_8U,0);
cvSmooth(input_image,dst_image,CV_GAUSSIAN,3,0,0,0);
⑵ 查找圖像的聯通區域及輪廓
Mat img_contours;
img_threshold.copyTo(img_contours);
vector<vector<Point>> contours;
findContours(img_contours, contours,
CV_RETR_EXTERNAL,CV_CHAIN_APPROX_NONE);
⑶ 對輪廓進行轉換得到內容區域
vector<vector<Point>>::iterator itc=contours.begin();
IplImage* temp=&(IplImage)input;
vector<Rect> validRect;
while(itc!=contours.end()) {
Rect mr=boundingRect(Mat(*itc));
rectangle(result,mr,Scalar(0,255,0));
if(!checkSplitRect(mr,temp->height,temp->width))
{ ++itc;continue; }
validRect.push_back(mr);
++itc;
}
⑷ 圖像分割
CvSize size=cvSize(rect.width,rect.height);
cvSetImageROI(source,cvRect(rect.x,rect.y,size.width,size.height));
IplImage* pDest=cvCreateImage(size,source->depth,
source->nChannels);
cvCopy(source,pDest);
cvResetImageROI(pDest);
2.2.3 實際效果
從分割結果看,該分割算法能把所有的單個圖片聯通區域分割出來,但是分割出的區域存在很多干擾區域,增加了實際區域提取的復雜度(見圖2)。
<E:\方正創藝5.1\Fit201501\圖\ww圖2.tif>
圖2 連通區域分割
下面將在此基礎上進行改進。
2.3 改進后的算法
增加連通區域的有效性判斷及過濾;
checkSplitRect(Rect rect,int height,int width)
同時對一些單字符被分割成多個字符的區域按照一定的算法及規則進行有效組合和合并;
vector<Rect> MergeImage(vector<Rect> validRect)
最后形成的分割效果如圖3所示,將所有字符正確的分割出來,去除了干擾,達到了理想的效果。
<E:\方正創藝5.1\Fit201501\圖\ww圖3.tif>
圖3 改進后的分割效果
3 實驗結果
為了驗證本方案的可行性和可操作性,本文使用10000張測試圖像作為實驗測試庫,對此方案進行測試。測試結果:正確分割達到99%以上。如圖4,改進后的分割正確率比改進前的分割正確率提高了將近20倍。
<E:\方正創藝5.1\Fit201501\圖\ww圖4.tif>
圖4 分割對比
4 結束語
圖像分割沒有通用的理論,要根據具體情況采取有效的方法。利用已經研究出的多種圖像分割方法,將多種方法綜合運用,發揮各自的優勢進行圖像分割將成為這一領域的發展趨勢。同時,由于現在所處理的圖像的復雜度和固有的模糊性,傳統的單一的處理方法已不能適用需要,與新理論、新工具和新技術結合起來才能有所突破和創新。
本文在原有分割技術的基礎上,結合實際的使用情況,進行了算法思想的改進和創新,最終達到了理想的分割效果,在一定程度上具有良好的研究和實用價值。
參考文獻:
[1] R.M.Haralick,L.G.Shaprio, "Image segmentation tech2 niques",
Computer Vision, Graphics, and Image Processing,1985.29:100-132
[2] 羅希平等.圖像分割方法綜述[J].模式識別與人工智能,1999.12(3):
300-312
[3] 吳一全,朱兆達.圖像處理中閾值選取方法30年(1962-1992)的進