September, 2012

Student : Leng-Fang Chen

 


研究簡介

中文摘要:

  商標局的商標影像每天不斷有新的商標影像被註冊,經過時間累積商標局的資料庫影像不斷增加,使用商標局所提供檢索功能,很難在龐大的資料庫快速搜尋一張商標影像。本論文研究「以圖找圖」的功能進行查詢一張商標影像,並可以提供搜尋 (Search)、監看(Watch)真仿識別 (Illegal detection) 等三種應用。

  本論文使用商標局的影像為來源,資料庫總共有 1,034,092 張影像。在商標檢索方面,很難以文字描述一張商標影像,所以我們使用 Sale-Invariant Features Transform (SIFT) 為影像特徵描述,並使用字彙樹的方法階層式量化SIFT特徵,利用樹狀架構可以加快比對的速度。由於資料庫有 1,034,092 張影像和 240,558,829 SIFT 特徵,使用單台桌上型電腦無法訓練大量影像特徵進行分群,所以我們架設了Hadoop平台訓練一棵字彙樹 (Vocabulary Tree)。最後將影像字(Visual Words) 使用反向索引 (Inverted Index) 技術,統計影像字 TF-IDF 權重分數,並且用不同距離公式計算影像相似度。

  本論文的實驗,在1,034,092 張的影像資料庫,使用 200 張查詢影像進行測試,統計TOP1回傳影像並正確答對的準確率達到 78%。本論文最主要的貢獻提供一套大規模商標影像檢索系統,可以讓使用者使用網頁介面快速查詢一張商標影像。

Abstract :

 Many trademark images are licensed every day, thus the trademark database in the Trademark Office grows gradually. However, it is difficult to search a trademark in the large-scale images database by using the basic search utilities provided by the Trademark Office. In this thesis, a content-based image retrieval system is developed to search trademark images. The system can provide further applications including trademark search, watch, and illegal detection.

 In this thesis, there are totally 1,034,092 trademark images crawled from the Trademark Office. Because it is difficult to describe a trademark image using keywords in a trademark image retrieval system, we apply the Sale-Invariant Features Transform (SIFT) to extract image features. These SIFT features are hierarchical clustered by applying the method of Vocabulary Tree, which increases the speed of image similarity search. The resultant number of extracted SIFT features is 240,558,829. Because it is unable to cluster this large amount of images features in a single desktop computer, we setup a Hadoop platform to train the vocabulary tree. The quantized SIFT features, called visual words, were inverted indexed and their TF-IDF weights were calculated. Different distance measures were experimented to calculate the image similarity.

 In our experiments, 200 images are used as queries to search the database containing 1,034,092 trademark images. The Top 1 precision achieves 78%. The contribution of this thesis is to provide a practical large-scale trademark image retrieval system, which allows users to use web interface to query a trademark image efficiently.

 

相關流程

 

 

 

結論

  本論文在龐大的影像數量下,在 200 張查詢影像的測試中,回傳最相似的影像並正確答對的準確率達到 78%,從實驗我們可以知道 SIFT 特徵比 PCA-SIFTSURF 特徵更適合描述商標影像。由於 SIFT 比對速度不夠快,我們使用字彙樹階層式量化 SIFT 特徵以加快搜尋速度,實驗二資料庫影像有 27,610 張影像,使用二進位比對相似度平均搜尋一張影像需花費 1.6 秒,準確率達到 83%。實驗資料庫影像有 547,803 張影像,使用二進位比對相似度平均搜尋一張影像需花費 10 秒,準確率達到 83%。實驗四資料庫影像有 1,034,092 張影像,使用二進位比對正規化相似度平均搜尋一張影像需花費 22 秒準確率達到 78%。從大規模實驗得知,我們使用字彙樹方法建立一棵完整字彙樹在 200 張查詢測試影像進行搜尋是可行的,未來可以改進選擇資訊量較小的特徵來進行實驗,由於 SIFT 特徵資訊量因為過於龐大,所以訓練一棵字彙樹是非常花費時間,如果可以選擇擁有較小的資訊量與良好準確率的特徵擷取方法,在建立字彙樹方面可以省下很多時間。本論文並實作一套以網頁介面的商標檢索系統,讓使用者上傳一張商標影像快速查詢商標影像。

  目前的查詢影像是從搜尋引擎中尋找商標影像,而運用在自然影像,如圖 6.1所示。若我們拍攝一整張自然影像到我們的系統進行查詢,必定會產生過多不必要的雜訊,因而影響搜尋結果,因此必須知道使用者想要查詢的商標影像在此影像中的哪位置。其中一種方法是讓使用者自行圈選商標的正確位置,另一種方法是自動偵測商標影像的位置,可做為未來研究的方向。

 

論文全文

應用雲端計算於大規模商標影像檢索系統PDF

應用雲端計算於大規模商標影像檢索系統word

 

口試投影片

應用雲端計算於大規模商標影像檢索系統ppt

 

主要相關論文

● D. G. Lowe, Object recognition from local scale-invariant features, in Proceedings of the Seventh International Conference on Computer Vision, vol. 2, pp. 1150-1157, Sept. 1999.

PDF】【website

● D. Nistèr and H. Stewènius, Scalable Recognition with a Vocabulary Tree, Computer Vision and Pattern Recognition, Volume 2, pages 2161-2168, 2006.

PDF】【website

 

 

 


Author : s9572509@gmail.com Leng-Fang Chen

Advisor : jcliu@ncnu.edu.tw Jen-Chang Liu

VIP Lab. @ CSIE NCNU