Thứ Sáu, 28 tháng 2, 2014

TÌM KIẾM ẢNH DỰA VÀO NỘI DUNG

Kh
oa CNTT -

ÐH KHT
N
TP.HCM
Kh
oa CNTT -

ÐH KHT
N
TP.HCM
Luận văn tốt nghiệp đại học
MỤC LỤC
LỜIMỞĐẦU
PHẦN1: TỔNG QUAN
1. Sự hình thành bài toán 3
2. Cách tiếpcận: 3
2.1. Đặctrưng màu sắc: 4
2.2. Đặctrưng vân: 4
2.3. Đặctrưng hình dáng: 4
2.4. Độ đo: 4
2.5. Mô hình giao diện: 5
PHẦN 2: CÁC PHƯƠNG PHÁP TÌM KIẾM ẢNH DỰA VÀO NỘI DUNG
Chương 1: Tìm kiếm ảnh dựa vào màu sắc 9
1. Màu sắc: 10
1.1. Một sốđặc tính vậtlýđặtbiệt củamàu sắc 10
1.2. Hệ thống màu chuẩn RGB 10
1.3. Hệ thống màu CMY 12
1.4. Hệ thống màu L*a*b 12
1.5. Hệ thống màu HSI 12
2. Tìm kiếm ảnh dựavàomàu sắc 14
2.1. Lượt đồ màu 14
2.2. Các loại độ đo màu sắc 19
Chương 2:Tìm kiếm ảnh dựa vào vân 22
Kh
oa CNTT -

ÐH KHT
N
TP.HCM
Kh
oa CNTT -

ÐH KHT
N
TP.HCM
Luận văn tốt nghiệp đại học
1. Vân 23
1.1. Vân là gì? 23
1.2. Một số loại vân tiêu biểu 24
2. Tìm kiếm ảnh dựa vào vân 25
2.1. Mật độ của đường biên và hướng của biên 25
2.2. Phân hoạch vùng nhị phân cụcbộ 27
2.3. Ma trận đồng hiệnvàđốitượng đồng hiện 28
2.4. Độ đonăng lượng củavân dựavàoluật đo 31
2.5. Tương quan tựđộng và quang phổ năng lượng 33
2.6. Phân đoạn vân (Texture segmentation) 34
Chương 3:Tìm kiếm ảnh dựa vào hình dạng 35
1. Hình dạng 36
1.1. Khái niệmvề hình dạng 36
1.2. Đặc điểmhìnhdạng đốivớiviệc tìm kiếm ảnh 36
2. Tìm kiếm ảnh dựavàohìnhdạng 37
2.1. Lượt đồ hình dạng 37
2.2. Độ so khớp đường biên củahìnhdạng 38
2.3. So khớpvới ảnh phát họa 40
PHẦN 3 CÀI ĐẶT VÀ KẾT QUẢ THỬ NGHIỆM
Chương 1:Cài đặt 44
1. Chương trình 45
2. Phần Màu sắc 46
Kh
oa CNTT -

ÐH KHT
N
TP.HCM
Kh
oa CNTT -

ÐH KHT
N
TP.HCM
Luận văn tốt nghiệp đại học
3. Phần Vân 50
4. Phần Hình dạng 53
Chương 2:Kết quả thử nghiệm 54
1. Phần Màu sắc 55
2. Phần Vân 73
3. Phần Hình dạng 77
PHẦN 4 KẾT LUẬN
Đánh giá kết quả đạt được 80
Hướng phát triển 80
Tài liệu tham khảo 81
Kh
oa CNTT -

ÐH KHT
N
TP.HCM
Kh
oa CNTT -

ÐH KHT
N
TP.HCM
Luận văn tốt nghiệp đại học
TÓM TẮT LUẬN VĂN
Tên đề tài : Tìm kiếm ảnh dựa vào nội dung
Tìm kiếm ảnh dựa vào nội dung là một đề tài nghiên cứu về khả năng để xây dựng
mộtchương trình cho phép tìm kiếm ảnh trên một cơ sở dữ liệu ảnh cho trước. Việc
tìm kiếm này dựa trên nội dung của những bức ảnh trong cơ sở dữ liệu. Nội dung
của một bức ảnh có thể là màu sắc của bức ảnh, vân của bức ảnh, hay những kiểu
hình dạng.
Luận văn này tập trung vào việc nghiên cứu những lý thuyết để xây dựng nên một
ứng dụng như vậy, đồng thời ứng dụng lý thuyết đó để xây dựng nên một số demo,
cho thấy khả năng có thể phát triển được thành ứng dụng hoàn thiện được.
Đề tài gồm có ba phần: tìm kiếm ảnh dựa vào màu sắc, vân và hình dạng.
Tìm kiếm ảnh dựa vào màu sắc: cách tiếp cậnchính là dựa vào lượt đồ màu (colour
histogram)
Tìm kiểm ảnh dựa vào vân: cách tiếp cận chính là dựa vào ma trận đồng hiện (co-
occurrence matrix)
Tìm kiếm ảnh dựa vào hình dạng: cách tiếp cận chính là dựa vào sự so khớp ảnh
phát họa (sketch matching)
Kh
oa CNTT -

ÐH KHT
N
TP.HCM
Kh
oa CNTT -

ÐH KHT
N
TP.HCM
Luận văn tốt nghiệp đại học
1
LỜI MỞ ĐẦU
Sự mở rộng của multimedia, cùng vớikhốilượng hình ảnh và phim lớn, sự
phát triểncủanhững xa lộ thông tin hiệntại đã thu hút ngày càng nhiềunhững
chuyên gia đi vào nghiên cứunhững công cụ cung cấp cho việclấy thông tin từ dữ
liệu ảnh từ nội dung của chúng. Lấy thông tin từ dữ liệu ảnh có liên quan đến rất
nhiều các lĩnh vực khác, từ những phòng trưng bày tranh nghệ thuậtcho tớinhững
nơilưu trữ tranh nghệ thuậtlớn như việnbảo tàng, kho lưu trữảnh chụp, kho lưu
trữảnh tộiphạm, cơ sở dữ liệu ảnh vềđịa lý, y học, điều đó làm cho lĩnh vực
nghiên cứu này phát triển nhanh nhất trong công nghệ thông tin.
Lấy thông tin từ dữ liệu ảnh đặtra nhiều thách thức nghiên cứumớicho các
khoa học gia và các kỹ sư.Phântíchảnh, xử lý ảnh, nhậndạng mẫu, giao tiếpgiữa
ngườivàmáy lànhững lĩnh vực nghiên cứu quan trọng góp phần vào phạmvi
nghiên cứu mớinày.
Khía cạnh tiêu biểucủalấy thông tin từ dữ liệu ảnh dựatrên những công bố
có sẵnnhư là những đốitượng nhậnthức như màu sắc, vân (texture), hình dáng, cấu
trúc, quan hệ không gian, hay thuộcvề ngữ nghĩacănbảnnhư: đốitượng, vai trò
hay sự kiện hay liên quan đến thông tin về ngữ nghĩa quan hệ như cảmgiác, cảm
xúc, nghĩacủa ảnh. Thật ra phân tích ảnh, nhậndạng mẫu, hay xử lý ảnh đóng một
vai trò cănbảntronghệ thống lấy thông tin từảnh. Chúng cho phép sự trích rút tự
động hầuhếtnhững thông tin về nhậnthức, thông qua phân tích sự phân bổđiểm
ảnh và sự phân tích độ đo.
Tìm kiếm theo cách thông thường dựatrên vănbảngiờđây đượcbổ sung bởi
truy vấndựavàonội dung, nhắmvàokhíacạnh nhậnthức thông tin ảnh. Thực hiện
truy vấn ở mứcnhậnthức đòi hỏinhững phương thức mới, cho phép chỉđịnh đến
những thuộc tính liên quan đếnthị giác cần tìm. Giao diện đồ họa phải hỗ trợđặctả
những ví dụđónhư là những mẫucósẵn. Khi đóngười dùng trong một vòng lặp,
mô hình giao diệnsao cho ngườidùngcóthể truy cậpvàosự giống nhau giữa
những đốitượng.
Kh
oa CNTT -

ÐH KHT
N
TP.HCM
Kh
oa CNTT -

ÐH KHT
N
TP.HCM
Luận văn tốt nghiệp đại học
2
PHẦN 1
TỔNG QUAN
Kh
oa CNTT -

ÐH KHT
N
TP.HCM
Kh
oa CNTT -

ÐH KHT
N
TP.HCM
Luận văn tốt nghiệp đại học
3
1. Sự hình thành bài toán:
Bên cạnh kho dữ liệuvănbản, kho dữ liệu ảnh ngày càng trở nên khổng lồ
vượt quá sự kiểmsoátcủa con người. Khi có nhu cầu tìm kiếmmộtvàitấm
ảnh nào đótrong một cơ sở dữ liệuhàngtrămngànảnh, điềunày khócóthể
thực hiện được khi ta tìm kiếmbằng tay theo cách thông thường, nghĩalà
xem lầnlượttừng tấm ảnh một cho đếnkhi tìmthấy ảnh có nội dung cầntìm.
Song song vớisự phát triểncủanhững phương tiệnkỹ thuậtsố, trong tương
lai, số lượng ảnh sẽ còn tăng nhanh hơnnữa, nhiềuhơnnữa. Do đó, nhu cầu
thậtsựđòi hỏiphải có một công cụ hỗ trợ cho việc tìm kiếmnày càngsớm
càng tốt. Vì vậy đề tài “tìm kiếmdữ liệu ảnh dựavàonội dung” ra đời để góp
phần đáp ứng nhu cầu này.
“Tìm kiếmdữ liệu ảnh dựavàonội dung” là gì? Đây là một chủđềnghiên
cứumới trong công nghệ thông tin. Mục đích chính củanólàlấynhững ảnh
từ cơ sở dữ liệuphùhợpvới tiêu chí truy vấn.
Thế hệđầutiên củahệ thống tìm kiếm ảnh dựavàonội dung cho phép truy
cậptrực tiếp đến ảnh thông qua thuộc tính chuỗi. Những tìm kiếm đặcthù
cho những hệ thống dạng này là “tìm tấtcả những tranh vẽ củatrường
Florentine trong thế kỷ thứ XV” hay “tìm kiếmtấtcả những tấm ảnh vềđất
đai của Cezanne”. Metadata củahệ thống trong thế hệđầutiên dựatrên
chuỗi, sơđồtrình bày, mô hình quan hệ, cấu trúc khung. Xem hình 1.1.
Thế hệ mớicủahệ thống tìm kiếm ảnh hỗ trợđầy đủ việc lấy thông tin dựa
vào nội dung thuộcvề thị giác. Chúng cho phép phân tích đốitượng, tựđộng
trích rút đặctrưng. Xem hình 1.2.
Những phần tử thuộcvề thị giác như là màu sắc, vân, hình dạng đốitượng,
quan hệ không gian có liên quan trực tiếp đến khía cạnh nhậnthức củanội
dung ảnh. Ta trựctiếp đánh vào những phầntử này trong việc tìm kiếm.
Do đó, nội dung của đề tài sẽ giải quyếtnhư sau: hệ thống tìm kiếm ảnh dựa
vào nội dung, ba đặctrưng là màu sắc,vân và hình dạng. Đề tài chỉ tập chung
vào demo một số phương pháp làm củatừng phần.
Kh
oa CNTT -

ÐH KHT
N
TP.HCM
Kh
oa CNTT -

ÐH KHT
N
TP.HCM
Luận văn tốt nghiệp đại học
4
2. Cách tiếpcận:
Đề tài tiếpcận theo mô hình thống kê.
Có ba loại tìm kiếm ảnh đề tài tập chung giải quyếtlà:
- Tìm kiếm ảnh dựavàomàu sắc.
- Tìm kiếm ảnh dựavàovân.
- Tìm kiếm ảnh dựavàohìnhdạng.
2.1. Đặctrưng màu sắc:
Màu sắc là vấn đề cầntập chung giải quyết nhiềunhất, vì một ảnh màu thì
thông tin quan trọng nhấttrongảnh chính là màu sắc. Hơn nữa thông tin về
màu sắc là thông tin người dùng quan tâm nhất; qua đặctrưng màu sắc, có
thể lọc đượcrấtnhiềulớp ảnh, thông qua vị trí, không gian, định lượng của
màu trong ảnh.
2.2. Đặctrưng vân:
Có những lớp ảnh mà màu sắc không thể giải quyết được, đòi hỏiphải dùng
đặctrưng vân. Ví dụ như những ảnh liên quan đến cấutrúccủa điểm ảnh
như: cỏ, mây, đá, sợi.
Vân sẽ giải quyếttốt cho việc tìm kiếm đốivớilớp ảnh này.
2.3. Đặctrưng hình dáng:
Đối vớinhững lớp ảnh cần tìm mà liên quan đếnhìnhdạng của đốitượng thì
đặctrưng vân và màu không thể giải quyết được. Ví dụ như tìm một vậtcó
hình dạng ellipse hay hình tròn trong ảnh.
Tìm kiếm theo hình dáng thậtsự là một cái đích củahệ thống tìm kiếmdựa
vào nội dung muốn đạttới.
2.4. Độ đo:
Cóýnghĩa quan trọng trong tìm kiếm ảnh dựavàonộidung.Độ đomangý
nghĩa quyết định kếtquả tìm kiếmsẽ như thế nào, mức độ chính xác.
Kh
oa CNTT -

ÐH KHT
N
TP.HCM
Kh
oa CNTT -

ÐH KHT
N
TP.HCM
Luận văn tốt nghiệp đại học
5
2.5. Mô hình giao diện:
Giao diệncũng là một vấn đề đáng quan tâm của bài toán tìm kiếm ảnh. Mô
hình giao diệndựa trên mô hình tìm kiếm cho phép lặp.
Đây mô hình người dùng có thể đặc tả yêu cầu tìm kiếm với nhiều cấp độ.
Quá trình tìm kiếm có thể là một quá trình lặp đi lặp lại nhiều lần: tìm kiếm,
lọc, chỉnh sửa ngưỡng cho đến khi đạt đến kết quả như mong muốn. Do đó
giao diện chương trình phải hỗ trợ chức năng cho phép chọn lọc kết quả, loại
bỏ những kết quả không phù hợp, lưu lại những kết quả đã vừa ý, tìm kiếm
trong kết quả vừa tìm được, thay đổi mức độ chính xác của việc tìm kiếm.
Hai vấn đề được đề tài quan tâm về giao diện tìm kiếm là: mô hình tìm kiếm
theo không gian toàn cụcvàcụcbộ. Đốivới đặctrưng màu: giao diệncho
phép giao tiếpcả toàn cục và cụcbộ. Đặctrưng vân và hình dạng đề tài chỉ
dừng lại ở mứctoàncục.
Kh
oa CNTT -

ÐH KHT
N
TP.HCM
Kh
oa CNTT -

ÐH KHT
N
TP.HCM
Luận văn tốt nghiệp đại học
6
Hệ thống tìm kiếm
Chỉ mục
Truy vấnbằng văn
bản
Trình bày nội dung
Người dùng
Phản hồi
Chú thích
(làm bằng tay)
Hình 1.1 Mô hình củahệ thống tìm kiếmthế hệđầu tiên

Không có nhận xét nào:

Đăng nhận xét