Kỹ thuật điều khiển & Điện tử
PHÁT HIỆN SỰ THAY ĐỔI BỀ MẶT ĐỊA HÌNH TRÁI ĐẤT
SỬ DỤNG MẠNG RON XUNG KÉP
Đào Khánh Hoài1*, Đỗ Danh Điệp2
Tóm tắt: Ảnh vệ tinh đa thời gian được được ứng dụng rộng rãi trong phát hiện
biến động lớp phủ bề mặt trái đất. Cách tiếp cận giám sát được áp dụng để đánh
giá định lượng chính xác sự biến động của các lớp đối tượng bản của lớp phủ như:
lớp đối tượng nhà đô thị, lớp đối tượng mặt nước, lớp đối tượng đất trống… Trong
những năm gần đây, mạng ron xung kép PCNN đã được ứng dụng trong xử ảnh
đa thời gian để phát hiện sự thay đổi các đối tượng trên ảnh. Một đặc điểm ưu việt
của kiểu mạng ron nhân tạo này tính bất biến với phép dịch, tỷ lệ phép quay
của ảnh. Tuy nhiên, với các loại ảnh vệ tinh chất lượng tín hiệu thu nhận khác
nhau cần các khảo sát cụ thể. Trong nghiên cứu này, nhóm nghiên cứu khảo sát
thực nghiệm phương pháp không giám sát sử dụng mạng ron xung kép PCNN để
phát hiện thay đổi bề mặt trái đất trên ảnh vệ tinh đa thời gian.
Từ khóa: Thay đổi bề mặt lớp phủ, Mạng PCNN, Ảnh vệ tinh.
1. MỞ ĐẦU
Trong viễn thám, việc phát hiện các vùng bị thay đổi trên các ảnh chụp cùng
cảnh một khu vực ở các thời điểm khác nhau nhận được sự quan tâm đặc biệt do có
liên quan đến số lượng lớn các ứng dụng khác nhau như phân tích sự thay đổi loại
hình sử dụng đất, phân tích sự dịch chuyển của cơ cấu trồng trọt, quan trắc ô
nhiễm, đánh giá các vùng cháy rừng, phân tích các khu vực phá rừng, phân tích sự
thay đổi của thực vật,… Các phương pháp đánh giá sự biến động hiện tại trong lĩnh
vực viễn thám có thể được phân ra làm hai nhóm giám sát và không giám sát. Các
phương pháp đánh giá biến động này áp dụng trên ảnh vệ tinh đa thời gian đã được
nghiên cứu và công bố trong nhiều tài liệu khác nhau [1-3]. Các phương pháp có
giám sát đòi hỏi sự có mặt dữ liệu đầu vào là các dữ liệu xác thực mặt đất như
điểm khống chế, các mẫu học và mẫu kiểm tra. Trong khi đó, cách tiếp cận không
giám sát phân tích sự thay đổi lớp phủ không cần sử dụng đến sự bổ sung các dữ
liệu xác thực mặt đất. Nếu so sánh về độ chính xác thì các phương pháp phát hiện
biến động có giám sát cho kết quả tốt hơn so với các phương pháp không giám sát.
Các phương pháp phát hiện biến động không giám sát ảnh viễn thám bao gồm ba
bước chính là tiền xử lý, so sánh ảnh và phân tích ảnh. Bước tiền xử lý thực hiện
các phép xử lý để đưa hai ảnh đa thời gian khớp về cùng một khung tọa độ để có
thể so sánh được với nhau. Trong bước thứ hai sự khác biệt giữa hai ảnh đa thời
gian được xác định bằng các toán tử khác nhau như phân tích véc tơ thay đổi
(CVA – Change vector analysis). Sau khi tính toán, tạo được ảnh khác biệt ảnh
biến động cuối cùng nhận được thông qua phân tích ảnh bằng các phương pháp lấy
ngưỡng có hoặc không ràng buộc quan hệ không gian. Ngưỡng có thể nhận được
bằng phương pháp thử sai thủ công hoặc các kỹ thuật lấy ngưỡng tự động.
Trong nghiên cứu này, nhóm tác giả tiếp cận bài toán phát hiện thay đổi trên
ảnh vệ tinh dựa trên ứng dụng mạng nơ ron xung kép PCNN (Pulse-coupled neural
network). PCNN là mạng nơ ron nhân tạo mô phỏng hoạt động của các nơ ron vỏ
não trực quan của mèo [4]. Vỏ não trực quan là một phần bộ não mèo nơi nhận tín
86
Đ. K. Hoài, Đ. D. Điệp, “Phát hiện sự thay đổi bề mặt địa hình… mạng ron xung kép.
Nghiên cứu khoa học công nghệ
hiệu trực quan từ mắt và chuyển đổi tín hiệu ảnh về luồng các xung. Các xung sinh
ra từ mỗi vòng lặp mạng PCNN mô phỏng lại các dấu hiệu đặc trưng trên cảnh.
Các véc tơ chuỗi các xung hai cảnh ảnh khác nhau được đối sánh làm cơ sở kết
luận có hay không sự thay đổi trên hai cảnh ảnh. Ưu điểm chính của mô hình
PCNN là nó có cấu trúc đơn giản và hoạt động theo cơ chế không cần huấn luyện.
Từ khi mạng PCNN được giới thiệu bởi Eckhon năm 1990 mô hình này đã chứng
tỏ là một công cụ hiệu quả ứng dụng cho xử lý ảnh [5].
Với bài toán phát hiện thay đổi trên ảnh mạng PCNN có tính bất biến đổi với
phép tỷ lệ, dịch, quay của các mẫu ảnh đầu vào. Thành thử việc ứng dụng mạng
PCNN để phát hiện tự động thay đổi các đối tượng trên nền địa hình thu được trên
ảnh vệ tinh đa thời gian với các góc chụp khác nhau, độ dịch khác nhau, ở các khu
vực không tiếp cận, không thể lấy mẫu xác thực, kiểm chứng như hải đảo, biên
giới là cách tiếp cận hợp lý và khoa học.
2. PHƯƠNG PHÁP PHÁT HIỆN THAY ĐỔI TRÊN ẢNH ĐA THỜI GIAN
SỬ DỤNG MẠNG RON XUNG KÉP PCNN
2.1. Mạng ron xung kép PCNN
Vào cuối những năm 1980, Eckhorn trong khi nghiên cứu vỏ não trực quan của
loài mèo [5], đã khám phá ra rằng, não giữa trong khi hoạt động, tạo ra các ảnh nhị
phân có thể trích rút các đặc trưng khác nhau từ cảm nhận trực quan. Dựa trên các
ảnh nhị phân này ảnh thực tế trong não mèo được tạo ra. Từ kết quả nghiên cứu, họ
đã phát triển mô hình mạng nơ ron nhân tạo Eckhorn để mô phỏng hành vi. Trong
đầu những năm 1990, Rybak cũng tìm ra hành vi thần kinh tương tự dựa trên
nghiên cứu vỏ não thị giác của loài chuột bạch và cũng đã phát triển mạng nơ ron,
gọi là mô hình Rybak [6]. Do các mô hình Rybak và Eckhorn đưa ra một cách đơn
giản, hiệu quả cho việc nghiên cứu các giao động xung đồng bộ trong các mạng
nên chúng được xem là rất tiềm năng trong xử lý ảnh. Các khám phá trên đã lát
đường cho thế hệ mạng nơ ron xung kép. Sau đó Johnson và các cộng sự đã mang
đến một số cải biên và biến thể để điều chỉnh hiệu suất của nó đáp ứng như các
thuật toán xử lý ảnh [7]. Mô hình mạng nơ ron cải biên này được gọi là mạng nơ
ron xung kép (PCNN).
PCNN là mạng đơn lớp, hai chiều, kết nối ngang của các nơ ron xung kép kết
nối với các điểm ảnh. Bởi vì mỗi điểm ảnh được liên kết với một nơ ron của mạng
nên cấu trúc của mạng PCNN xuất phát từ cấu trúc ảnh đầu vào (ảnh sẽ được xử
lý). Cấu trúc một nơ ron của mạng PCNN được mô hình hóa như hình 1. Nơron
cấu thành từ ba phần: phần đầu vào, phần liên kết, phần sinh xung [8].
Nơ ron nhận các tín hiệu đầu vào từ các đầu vào cung cấp và đầu vào liên kết.
Đầu vào cung cấp là đầu vào chính từ vùng tiếp nhận của nơ ron. Vùng tiếp nhận
của nơ ron cấu thành từ các điểm ảnh láng giềng của điểm ảnh tương ứng với nơ
ron trên ảnh đầu vào. Đầu vào liên kết là đầu vào thứ hai từ các kết nối ngang với
các nơ ron láng giềng. Sự khác biệt giữa các đầu vào này là các kết nối cung cấp có
hằng số thời gian phản ứng chậm hơn các kết nối liên kết. Mô hình mạng PCNN
chuẩn được mô tả như phép lặp của các phương trình (1) đến (5) [8]:
Tạp chí Nghiên cứu KH&CN quân sự, Số 48, 04 - 2017
87
i i i
i
i i i
Kỹ thuật điều khiển & Điện tử
Hình 1. Cấu trúc nơron mạng PCNN.
F, j n= eF F, j[n 1]+VF mi, j,k,lY, j[n 1]+ Si, j
k,l
Li, j n= eL Li, j[n 1]+VL wi, j,k,lYi, j[n 1]
k,l
Ui, j n= F, j[n](1+ Li, j[n])
(1)
(2)
(3)
(4)
T, jn= eT T, j[n 1]+VTY, j[n 1]
(5)
Trong các phương trình này, Si,j là kích thích đầu vào như là mức xám chuẩn
hóa của các điểm ảnh tại vị trí (i,j), Fi,j[n] là đầu vào phản hồi của nơ ron tại vị trí
(i,j) và Li,j[n] là số hạng liên kết. Ui,j[n] là phần tử kích hoạt bên trong nơ ron và -
Ti,j[n] là ngưỡng động. Yi,j[n] là giá trị xung đầu ra của nơ ron và nhận một trong
hai giá trị không hoặc một. Kích thích đầu vào (cường độ xám điểm ảnh) được
nhận bởi phần tử cung cấp, phần tử kích hoạt bên trong tổ hợp phần tử cung cấp
với phần tử liên kết. Giá trị của phần tử kích hoạt bên trong được so sánh với
ngưỡng động, ngưỡng động này giảm dần qua mỗi vòng lặp. Phần tử kích hoạt bên
trong tích lũy các tín hiệu cho đến khi nó vượt qua ngưỡng động để kích hoạt mở
phần tử đầu ra và sau đó ngưỡng động tăng đồng thời một cách mạnh mẽ. Giá trị
đầu ra của nơ ron sau đó theo vòng lặp cấp lại cho các phần tử liên kết và ngưỡng
động với độ trễ một vòng lặp.
Các kết nối tương kết M và W được biểu diễn bởi các ma trận hằng số trọng số
tiếp hợp cho các đầu vào cung cấp và đầu vào liên kết tương ứng phụ thuộc vào
khoảng cách giữa các nơron. Nói chung, M và W (thường thì M = W) tham chiếu
tới các hàm trọng số gauss. β là hệ số liên kết. αF , αL và αT là các hằng số suy
giảm thời gian của các phần tử Fi,j[n], Li,j[n] và Ti,j[n] tương ứng. VF, VL và VT
biểu thị điện thế vốn có của các phần tử Fi,j[n], Li,j[n] và Ti,j[n].
2.2. Phát hiện thay đổi trên ảnh vệ tinh bằng mạng ron PCNN
Ứng dụng mạng nơ ron PCNN để phát hiện thay đổi trên ảnh đa thời gian được
tiến hành bằng cách đo sự giống nhau giữa hai tín hiệu trích xuất từ ảnh thời gian
trước I1 và ảnh thời gian sau I2. Phương trình (7) được sử dụng để chuyển đổi các
ảnh xung của các vòng lặp PCNN về một véc tơ thông tin cho một ảnh và gọi là
88
Đ. K. Hoài, Đ. D. Điệp, “Phát hiện sự thay đổi bề mặt địa hình… mạng ron xung kép.