Là một người nuôi chim, tôi nghe nói rằng nếu bạn chú ý cẩn thận đến những chiếc lông trên đầu chim gõ kiến đã từng tiếp xúc, bạn có thể bắt đầu nhận ra từng con chim. Điều này hấp dẫn tôi. Tôi thậm chí đã đi xa đến mức thử phác thảo những con chim từ dữ liệu của riêng mình và thấy rằng nhận định trên là đúng.
Với công việc là một nhà khoa học máy tính, tôi biết rằng các nhà nghiên cứu khác đã sử dụng các kỹ thuật máy học để nhận dạng từng khuôn mặt trong ảnh kỹ thuật số với độ chính xác cao.
Những dự án này khiến tôi suy nghĩ về cách kết hợp sở thích của mình với công việc hàng ngày. Có thể áp dụng những kỹ thuật đó để xác định từng con chim hay không?
Vì vậy, tôi đã xây dựng một công cụ để thu thập dữ liệu về những con chim gõ kiến được yêu thích và một camera được kích hoạt khi phát hiện chuyển động. Tôi thiết lập trạm giám sát của mình ở sân nhà tại ngoại ô Virginia và chờ đợi những con chim xuất hiện.
Phân loại hình ảnh
Phân loại hình ảnh là một chủ đề nóng trong thế giới công nghệ. Các công ty lớn như Facebook, Apple và Google đang tích cực nghiên cứu vấn đề này để cung cấp các dịch vụ như tìm kiếm trực quan, tự động gắn thẻ bạn bè trong các bài đăng trên phương tiện truyền thông xã hội và khả năng sử dụng khuôn mặt của bạn để mở khóa điện thoại di động. Các cơ quan thực thi pháp luật cũng rất quan tâm, chủ yếu để nhận diện khuôn mặt trong hình ảnh kỹ thuật số.
Khi tôi bắt đầu làm việc với các sinh viên của mình trong dự án này, nghiên cứu phân loại hình ảnh tập trung vào một kỹ thuật xem xét các đặc điểm hình ảnh như các cạnh, góc và các khu vực có màu tương tự. Đây thường là những mảnh có thể được lắp ráp thành một số đối tượng dễ nhận biết. Những cách tiếp cận này chính xác khoảng 70% - nó sử dụng các bộ dữ liệu điểm chuẩn với hàng trăm danh mục và hàng chục ngàn ví dụ để đào tạo cho công cụ.
Nghiên cứu gần đây đã chuyển sang sử dụng các mạng lưới thần kinh nhân tạo, việc xác định các tính năng riêng đã được chứng minh là hữu ích trong việc phân loại chính xác. Mạng lưới thần kinh được mô hình hóa dựa trên mô hình giao tiếp giữa các tế bào trong não người. Mạng lưới thần kinh chuyển đổi, loại mà chúng ta hiện đang sử dụng trong công việc với chim, được sửa đổi theo cách được mô hình hóa trên vỏ não thị giác. Điều đó làm cho chúng đặc biệt phù hợp cho các vấn đề phân loại hình ảnh.
Một số nhà nghiên cứu khác đã thử các kỹ thuật tương tự trên động vật. Tôi được truyền cảm hứng một phần bởi nhà khoa học máy tính Andrea Danyluk của Williams College, người đã sử dụng máy học để xác định cá thể kỳ nhông riêng biệt.
Tiến bộ về ID chim
Trong khi các sinh viên và tôi không có nhiều hình ảnh để làm việc như hết các nhà nghiên cứu và công ty khác. Chính hạn chế này buộc chúng tôi phải nghĩ cách tăng độ chính xác trong phân loại.
Các hình ảnh của chúng tôi được chụp từ cùng một góc độ, cùng tỷ lệ. Tất cả hình ảnh cho thấy chỉ có khoảng 15 con từng ghé qua khu vực đặt camera nghiên cứu của chúng tôi. Trong số đó, chỉ có 10 con ghé thăm thường xuyên đủ để thu thập dữ liệu dùng đào tạo công cụ phân loại.
Xác định các con chim trong hình ảnh là một ví dụ về một nhiệm vụ phân loại chi tiết tinh tế, có nghĩa là thuật toán cố phân biệt giữa các đối tượng chỉ khác nhau một chút. Ví dụ, nhiều loài chim xuất hiện có hình dạng gần giống nhau, vì vậy việc nói lên sự khác biệt giữa loài này và loài khác có thể khá khó khăn, ngay cả đối với những người quan sát có kinh nghiệm.
Thử thách chỉ tăng lên khi bạn cố gắng xác định các cá nhân. Chim gõ kiến mà tôi quan tâm có bộ lông có hoa văn mạnh mẽ nhưng phần lớn vẫn giống nhau từ cá thể này đến cá thể khác.
Vì vậy, một trong những thách thức lớn nhất của chúng tôi là ghi nhãn dữ liệu để huấn luyện bộ phân loại của mình. Tôi thấy rằng lông đầu của chim gõ kiến là một cách đáng tin cậy để phân biệt giữa các cá thể, bởi vì những chiếc lông đó di chuyển xung quanh rất nhiều. Chúng được sử dụng bởi những con chim để thể hiện sự cáu kỉnh hoặc báo động.
Cuối cùng, chúng tôi đã có 2.450 bức ảnh của 8 con chim gõ kiến khác nhau. Khi xác định được chim gõ kiến riêng lẻ, các thí nghiệm của chúng tôi đã đạt được độ chính xác 97%. Tất nhiên, kết quả này cần được kiểm tra thêm.
Nghiên cứu này giúp ích gì cho loài chim?
Các nhà nghiên cứu về loài chim cần dữ liệu chính xác về cách quần thể chim thay đổi theo thời gian. Vì nhiều loài rất đặc biệt trong nhu cầu môi trường sống của chúng khi sinh sản, trú đông và di cư, dữ liệu chi tiết có thể hữu ích để các nhà khoa học đánh giá sự thay đổi trong các quần thể này.
Dữ liệu về các loài riêng lẻ như chim gõ kiến sương mù có thể được khớp với các thông tin khác, chẳng hạn như bản đồ sử dụng đất, mô hình thời tiết, tăng trưởng dân số v.v… để hiểu rõ hơn về sự biến đổi của một loài động vật địa phương theo thời gian.
Tôi tin rằng một trạm theo dõi bán tự động là trong tầm tay với chi phí khiêm tốn. Trạm giám sát của tôi có giá khoảng 500 USD. Các nghiên cứu gần đây cho thấy rằng có thể đào tạo một bộ phân loại bằng cách sử dụng một nhóm hình ảnh rộng hơn nhiều, sau đó tinh chỉnh nó một cách nhanh chóng với nhu cầu tính toán hợp lý để nhận ra từng con chim.
(Nội dung được lược dịch từ bài viết của các nhà khoa học đăng trên Thenextweb).
Theo GenK