Dùng AI để phát hiện hình ảnh gian lận trong bản thảo khoa học

Năm 2016, một phân tích thủ công trên khoảng 20.000 bài báo y sinh do nhà vi sinh vật học Elisabeth Bik thực hiện cho thấy có tới 4% các bài báo khoa học có thể chứa các hình ảnh sao chép/chỉnh sửa với mục đích gian lận. Thông thường, chỉ khoảng 1% số bài báo khoa học được đính chính nội dung sau khi đã xuất bản, và số bài báo bị rút lại còn ít hơn nhiều. Có nghĩa là rất nhiều bài báo sử dụng hình ảnh sao chép hoặc chỉnh sửa để gian lận hoặc ngụy tạo dữ liệu vẫn đang được lưu hành.

Có nhiều nhóm đang phát triển các phần mềm trí tuệ nhân tạo (AI) sàng lọc hình ảnh, và nhiều nhà xuất bản bắt đầu quan tâm hơn đến công nghệ này, nhưng nhìn chung đây vẫn là một công nghệ mới và gây nhiều tranh luận trong lĩnh vực xuất bản.

“Tôi biết khoảng 20 người đang phát triển phần mềm kiểm tra hình ảnh," Mike Rossner, người điều hành công ty tư vấn Image Data Integrity ở San Francisco, California, cho biết. Năm ngoái, các nhà xuất bản đã cùng thành lập một nhóm làm việc để thiết lập các tiêu chuẩn sàng lọc hình ảnh trong báo cáo khoa học. Nhóm này đã ban hành hướng dẫn về cách biên tập viên nên xử lý các bài báo có hình ảnh đã được chỉnh sửa, nhưng chưa đưa ra các hướng dẫn về phần mềm sàng lọc hình ảnh.

Phần mềm AI phát hiện các hình ảnh trùng lặp trong các bài nghiên cứu có thể hoạt động nhanh hơn và ở quy mô lớn hơn so với cách kiểm tra thủ công - nhưng vẫn cần sự giám sát của biên tập viên.

American Association for Cancer Research (AACR) là một trong những tổ chức đầu tiên áp dụng công nghệ rà soát này từ tháng 1/2021. AACR đã thử nhiều sản phẩm phần mềm trước khi chuyển sang sử dụng dịch vụ của Proofig, một công ty ở Rehovot, Israel và rất hài lòng phần mềm này.

Từ tháng 7, American Society for Clinical Investigation cũng đã bắt đầu sử dụng phần mềm của Proofig để rà soát các bản thảo gửi về tạp chí Journal of Clinical Investigation (JCI) và JCI Insight. Còn Nhà xuất bản SAGE bắt đầu sử dụng Proofig từ tháng 10 để rà soát năm tạp chí về khoa học sự sống của họ.

Phần mềm của Proofig trích xuất hình ảnh từ các bản thảo và so sánh chúng theo từng cặp để tìm ra các đặc điểm chung, hoặc trùng lặp một phần. Trung bình mất từ 1 đến 2 phút để phần mềm rà soát xong một bài báo, Dror Kolodkin-Gal, người sáng lập công ty, cho biết. Phần mềm cũng có thể khắc phục các vấn đề phức tạp như các file dữ liệu thô có dung lượng lớn được nén thành các tệp nhỏ hơn. “Máy tính có lợi thế hơn so với con người. Máy tính không bị mệt mỏi và chạy nhanh hơn nhiều, và không bị đánh lừa bởi các thao tác chỉnh sửa kích thước, vị trí, hướng, xếp chồng, sao chép một phần hay kết hợp tất cả thao tác này," Kolodkin-Gal nói.

Ví dụ này cho thấy cách phần mềm của Proofig so sánh các phần của hình ảnh (nằm trong các hình chữ nhật màu đỏ) và phát hiện các phần giống hệt nhau ngay cả khi hình ảnh đã được kéo giãn hoặc xoay chiều. Các đường màu xanh lam cho thấy rằng AI nhìn thấy hàng trăm điểm giống hệt nhau.

Tuy nhiên, chi phí phần mềm kiểm tra hình ảnh cao hơn nhiều so với phần mềm kiểm tra đạo văn (kiểm tra đạo văn có giá dưới 1 USD cho mỗi bài báo). Kolodkin-Gal nói rằng hợp đồng của họ với các nhà xuất bản có xu hướng tính phí dựa trên số lượng hình ảnh trong một bản thảo, nhưng cũng phụ thuộc vào khối lượng bản thảo. Nhìn chung chi phí rơi vào khoảng vài chục USD cho một bài báo.

Tại JCI, tổng biên tập Sarah Jackson cho biết Proofig phát hiện ra nhiều vấn đề hơn so với các nhân viên đánh giá thủ công trước đây. Nhưng nhân viên vẫn cần phải kiểm tra đầu ra của Proofig, và điều quan trọng là tạp chí phải có một hệ thống quy trình để giải quyết các hình ảnh đáng ngờ. “Dữ liệu đáng tin cậylà đặc trưng cho các tạp chí của chúng tôi. Và chúng tôi đã quyết định công nghệ này xứng đáng đầu tư thời gian và tiền bạc,” Jackson nói. Tại AACR, Daniel Evanko, giám đốc điều hành, cho biết cho biết nhiều tác giả rất vui vì phần mềm giúp phát hiện các lỗi hình ảnh trùng lặp trước khi được xuất bản.

Trong khi đó, nhà xuất bản Frontiers, ở Lausanne, Thụy Sĩ, phát triển phần mềm kiểm tra hình ảnh của riêng họ. Phần mềm này là một cấu phần trong hệ thống kiểm tra tự động có tên AIRA (Artificial Intelligence Review Assistant) của Frontiers. Người phát ngôn Frontiers cho biết, từ tháng 8/2020, AIRA đã được sử dụng để kiểm tra hình ảnh trên tất cả các bản thảo. Phần lớn các bản thảo mà phần mềm coi là khả nghi không thực sự có vấn đề, chỉ có khoảng 10% trong số đó cần theo dõi thêm.

Vẫn cần các biên tập viên chuyên nghiệp để quyết định phải làm gì khi phần mềm phát hiện hình ảnh khả nghi vì có thể hình ảnh được cố tình lặp lại với các mục đích khác nhau chứ không phải gian lận hay ngụy tạo. Và một số hình ảnh trùng lặp có thể do lỗi copy/paste trong quá trình viết bản thảo. Nhưng nhìn chung, giờ đây AI đang trở thành công cụ hiệu quả để hỗ trợ biên tập viên kiểm tra hình ảnh, giống như việc sử dụng phần mềm kiểm tra đạo văn đã trở thành thông lệ từ một thập kỷ trước.

Các nhà xuất bản như PLOS, Elsevier, Springer Nature cho biết đều quan tâm đến công nghệ AI sàng lọc hình ảnh và đang thử nghiệm/tìm kiếm các phần mềm phù hợp.

Nguồn: https://www.nature.com/articles/d41586-021-03807-6

Nguồn: Khoa học và Phát triển