Phần mềm này không xác nhận chắc chắn một bài báo có phải là giả mạo hay không mà chỉ gắn cờ các bài báo đáng ngờ.

Hình minh họa.
Papermill Alarm sử dụng thuật toán học sâu để so sánh ngôn ngữ trong các tiêu đề và bản tóm tắt bản thảo với ngôn ngữ trong các bài báo bịa đặt được “xử lý” để đặt hàng.
Cơ sở dữ liệu được sử dụng để so sánh là danh sách các bài báo được phát hiện là bịa đặt bởi các “nhà máy giấy”. Danh sách này được biên soạn bởi các nhà nghiên cứu liêm chính trong học thuật, bao gồm Elisabeth Bik và David Bimler. Papermill Alarm sẽ gán cờ đỏ cho các bản thảo có nhiều điểm tương đồng với các bài giả mạo, cờ cam cho những bài có một số điểm tương đồng, và cờ xanh cho các bản thảo “sạch”.
Adam Day, giám đốc công ty dịch vụ dữ liệu học thuật Clear Skies có trụ sở tại London, công ty phát triển Papermill Alarm, cho biết phần mềm này đã phát hiện khoảng 1% bài báo trong cơ sở dữ liệu trích dẫn PubMed có nội dung tương tự. Các bài báo đến từ nhà máy giấy.
Nhiều nhà xuất bản đã sử dụng phần mềm và các phương pháp khác để phát hiện các bài báo gian lận và giả mạo. Ví dụ: một số hệ thống xử lý bản thảo có thể phát hiện và gắn cờ nếu nhiều bài nộp đến từ cùng một máy tính – một dấu hiệu cho thấy một cá nhân hoặc tổ chức đang đứng sau một lượng lớn nghiên cứu. . Nhưng cách tiếp cận của Day để phân tích văn bản là mới.
Sáu nhà xuất bản đã bày tỏ sự quan tâm đến việc sử dụng Papermill Alarm để sàng lọc bản thảo.
Cho đến nay, có rất ít ước tính về mức độ phổ biến của các bài báo giả mạo. Một báo cáo tháng 6 của Ủy ban Đạo đức Xuất bản ở Eastleigh, Vương quốc Anh, gợi ý rằng 2% các bài báo gửi đến các tạp chí đến từ các nhà máy giấy. Và những bài báo này “có nguy cơ làm quá tải quy trình biên tập của một số lượng lớn các tạp chí,” báo cáo cho biết.
Bimler cho rằng ngay cả 1% mà Day phát hiện trên PubMed là quá nhiều. “Những bài báo vụn vặt này sẽ được trích dẫn. Mọi người sử dụng chúng để củng cố những ý tưởng sai lầm của họ, thậm chí làm nền tảng cho các chương trình nghiên cứu chắc chắn đi vào ngõ cụt, ”Bimler nói thêm.
Trong khi đó, theo Bik, số lượng bài viết giả mạo thực tế trên PubMed có thể còn cao hơn, nhưng hầu hết các bài báo này không được trích dẫn hoặc có ảnh hưởng. Bik nói: “Nhưng nó làm tổn hại đến uy tín của khoa học và sự tin tưởng mà chúng ta đặt vào các tài liệu nghiên cứu.
Nguồn: