Cần giám sát độc tính tốt hơn và phát hiện ngôn từ kích động thù địch trên mạng xã hội
Twitter đã có rất nhiều tin tức gần đây. Từ việc tiếp quản của Musk cho đến việc sa thải hàng loạt nhân viên, nền tảng tiểu blog đã thu hút sự chú ý vì một vài lý do sai lầm. Nhưng đây không phải là lần đầu tiên Twitter và các chính sách của nó xuất hiện trên các phương tiện truyền thông. Các nền tảng truyền thông xã hội như Twitter, mặc dù đã dỡ bỏ các rào cản giao tiếp và đưa nhân loại đến gần nhau hơn, nhưng vẫn được chú ý vì là một trong những nơi sản sinh ra những lời nói độc hại và thù hận trong xã hội. Điều cấp thiết là trong bối cảnh hỗn loạn tái tổ chức, ban lãnh đạo mới của Twitter không quên tiếp tục làm cho nền tảng này trở nên an toàn hơn và đưa ra các biện pháp nghiêm ngặt hơn để chống lại việc troll.
Theo Wikipedia, troll là “những sinh vật sống ở những khu vực biệt lập trên đá, núi hoặc hang động, sống cùng nhau trong các đơn vị gia đình nhỏ và hiếm khi hữu ích cho con người”. Đúng như định nghĩa, thông qua nỗ lực cố ý làm tổn thương người khác, những kẻ troll đã thành thạo nghệ thuật kiềm chế tiếng nói và quan điểm của mọi người theo cách chưa từng có.
Trước đây, Facebook, Twitter và các nền tảng kỹ thuật số khác đã sử dụng trí tuệ nhân tạo và thuật toán học máy để phát hiện ngôn từ độc hại và kích động thù địch trên nền tảng của họ. Công ty con của Google Jigsaw cũng đã xây dựng một công cụ mã nguồn mở có tên là Perspective API cho mục đích này. Nhưng không phải mọi thứ đều để công nghệ giải quyết. Mỗi công ty trong số này sử dụng kết hợp người điều hành con người và thuật toán bằng nhiều ngôn ngữ để giải quyết vấn đề trên toàn cầu. Các tweet hoặc bài đăng gây kích động trên Facebook được sử dụng để đào tạo các mô hình học máy bằng cách phân loại chúng và sử dụng chúng để đào tạo một mô hình dự đoán. Chất lượng của một mô hình có mối tương quan chặt chẽ với lượng dữ liệu được sử dụng để đào tạo nó. Đương nhiên, phần lớn dữ liệu bằng tiếng Anh, tiếp theo là các ngôn ngữ khác hiện đang được sử dụng để đào tạo người mẫu.
Ngay cả khi có các biện pháp kiểm soát như vậy, lời nói độc hại vẫn lọt vào phần bình luận hoặc tin nhắn cá nhân. Đặc biệt là ở những nơi như Ấn Độ với 28 tiểu bang và 1,3 tỷ dân số nói 121 ngôn ngữ và 1300 phương ngữ, một thuật toán phát hiện ngôn từ kích động thù địch chung chung sẽ không hoạt động. Thay vì nhắm mục tiêu các ngôn ngữ được sử dụng nhiều nhất trên thế giới, các nhóm khoa học dữ liệu trong các công ty nói trên nên nhắm mục tiêu vào ‘các khu vực có vấn đề’, nơi tạo ra hầu hết các loài troll và sau đó tìm ra tất cả các ngôn ngữ và/hoặc phương ngữ của chúng để đào tạo các mô hình nhằm đạt được kết quả tốt nhất. Nói thì dễ hơn làm vì sự tinh tế trong ngôn ngữ cụ thể của địa phương đặt ra một thách thức lớn nhưng đây là cách duy nhất để có tác động toàn cầu.
Do đó, việc sử dụng AI khiến người ta hy vọng về một tương lai tươi sáng hơn và không độc hại nhưng sẽ còn là một hành trình dài trước khi người ta có thể thấy được việc loại bỏ hoàn toàn hiểm họa được gọi là trolling này, từ những nơi xa xôi nhất trên thế giới.
Mới giao dịch? Hãy thử bot giao dịch tiền điện tử hoặc sao chép giao dịch trên các sàn giao dịch tiền điện tử tốt nhất