AI tạo ra những bức ảnh chỉ trong vài giây - điều kỳ diệu và nguy hiểm

Rate this post

Những AI như Dall-E hay Midjourney giúp “sản xuất” ra những bức ảnh tức thì với độ trung thực cao khiến cộng đồng thích thú nhưng các chuyên gia lại lo lắng.

Hai bức ảnh do Dall-E tạo ra dựa trên mô tả.

“Ớt chuông đỏ và vàng trong chiếc bát hình bông hoa trên thảm xanh”, hay “Một người phụ nữ mặc áo choàng đỏ nhìn lên bầu trời đứng giữa Quảng trường Thời đại” là những miêu tả cho hai hình ảnh trên. Nếu xuất hiện trên mạng, nhiều người cho rằng bức ảnh do ai đó chụp ngoài đời.

Kể từ khi OpenAI ra mắt Dall-E 2 vào tháng 4, cộng đồng đã rất hào hứng, thậm chí giật mình khi công cụ này tạo ra hàng loạt hình ảnh với độ chân thực đến khó tin. OpenAI là phòng thí nghiệm trí tuệ nhân tạo với sự tham gia của các chuyên gia công nghệ nổi tiếng, trong đó có Elon Musk. Tuy nhiên, sự ra đời của Dall-E cũng tạo ra nhiều tranh cãi.

Năm tháng sau khi Dall-E 2 được công bố, đã có 1,5 triệu người dùng trên nền tảng này và tạo ra hơn hai triệu bức ảnh mỗi ngày. Khi mới ra mắt, OpenAI giới hạn số lượng người tham gia nhưng giờ đây ai cũng có thể trải nghiệm.

Sự ra đời của Dall-E 2 cũng khiến trào lưu chuyển văn bản thành hình ảnh bùng nổ. Google và Meta tiết lộ rằng họ đã phát triển các hệ thống tương tự nhưng chưa sẵn sàng giới thiệu chúng với công chúng. Trong khi đó, các công ty khởi nghiệp về AI đã nhanh chóng cung cấp các công cụ cho người dùng, bao gồm Stable Diffusion và Midjourney – AI đã gây tranh cãi vào tháng 8 khi giành chiến thắng trong một cuộc thi nghệ thuật.

Sự kỳ diệu của những bức ảnh từ AI

Abran Maldonado là một nghệ sĩ AI có trụ sở tại New Jersey. Người báo cáo Bưu điện Washington đã gặp Maldonado và yêu cầu anh ta chứng minh khả năng của công cụ AI mới. Maldonado ra lệnh cho Dall-E tạo một bức ảnh với chú thích: “Những người biểu tình bên ngoài tòa nhà Capitol vào ngày 6/1/2021 theo phong cách AP“.

“Ôi trời ơi, AI này sẽ khiến tôi bị sa thải”, phóng viên thốt lên kèm theo một tràng cười sảng khoái.

Bốn bức ảnh do Dall-E tạo ra theo đơn đặt hàng của Maldonado.

Dall-E đã tạo ra bốn phiên bản của hình ảnh theo yêu cầu. Ba trong số đó không đủ thuyết phục: Khuôn mặt của những người biểu tình bị biến dạng, chữ viết trên bảng đen nguệch ngoạc không có nội dung. Nhưng bức ảnh thứ tư thì khác. “Nó có thể được sử dụng cho những bài báo rất thuyết phục. Thật không thể tin được”, phóng viên bình luận.

Một kỹ sư của Google trước đó đã đánh giá AI chatbot LaMDA là có “nhận thức của một đứa trẻ” vào tháng 6, làm dấy lên một cuộc tranh luận lớn về nguy cơ một ngày nào đó robot sẽ chiếm lĩnh thế giới. Bỏ một tương lai xa như vậy sang một bên, những tiến bộ gần đây trong AI đã tạo ra vô số tác phẩm sâu sắc với khả năng hoán đổi hoặc ghép khuôn mặt vào những bức ảnh / video sống động như thật.

Cả deepfakes và chương trình tạo hình ảnh từ văn bản đều dựa trên một phương pháp đào tạo AI được gọi là học sâu. Tuy nhiên, những công cụ như Dall-E tiên tiến hơn khi chúng có thể tạo ra những hình ảnh khó phân biệt với thực tế thông qua một đoạn văn bản mô tả ngắn.

Những AI mới với các tính năng được cải tiến hàng ngày đang gây ra nhiều lo ngại. Các chuyên gia cho biết những hệ thống này có thể tạo ra hàng loạt bức ảnh và gây hại, chẳng hạn như định kiến về chủng tộc và giới tính, đạo văn, đạo văn, … Có thể sử dụng ảnh giả. dùng để kích động, uy hiếp, quấy rối hoặc tung tin gây hoang mang trong cộng đồng.

Giáo sư Wael Abd-Almageed của Đại học Nam California cho biết: “Một khi ranh giới giữa thật và giả bị xóa nhòa, mọi thứ đều trở thành giả. Chúng ta sẽ không thể tin vào bất cứ điều gì trong cuộc sống này”. kiểm tra lại.

Theo một đại diện của OpenAI, công cụ Dall-E đang cố gắng đẩy lùi những lo ngại đó. Ví dụ: để ngăn công cụ tạo ra thông tin sai lệch, OpenAI cấm hình ảnh của những người nổi tiếng hoặc chính trị gia.

Sam Altman, Giám đốc điều hành của OpenAI cho biết: “Với AI, bạn phải để nó học hỏi từ việc tiếp xúc với thực tế, thông qua những gì người dùng làm với nó và cách nó vượt qua giới hạn của nó”.

Tuy nhiên, những AI khác lại không như vậy. Nhiều công ty khác đã mở mã nguồn của các công cụ để bất kỳ ai cũng có thể sao chép và tạo ra mà không cần kiểm soát. “Câu hỏi đặt ra là, các công cụ như OpenAI có mang lại nhiều lợi ích hơn là bất lợi không?” Giáo sư Hany Farid của UC Berkeley cho biết. “Chúng ta không còn ở thời kỳ đầu của Internet nữa. Sẽ rất khó để biết điều gì sẽ xảy ra.”

Cố gắng kiểm soát

Vào tháng 2, OpenAI đã mời một “đội cờ đỏ” gồm 25 nhà nghiên cứu từ các nhà lãnh đạo trong ngành để kiểm tra các sai sót của Dall-E. Nội dung sau đó được công khai trên GitHub.

Trong số những lo ngại lớn nhất của mình, nhóm nghiên cứu nhận thấy Dall-E có thể được sử dụng để tạo nội dung quấy rối, bắt nạt và bóc lột có chủ đích. Để tránh điều này, nhóm đã khuyến nghị OpenAI loại bỏ khả năng sử dụng Dall-E để tạo hoặc tải lên hình ảnh khuôn mặt thực tế.

OpenAI sau đó đã xây dựng các bộ lọc, khối và hệ thống gắn cờ vào AI của nó. Ví dụ: một cảnh báo sẽ được bật nếu người dùng nhập tên của một chính trị gia nổi tiếng của Mỹ hoặc thế giới. Tuy nhiên, công ty đã từ chối yêu cầu của “đội cờ đỏ” là không tạo khuôn mặt thật từ những bức ảnh có sẵn từ trước, vì làm như vậy sẽ không thể kiểm soát được các tính năng chưa được khám phá.

Theo một thông báo vào tháng 6, OpenAI tự tin vào khả năng can thiệp nếu mọi thứ không diễn ra như mong đợi. Tuy nhiên, họ khuyến cáo người dùng không nên chia sẻ những bức ảnh đã tạo trên các nền tảng xã hội để giảm rủi ro có thể xảy ra.

Maldonado ủng hộ việc hạn chế sử dụng khuôn mặt thật trên Dall-E để tránh việc chúng bị lợi dụng cho mục đích xấu hoặc gây hiểu lầm. Anh cho biết anh đã kiến nghị với OpenAI về việc này nhưng không được chấp thuận.

Một ứng dụng tạo mô tả nổi tiếng khác là Midjourney. Trên Discord, nhóm hiện thu hút hơn hai triệu thành viên. Tuy nhiên, nền tảng này hiện cũng đang bị lạm dụng để tạo ra các nội dung bạo lực, khủng bố, khiêu dâm… CEO David Holz của Midjourney thừa nhận những vấn đề đang xảy ra và đang cố gắng ngăn chặn. Công ty hiện có hơn 40 nhân viên và đang thuê thêm các dịch vụ của bên thứ ba để kiểm soát nội dung.

Bảo Lâm (theo Bưu điện Washington)

Post Views: 131