Chip thần kinh hiệu quả cao mới dành cho AI

Rate this post

Chip siêu tiết kiệm năng lượng

NeuRRAM, con chip mới chạy tính toán trực tiếp trong bộ nhớ và có thể chạy nhiều ứng dụng AI, được thiết kế và xây dựng bởi một nhóm các nhà nghiên cứu quốc tế. Điều làm nên sự khác biệt của con chip mới là nó thực hiện tất cả công việc với một phần nhỏ điện năng được tiêu thụ bởi các nền tảng máy tính AI cho mục đích chung.

Chip thần kinh hiệu quả cao mới cho AI -0
Một nhóm các nhà nghiên cứu thiết kế, sản xuất và thử nghiệm một con chip mới, được gọi là NeuRRAM.

Chip “thần kinh” NeuRRAM đưa AI tiến gần hơn đến khả năng chạy trên một loạt các thiết bị cạnh, không kết nối với đám mây. Điều này có nghĩa là chip có thể thực hiện bất kỳ nhiệm vụ nhận thức phức tạp nào ở bất kỳ đâu và bất kỳ lúc nào mà không cần dựa vào kết nối mạng với máy chủ tập trung. Các ứng dụng cho thiết bị này có rất nhiều ở mọi nơi trên thế giới và trong mọi khía cạnh của cuộc sống của chúng ta. Chúng bao gồm từ đồng hồ thông minh đến tai nghe thực tế ảo, tai nghe nhét tai thông minh, cảm biến nhà máy thông minh và thiết bị khám phá không gian.

Chip NeuRRAM không chỉ tiết kiệm năng lượng gấp đôi so với các chip “điện toán trong bộ nhớ” hiện đại – một loại chip lai tiên tiến chạy các phép tính trong bộ nhớ – mà còn mang lại kết quả chính xác như một chip kỹ thuật. số thông thường. Các nền tảng AI thông thường cồng kềnh hơn nhiều và thường bị hạn chế sử dụng các máy chủ dữ liệu lớn hoạt động trên đám mây. Ngoài ra, chip NeuRRAM rất linh hoạt và hỗ trợ nhiều kiến ​​trúc và mô hình mạng nơ-ron khác nhau. Do đó, con chip này có thể được sử dụng cho nhiều ứng dụng khác nhau – bao gồm nhận dạng và tái tạo hình ảnh cũng như nhận dạng giọng nói.

Hiện tại, điện toán AI vừa tốn điện vừa tốn kém về mặt tính toán. Hầu hết các ứng dụng AI trên các thiết bị cạnh liên quan đến việc di chuyển dữ liệu từ thiết bị lên đám mây, nơi AI xử lý và phân tích nó. Kết quả sau đó được chuyển trở lại thiết bị.

Điều này là cần thiết vì hầu hết các thiết bị cạnh đều chạy bằng pin và kết quả là chỉ có thể dành một lượng điện năng hạn chế cho máy tính. Bằng cách giảm mức tiêu thụ điện năng cần thiết cho suy luận AI ở rìa, chip NeuRRAM này có thể giúp tạo ra các thiết bị cạnh mạnh mẽ hơn, thông minh hơn và dễ tiếp cận hơn. Con chip mới cũng có thể giúp bảo mật dữ liệu tốt hơn, vì việc chuyển dữ liệu từ các thiết bị lên đám mây sẽ làm tăng rủi ro bảo mật.

Điểm mới với NeuRRAM là hiệu suất cực cao hiện nay đi kèm với tính linh hoạt cao cho nhiều ứng dụng AI mà hầu như không bị mất độ chính xác so với các nền tảng máy tính đa năng kỹ thuật số tiêu chuẩn. Ngoài ra, nhóm nghiên cứu cũng đảm bảo tính đến nhiều ràng buộc khác nhau trải dài từ vật lý thiết bị nhớ đến cấu trúc mạch và mạng.

Chip thần kinh hiệu quả cao mới cho AI -0
Cận cảnh chip NeuRRAM.

Hiệu suất chip

Nhóm các nhà nghiên cứu đo lường hiệu quả năng lượng của chip bằng một biện pháp được gọi là sản phẩm làm chậm năng lượng (EDP). EDP ​​kết hợp cả lượng năng lượng tiêu thụ cho bất kỳ hoạt động nào và lượng thời gian cần thiết để hoàn thành hoạt động. Bằng phép đo này, chip NeuRRAM đạt EDP thấp hơn từ 1,6 đến 2,3 lần (càng thấp càng tốt) và mật độ tính toán cao hơn từ 7 đến 13 lần so với các chip hiện đại. Ngoài ra, con chip này còn giảm 70% lỗi tái tạo hình ảnh trong các tác vụ khôi phục hình ảnh. Những kết quả này có thể so sánh với các chip kỹ thuật số hiện có thực hiện các phép tính với cùng độ chính xác bit, nhưng tiết kiệm năng lượng đáng kể.

Chìa khóa cho hiệu quả sử dụng năng lượng của NeuRRAM là phương pháp sáng tạo của nó trong việc cảm nhận kết quả đầu ra trong bộ nhớ. Đối với NeuRRAM, nhóm đã thiết kế một mạch thần kinh cảm nhận điện áp và thực hiện chuyển đổi tương tự sang kỹ thuật số theo cách tiết kiệm năng lượng. Cảm biến chế độ điện áp này có thể kích hoạt tất cả các hàng và tất cả các cột của mảng RRAM trong một chu kỳ tính toán duy nhất, cho phép độ song song lớn hơn.

Để đảm bảo rằng độ chính xác của tất cả các phép tính AI có thể được duy trì trên các kiến ​​trúc mạng nơ-ron khác nhau, nhóm kỹ thuật thiết kế phát triển một tập hợp các kỹ thuật đồng tối ưu hóa thuật toán phần cứng. Kỹ thuật này đã được xác minh trên nhiều mạng nơ-ron khác nhau bao gồm cả mạng nơ-ron tích lũy…

Là một chip AI thần kinh đa hình, NeuroRRAM thực hiện xử lý phân tán song song trên 48 lõi nơ-ron. Để đạt được tính linh hoạt cao và hiệu quả cao đồng thời, NeuRRAM hỗ trợ song song dữ liệu bằng cách ánh xạ một lớp trong mô hình mạng nơ-ron lên nhiều lõi để suy luận song song trên nhiều dữ liệu. Ngoài ra, NeuRRAM cung cấp mô hình song song bằng cách ánh xạ các lớp khác nhau của mô hình lên các lõi khác nhau và thực hiện suy luận.

Thanh Thuy

Leave a Reply

Your email address will not be published. Required fields are marked *